На главную

On-line справка по Win32 API

Написать письмо
БЕСПЛАТНАЯ ежедневная online лотерея! Выигрывай каждый день БЕСПЛАТНО!
Список всех статей A-B-C-D-E-F-G-H-I-J-K-L-M-N-O-P-Q-R-S-T-U-V-W-X-Y-Z | Скачать Вниз

IsTextUnicode



The IsTextUnicode function determines whether a buffer probably contains a form of Unicode text. The function uses various statistical and deterministic methods to make its determination, under the control of flags passed via lpi. When the function returns, the results of such tests are reported via lpi. If all specified tests are passed, the function returns TRUE; otherwise, it returns FALSE.

DWORD IsTextUnicode(

CONST LPVOID lpBuffer, // pointer to an input buffer to be examined
int cb, // the size in bytes of the input buffer
LPINT lpi // pointer to flags that condition text examination and receive results
);


Parameters

lpBuffer

Pointer to the input buffer to be examined.

cb

Specifies the size, in bytes, of the input buffer pointed to by lpBuffer.

lpi

Pointer to an int that, upon entry to the function, contains a set of flags that specify the tests to be applied to the input buffer text. Upon exit from the function, that same int contains a set of bit flags indicating the results of the specified tests: 1 if the contents of the buffer pass a test, 0 for failure. Only flags that are set upon entry to the function are significant upon exit.

If lpi is NULL, the function uses all available tests to determine whether the data in the buffer is probably Unicode text.
Here are the constants used with *lpi's bit flags:

Value Meaning
IS_TEXT_UNICODE_ASCII16 The text is Unicode, and contains nothing but zero-extended ASCII values/characters.
IS_TEXT_UNICODE_REVERSE_ASCII16 Same as the preceding, except that the Unicode text is byte-reversed.
IS_TEXT_UNICODE_STATISTICS The text is probably Unicode, with the determination made by applying statistical analysis. Absolute certainty is not guaranteed. See the note in the following Remarks section.
IS_TEXT_UNICODE_REVERSE_STATISTICS Same as the preceding, except that the probably-Unicode text is byte-reversed.
IS_TEXT_UNICODE_CONTROLS The text contains Unicode representations of one or more of these non-printing characters: RETURN, LINEFEED, SPACE, CJK_SPACE, TAB.
IS_TEXT_UNICODE_REVERSE_CONTROLS Same as the preceding, except that the Unicode characters are byte-reversed.
IS_TEXT_UNICODE_BUFFER_TOO_SMALL There are too few characters in the buffer for meaningful analysis (fewer than two bytes).
IS_TEXT_UNICODE_SIGNATURE The text contains the Unicode byte-order mark (BOM) 0xFEFF as its first character.
IS_TEXT_UNICODE_REVERSE_SIGNATURE The text contains the Unicode byte-reversed byte-order mark (Reverse BOM) 0xFFFE as its first character.
IS_TEXT_UNICODE_ILLEGAL_CHARS The text contains one of these Unicode-illegal characters: embedded Reverse BOM, UNICODE_NUL, CRLF (packed into one WORD), or 0xFFFF.
IS_TEXT_UNICODE_ODD_LENGTH The number of characters in the string is odd. A string of odd length cannot (by definition) be Unicode text.
IS_TEXT_UNICODE_NULL_BYTES The text contains null bytes, which indicate non-ASCII text.
IS_TEXT_UNICODE_UNICODE_MASK This flag constant is a combination of IS_TEXT_UNICODE_ASCII16, IS_TEXT_UNICODE_STATISTICS, IS_TEXT_UNICODE_CONTROLS, IS_TEXT_UNICODE_SIGNATURE.
IS_TEXT_UNICODE_REVERSE_MASK This flag constant is a combination of IS_TEXT_UNICODE_REVERSE_ASCII16, IS_TEXT_UNICODE_REVERSE_STATISTICS, IS_TEXT_UNICODE_REVERSE_CONTROLS, IS_TEXT_UNICODE_REVERSE_SIGNATURE.
IS_TEXT_UNICODE_NOT_UNICODE_MASK This flag constant is a combination of IS_TEXT_UNICODE_ILLEGAL_CHARS, IS_TEXT_UNICODE_ODD_LENGTH, and two currently unused bit flags.
IS_TEXT_UNICODE_NOT_ASCII_MASK This flag constant is a combination of IS_TEXT_UNICODE_NULL_BYTES and three currently unused bit flags.


Return Values

The function returns nonzero if the data in the buffer passes the specified tests.
The function returns zero if the data in the buffer does not pass the specified tests.
In either case, the int pointed to by lpi contains the results of the specific tests the function applied to make its determination.

Remarks

As noted in the preceding table of flag constants, the IS_TEXT_UNICODE_STATISTICS and IS_TEXT_UNICODE_REVERSE_STATISTICS tests use statistical analysis. These tests are not foolproof. The statistical tests assume certain amounts of variation between low and high bytes in a string, and some ASCII strings can slip through. For example, if lpBuffer points to the ASCII string 0x41, 0x0A, 0x0D, 0x1D (A\n\r^Z), the string passes the IS_TEXT_UNICODE_STATISTICS test, though failure would be preferable.


Пригласи друзей и счет твоего мобильника всегда будет положительным!
Предыдущая статья
 
Сайт Народ.Ру Интернет
Следующая статья
Пригласи друзей и счет твоего мобильника всегда будет положительным!

IsTextUnicode



Функция IsTextUnicode определяет вероятно содержит буфер форму текста Уникода. Функция использует различные статистические и детерминированные методы, чтобы принимать свое решение, под управлением флагами пройденным через lpi. Когда функция возвращается, результаты таких тестов сообщены через lpi. Если все определенные тесты пройдены, функция возвращает ИСТИНУ; в противном случае, это возвращает ЛОЖЬ.

DWORD IsTextUnicode(

CONST LPVOID lpBuffer, // УКАЗАТЕЛЬ в входной буфер, чтобы быть изученн int cb, // размер в байтах входного буфера LPINT lpi // указатель на флаги, который оценивает текстовые результаты обследования и приемника
);


Параметры

lpBuffer

Указатель в входной буфер, чтобы быть изученн.

cb

Определяет размер, в байтах, входного буфера указанного, чтобы lpBuffer.

lpi

Указатель на int, что, на входе в функцию, содержит установку флагов, которые определяют тесты, которые нужно прилагать к входному буферному тексту. На выходе из функции, что то же int содержит установку битовых флагов, указывающих результаты определенных тестов: 1 если содержание буфера передает тест, 0 для неудачи. Только флаги, что установлены на входе в функцию значимые на выходе.

Если lpi НЕДЕЙСТВИТЕЛЬНО, функция использует все доступные тесты, чтобы определяться независимо данные в буфере - текст вероятно Уникода.
Вот константы использовали *бит lpi's сигнализирует:

Значение Величины
IS_TEXT_UNICODE_ASCII16 текст является Уникодом и содержит едва расширенные нулевые величины/символы ASCII.
IS_TEXT_UNICODE_REVERSE_ASCII16 Также, как предыдущий, кроме того текст Уникода возобновлен байт.
IS_TEXT_UNICODE_STATISTICS текст является вероятно Уникодом, с определением сделанным примененным статистическим анализом. Абсолютная уверенность не гарантирована. Смотри примечание в секции Замечаний следующего.
IS_TEXT_UNICODE_REVERSE_STATISTICS Также, как предыдущий, кроме того вероятно-текст Уникода возобновлен байт.
IS_TEXT_UNICODE_CONTROLS текст содержит представительства Уникода одной или более из этой не-печати символов: ВОЗВРАТ, ПЕРЕВОД строки, ПРОСТРАНСТВО, CJK_SPACE, ТАБ..
IS_TEXT_UNICODE_REVERSE_CONTROLS Также, как предыдущий, кроме того символы Уникода возобновлены байт.
IS_TEXT_UNICODE_BUFFER_TOO_SMALL Есть слишком несколько символов в буфере для значимого анализа (меньший чем два байта).
IS_TEXT_UNICODE_SIGNATURE текст содержит отметку Уникода байтового порядка (ЗМЕЯ) 0xFEFF как первый символ.
IS_TEXT_UNICODE_REVERSE_SIGNATURE текст содержит Уникод возобновивший байтовый порядок байтовой отметки (Обратная ЗМЕЯ) 0xFFFE как первый символ.
IS_TEXT_UNICODE_ILLEGAL_CHARS текст содержит один из этих Уникод-незаконных символов: вставившее Реверс ЗМЕИ, UNICODE_NUL, CRLF (упакованное в одно СЛОВО), или 0xFFFF.
IS_TEXT_UNICODE_ODD_LENGTH количество символов в строке нечетное. Строка нечетной длины не может ( определением), быть текстом Уникода.
IS_TEXT_UNICODE_NULL_BYTES текст содержит недействительные байты, которые указывают не-текст ASCII.
IS_TEXT_UNICODE_UNICODE_MASK Этой константы флага - комбинация IS_TEXT_UNICODE_ASCII16, IS_TEXT_UNICODE_STATISTICS, IS_TEXT_UNICODE_CONTROLS, IS_TEXT_UNICODE_SIGNATURE.
IS_TEXT_UNICODE_REVERSE_MASK Этой константы флага - комбинация IS_TEXT_UNICODE_REVERSE_ASCII16, IS_TEXT_UNICODE_REVERSE_STATISTICS, IS_TEXT_UNICODE_REVERSE_CONTROLS, IS_TEXT_UNICODE_REVERSE_SIGNATURE.
IS_TEXT_UNICODE_NOT_UNICODE_MASK Этой константы флага - комбинация IS_TEXT_UNICODE_ILLEGAL_CHARS, IS_TEXT_UNICODE_ODD_LENGTH, и два к настоящему времени неиспользованных битовых флагов.
IS_TEXT_UNICODE_NOT_ASCII_MASK Этой константы флага - комбинация IS_TEXT_UNICODE_NULL_BYTES и три к настоящему времени неиспользованных битовых флагов.


Обратные Величины

Функция возвращает ненулевой если данные в буфере передает определенные тесты.
Функция возвращает нуль если данные в буфере не передает определенные тесты.
В любом случае, int заостренный, чтобы lpi содержит результатам специфических тестов функцию приложенную, чтобы принимать свое решение.

Замечания

Как отмечено в предыдущей таблице констант флага, IS_TEXT_UNICODE_STATISTICS и использование тестов IS_TEXT_UNICODE_REVERSE_STATISTICS статистического анализа. Эти тесты не являются с защитой от дурака. Статистические тесты принимают определенные суммы изменения между низкими и высокими байтами в строке, и некоторые строки ASCII могут надеть через. Например, если точки lpBuffer на строку ASCII 0x41, 0x0A, 0x0D, 0x1D (A\n\r^Z), строка передает тест IS_TEXT_UNICODE_STATISTICS, хотя неудача должна быть предпочтительной.


Вверх Version 1.3, Oct 26 2010 © 2007, 2010, mrhx Вверх
 mrhx software  Русский перевод OpenGL  Русский перевод Win32 API
 
Используются технологии uCoz