Функция CompareStringEx

Сравнивает две строки символов, используя заданный язык страны (местности).

Синтаксис

Параметры

[in] Устанавливает язык страны (местности), используемый для сравнения. Этот параметр может быть или указателем на название языка страны, или одним из нижеследующих предопределенных значений. Для получения дополнительной информации о языке страны и названия страны (местности), см. статьи Языки страны (местности).

[in] Набор флажков, которые указывают, как функция сравнивает две строки. По умолчанию, эти флажки не устанавливаются. Этот параметр может быть установлен в нуль, чтобы получить поведение по умолчанию, или это может быть любая комбинация нижеследующих значений.

Флажок	Описание
LINGUISTIC_IGNORECASE	Регистр игнорируется при поиске, как лингвистически соответствующий. Раздел статьи Замечания ниже, объясняет, чем этот флажок отличается от NORM_IGNORECASE.
LINGUISTIC_IGNOREDIACRITIC	Игнорирует несамостоятельные (без пробелов) символы, как лингвистически соответствующие. Раздел статьи Замечания ниже объясняет, чем этот флажок отличается от NORM_IGNORENONSPACE.
NORM_IGNORECASE	Игнорирует регистр. Раздел статьи Замечания ниже объясняет, чем этот флажок отличается от LINGUISTIC_IGNORECASE.
NORM_IGNOREKANATYPE	Не делает различий между символами японского языка Hiragana и Katakana. Соответствующие символы Hiragana и Katakana при сравнении считаются как одинаковые.
NORM_IGNORENONSPACE	Игнорирует несамостоятельные символы. Раздел статьи Замечания ниже объясняет, чем этот флажок отличается от LINGUISTIC_IGNOREDIACRITIC.
NORM_IGNORESYMBOLS	Игнорирует символы.
NORM_IGNOREWIDTH	Не делает различий между однобайтовым символом и тем же самым двухбайтовым символом.
NORM_LINGUISTIC_CASING	Использует лингвистические правила для регистра, а не правила файловой системы (по умолчанию). Раздел статьи Замечания ниже объясняет это более подробно.
SORT_STRINGSORT	Обрабатывает пунктуацию также, как символы.

[in] Указатель на первую сравниваемую строку.

[in] Определяет число WCHARs в строке, указанной при помощи параметра lpString1. Подсчет не включает в себя символ конца строки ("0"). Если этот параметр - какое-либо отрицательное значение, то предполагается, что строка завершается нулем, а длина вычисляется автоматически.

[in] Указатель на вторую строку, которая будет сравниваться.

[in] Указывает число WCHARs в строке, указанной при помощи параметра lpString2. Подсчет не включает в себя символ конца строки ("0"). Если этот параметр - какое-либо отрицательное значение, то предполагается, что строка завершается нулем, а длина вычисляется автоматически.

Возвращаемое значение

Если функция завершается успешно, возвращаемое значение - одно из нижеследующих именованных значений.

Чтобы поддержать соглашение времени выполнения C при сравнении строк, значение 2 может быть вычтено из возвращаемого значения отличного от нуля. Тогда значение <0, == 0 и > 0 являются совместимыми с параметрами времени выполнения программы C.

Значение	Предназначение
CSTR_LESS_THAN	Строка, указанная при помощи параметра *lpString1, по лексической оценке меньше, чем строка указанная при помощи параметра lpString2*.
CSTR_EQUAL	Строка, указанная при помощи параметра lpString1, по лексической оценке равна строке, указанной при помощи параметра lpString2. Две строки эквивалентны, чтобы сравнить целевые строки, хотя и не обязательно идентичные.
CSTR_GREATER_THAN	Строка, указанная при помощи параметра lpString1, по лексической оценке больше, чем строка, указанная при помощи параметра lpString2.
0	Если функция завершается ошибкой, возвращаемое значение - нуль. Чтобы получить дополнительную информацию об ошибке, вызовите GetLastError. GetLastError может возвратить один из нижеследующих кодов ошибки: ERROR_INVALID_FLAGS ERROR_INVALID_PARAMETER

Замечания

Эквивалентные строки

Обычно, функции CompareStringEx, CompareString, lstrcmp и lstrcmpi оценивают в строке символ за символом. Однако, у многих языков есть многосимвольные элементы, такие как двухсимвольная пара 'CH' в традиционном испанском языке. Функция CompareStringEx используя язык страны (местности) обозначает параметром lpLocaleName идентификаторы многосимвольных элементов, в то время как функции lstrcmp и lstrcmpi, используют язык страны (местности) пользователя.

Другой пример - вьетнамский язык, который содержит много двухсимвольных элементов, таких как допустимый класс прописных букв, стиль заголовка и формы нижнего регистра 'GI', которые являются 'GI', 'Gi', и 'gi' соответственно. Любая из этих форм обрабатывается как единичный элемент сопоставления и, если регистр игнорируется, сравниваются как эквивалентные. Однако, поскольку элемент 'gI' не имеет силы, как единичный элемент, функции CompareString, CompareStringEx, lstrcmp и lstrcmpi обрабатывают 'gI' как два отдельных элемента.

Напротив, функция CompareStringOrdinal, включенная в Windows Vista, выполняет строго двоичное (бинарное) сравнение: исключая вариант выбора не чувствительности к регистру, это опция игнорирует все недвоичные эквивалентности, и (в отличие от CompareString) она проверяет все точки кодирования на равенство, включая и те, которые не дают какой-либо нагрузки в лингвистических схемах сопоставления.

Оценка строк

Как правило, строки сравниваются, используя, что называется методикой "сортировки слова". При сортировке слов, все знаки препинания и другие неалфавитно-цифровые символы, за исключением дефиса и апострофа, приходят прежде какого-либо буквенно-цифрового символа. Дефис и апостроф обрабатываются по-другому, а не как другие небуквенно-цифровые символы по порядку, для того, чтобы гарантировать, что слова такие как "coop" и "co-op" остались вместе внутри отсортированного списка.

Если флажок SORT_STRINGSORT установлен, то строки сравниваются, используя то, что называется методикой "сортировки строк". При сортировке строк дефис и апостроф обрабатываются точно так же, как и любые другие небуквенно-цифровые символы. Они располагаются перед буквенно-цифровыми символами.

Нижеследующая таблица показывает список слов, отсортированных этими способами.

Сортировка слов	Сортировка строк	Сортировка слов	Сортировка строк
billet	bill's	t-ant	t-ant
bills	billet	tanya	t-aria
bill's	bills	t-aria	tanya
cannot	can't	sued	sue's
cant	cannot	sues	sued
can't	cant	sue's	sues
con	co-op	went	we're
coop	con	were	went
co-op	coop	we're	were

Функции lstrcmp и lstrcmpi используют сортировку слов. Функции CompareString, CompareStringEx, LCMapString, FindNLSString, LCMapStringEx и FindNLSStringEx по умолчанию используют сортировку слов, но если их вызывающая программа устанавливает флажок SORT_STRINGSORT, то используется сортировка строк.

Когда используются функции CompareString, lstrcmp и lstrcmpi

Когда сравнение должно следовать за персональными языковыми настройками пользователя, например, когда сортируются по порядку элементы органа управления Одноуровневого просмотрщика (ListView), сделайте одно из нижеследующего:

Когда результаты сравнения должны быть непротиворечивыми независимо от языка страны (местности), например при сравнении извлеченных данных, опираясь на предопределенный список или внутреннее значение, используется CompareStringEx. Любой из нижеследующих вызовов будет соответствовать даже тогда, когда параметр mystr - "INLAP", тогда как чувствительный к языку страны (местности) вызов функции lstrcmpi завершается ошибкой, если текущий язык страны (местности) - вьетнамский язык.

Функция CompareStringEx может возвратить данные из пользовательских языков страны (custom locales). Пользовательские языки страны дают возможность администраторам изменять любые аспекты форматов местного языка, но это не будет изменять поведение операции сравнения.

Выполнение

Функция CompareStringEx оптимизирована так, чтобы выполняться с самой высокой скоростью, когда параметр dwCmpFlags установлен в 0 или со значением NORM_IGNORECASE, а у параметров cchCount1 и cchCount2 установлены значения -(минус)1, а заданный язык страны (местности) не поддерживает какие-либо лингвистические свертки (типа того, когда в традиционном испанском языке сравнение рассматривает "ch" как единичный символ).

Заметки об особенностях языка

Флажок NORM_IGNORENONSPACE влияет только на языки стран, в которых, диакритические знаки сортируются при повтором проходе основных символов. Все символы в строке сначала сравниваются не принимая во внимание диакритические знаки и (если строки равны) при втором проходе по строкам, выполняется сравнение диакритических знаков. В этом случае, этот флажок заставляет второй проход не выполнять. Для языков, которые сортируют диакритические знаки символов при первом проходе, этот флажок не имеет никакого действия.

Для многих систем письма флажок NORM_IGNORENONSPACE совпадает с действием флажка LINGUISTIC_IGNOREDIACRITIC, а NORM_IGNORECASE совпадает с флажком LINGUISTIC_IGNORECASE. Особенно это правдиво для латинских алфавитов. Однако:

Обычно, для не чувствительного к регистру сравнения, эта функция устанавливает соответствие символов нижнего регистра "i" символам верхнего регистра "I", даже тогда, когда параметр Locale устанавливает турецкий или азербайджанский язык. Флажок NORM_LINGUISTIC_CASING не принимает во внимание это для турецкого или азербайджанского языков. Если этот флажок определяется, в соединении со значением для параметра Locale, который служит признаком турецкого или азербайджанского языка, то ЛАТИНСКАЯ СТРОЧНАЯ БУКВА БЕЗ ТОЧКИ I (U+0131) является формой нижнего регистра ЛАТИНСКОЙ ЗАГЛАВНОЙ БУКВЫ I (U+0049), а ЛАТИНСКАЯ СТРОЧНАЯ БУКВА I (U+0069), является формой нижнего регистра ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I С ТОЧКОЙ ВЫШЕ (U+0130).

Для набора двухбайтовых символов (DBCS) местных языков флажок NORM_IGNORECASE влияет на все "широкие" (двухбайтовые) символы, а также на "узкие" (однобайтовые) символы. Это включает в себя "широкие" символы греческого языка и кириллицы.

Функция CompareString в ходе сравнения игнорирует арабские кашиды. Таким образом, если две строки идентичны, содержат наличие кашид, функция CompareString возвращает значение 2; то есть строки считаются "равными" в смысле сопоставления, хотя они не обязательно идентичны.

Специфические языки страны (местности)

Пример

Пример, показывающий использование этой функции, может быть найден в статье Поддержка национальных языков (NLS): Примеры API основанных на названиях местности.

Смотри также

Обзор Строки, Функции, используемые строками, Информация о пользовательском языке страны (местности), Контроль версий сопоставления, FoldString, CompareString, CompareStringOrdinal, GetSystemDefaultLocaleName, GetUserDefaultLocaleName, IsNLSDefinedString, LCMapStringEx, FindNLSStringEx, lstrcmp, lstrcmpi

Размещение и совместимость CompareStringEx
	Windows NT Vista	Да
К	Windows XP	Нет
л	Windows 2000 Professional	Нет
и	Windows NT Workstation	Нет
е	Windows Me	Нет
н	Windows 98	Нет
т	Windows 95	Нет

С	Windows Server 2003	Нет
е	Windows 2000 Server	Нет
р	Windows NT Server	Нет
в
е
р
Используемая библиотека		Kernel32.lib
Используемая DLL		kernel32.dll
Заголовочный файл
- объявлено в		Winnls.h
- включено в		Windows.h
Unicode		Реализуются как версии Unicode и ANSI.
Замечания по платформе		Не имеется

Значение	Предназначение
LOCALE_NAME_SYSTEM_DEFAULT	Язык страны (местности) системы - значение по умолчанию.
LOCALE_NAME_USER_DEFAULT	Язык страны (местности) текущего пользователя - значение по умолчанию.