|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
|
Опции темы | Поиск в этой теме | Опции просмотра |
#1
|
|||
|
|||
Супер странный символ. str.LowerCase() не работает
Здравствуйте!
Столкнулся с проблемой приведения символа İ к нижнему регистру. LowerCase() и AnsiLowerCase() не приводят его к нижнему регистру. Та же самая проблема в PostgreSQL с lower(). А вот в PHP все нормально mb_convert_case('İ',MB_CASE_LOWER,'UTF-8') и Word его тоже нормально приводит к нижнему регистру. Что за чертовщина? |
#2
|
||||
|
||||
А этот символ İ - U+0130: Latin Capital Letter I With Dot Above? Просто её "мелкашка" U+0131: ı без точки в наборе идёт
Я не понял Вашего вопроса, но всё же Вам на него отвечу! |
#3
|
||||
|
||||
Цитата:
Не стоит путать форумы с богадельнями. © Bargest |
#4
|
|||
|
|||
Цитата:
Да https://msdn.microsoft.com/ru-ru/lib...v=vs.100).aspx "При лингвистической интерпретации нелингвистических строковых данных или при интерпретации строковых данных определенного языка и региональных параметров с использованием правил другого языка и региональных параметров могут возникать трудно и не очень трудно выявляемые ошибки. Типичный пример – проблема с турецкой буквой I. Почти во всех латинских алфавитах, включая американский английский, символ "i" (\u0069) является строчной версией символа "I" (\u0049). Это правило использования прописных и строчных букв стало само собой разумеющимся для тех, кто программирует для таких языков. Однако в турецком ("tr-TR") алфавите имеется буква "I с точкой", "İ" (\u0130), которая является прописной версией буквы "i". В турецком языке также имеется символ "i без точки", буква "ı" (\u0131), которая является строчной версией прописной буквы "I". Эта же особенность имеется и в азербайджанском языке ("az"). Следовательно, предположения о прописной "i" или строчной "I" не являются правильными для всех языков." |