Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > [ "Начинающим" ]
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 09.04.2015, 19:57
execoma execoma вне форума
Прохожий
 
Регистрация: 09.04.2015
Сообщения: 2
Версия Delphi: C++ Builder XE
Репутация: 10
По умолчанию Супер странный символ. str.LowerCase() не работает

Здравствуйте!

Столкнулся с проблемой приведения символа İ к нижнему регистру. LowerCase() и AnsiLowerCase() не приводят его к нижнему регистру. Та же самая проблема в PostgreSQL с lower(). А вот в PHP все нормально mb_convert_case('İ',MB_CASE_LOWER,'UTF-8') и Word его тоже нормально приводит к нижнему регистру. Что за чертовщина?
Ответить с цитированием
  #2  
Старый 09.04.2015, 20:56
Аватар для Alegun
Alegun Alegun вне форума
LMD-DML
 
Регистрация: 12.07.2009
Адрес: Богородское
Сообщения: 3,025
Версия Delphi: D7E
Репутация: 1834
По умолчанию

А этот символ İ - U+0130: Latin Capital Letter I With Dot Above? Просто её "мелкашка" U+0131: ı без точки в наборе идёт
Ответить с цитированием
  #3  
Старый 10.04.2015, 00:01
Аватар для Freeman
Freeman Freeman вне форума
Местный
 
Регистрация: 05.10.2012
Адрес: Санкт-Петербург
Сообщения: 577
Версия Delphi: 6
Репутация: выкл
По умолчанию

Цитата:
Сообщение от Alegun
Просто её "мелкашка" U+0131: ı без точки в наборе идёт
Таки нет. Это турецкие/азербайджанские буквы И/и и Ы/ы -- İ/i и І/ı соответственно. Для них нужно ставить турецкую локаль -- turkish collation или как-то так. Ради этой буквы для турецкого предусмотрены особые правила верхнего/нижнего регистра в Unicode на уровне стандарта. Учудили, ничего не скажешь.
__________________
Не стоит путать форумы с богадельнями. © Bargest
Ответить с цитированием
  #4  
Старый 10.04.2015, 18:11
execoma execoma вне форума
Прохожий
 
Регистрация: 09.04.2015
Сообщения: 2
Версия Delphi: C++ Builder XE
Репутация: 10
По умолчанию

Цитата:
Сообщение от Freeman
Таки нет. Это турецкие/азербайджанские буквы И/и и Ы/ы -- İ/i и І/ı соответственно. Для них нужно ставить турецкую локаль -- turkish collation или как-то так. Ради этой буквы для турецкого предусмотрены особые правила верхнего/нижнего регистра в Unicode на уровне стандарта. Учудили, ничего не скажешь.

Да

https://msdn.microsoft.com/ru-ru/lib...v=vs.100).aspx

"При лингвистической интерпретации нелингвистических строковых данных или при интерпретации строковых данных определенного языка и региональных параметров с использованием правил другого языка и региональных параметров могут возникать трудно и не очень трудно выявляемые ошибки. Типичный пример – проблема с турецкой буквой I.

Почти во всех латинских алфавитах, включая американский английский, символ "i" (\u0069) является строчной версией символа "I" (\u0049). Это правило использования прописных и строчных букв стало само собой разумеющимся для тех, кто программирует для таких языков. Однако в турецком ("tr-TR") алфавите имеется буква "I с точкой", "İ" (\u0130), которая является прописной версией буквы "i". В турецком языке также имеется символ "i без точки", буква "ı" (\u0131), которая является строчной версией прописной буквы "I". Эта же особенность имеется и в азербайджанском языке ("az").

Следовательно, предположения о прописной "i" или строчной "I" не являются правильными для всех языков."
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 17:28.


 

Сайт

Форум

FAQ

RSS лента

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2023

ВКонтакте   Facebook   Twitter