OberonCore

Библиотека  Wiki  Форум  BlackBox  Компоненты  Проекты
Текущее время: Четверг, 28 Март, 2024 17:06

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 69 ]  На страницу Пред.  1, 2, 3, 4
Автор Сообщение
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Среда, 26 Февраль, 2014 10:12 

Зарегистрирован: Вторник, 29 Август, 2006 12:32
Сообщения: 2662
Откуда: Россия, Ярославль
Прежде всего ведь понадобится изменить Language Report.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Среда, 26 Февраль, 2014 10:19 
Аватара пользователя

Зарегистрирован: Пятница, 25 Ноябрь, 2005 12:02
Сообщения: 8500
Откуда: Троицк, Москва
Пётр Кушнир писал(а):
Прежде всего ведь понадобится изменить Language Report.
Понадобится -- изменим :)


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Среда, 26 Февраль, 2014 10:24 
Аватара пользователя

Зарегистрирован: Пятница, 25 Ноябрь, 2005 12:02
Сообщения: 8500
Откуда: Троицк, Москва
Alexander Shiryaev писал(а):
Info21 писал(а):
Лично я почти созрел для того, чтобы согласиться с предложением Trurl'я насчёт уникодизации Компонентного Паскаля (т.е. разрешение уникодовых идентификаторов)
А зачем?
Давление системы образования, где нужно использовать родные языки.

Профессиональные АйТишники проецируют школу -- особенно 5-7 классы -- в нуль, а зря: hubris наказуем.

Alexander Shiryaev писал(а):
Цитата:
через UTF-8 внутри
Почему именно UTF-8? Внутри же UCS-2.
А разве не EASCII?

Alexander Shiryaev писал(а):
Info21 писал(а):
Ведь Java, вроде, разрешает уникод в идентификаторах, нет?
Java Language Specification, Lexical Structure
Спасибо.

Alexander Shiryaev писал(а):
Цитата:
При неизменной длине SHORT-литерных массивов эффективная длина идентификаторов из не-EASCII литер с применением UTF-8 уменьшится вдвое (?)
нет
Пусть не вдвое. Но уменьшится. Насколько?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Среда, 26 Февраль, 2014 11:42 

Зарегистрирован: Вторник, 29 Август, 2006 12:32
Сообщения: 2662
Откуда: Россия, Ярославль
Alexander Shiryaev писал(а):
Цитата:
через UTF-8 внутри

Почему именно UTF-8? Внутри же UCS-2.
Внутри кодовых и символьных файлов таки SHORTCHAR. Который и предлагается к замене на UTF-8.
Который умещает кирилицу в два байта, а вообще любой двухбайтный символ юникода умещает максимум в три байта utf-8, так я понимаю.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Среда, 26 Февраль, 2014 12:04 

Зарегистрирован: Суббота, 26 Ноябрь, 2005 02:12
Сообщения: 473
Откуда: KZ
Да, всё так, теперь понятно..


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Четверг, 27 Февраль, 2014 17:12 
Модератор
Аватара пользователя

Зарегистрирован: Среда, 16 Ноябрь, 2005 00:53
Сообщения: 4625
Откуда: Россия, Орёл
Info21 писал(а):
Вопрос по длине идентификаторов.
При неизменной длине SHORT-литерных массивов эффективная длина идентификаторов из не-EASCII литер с применением UTF-8 уменьшится вдвое (?).

Насколько серьезные проблемы возникнут при изменении формата внутренних SHORT-литерных массивов?
Или это уже обсуждалось? Пож., дайте ссылку, кто помнит.
При определении внешнего представления ObjFile, SymFile используются цепочки --- длина в формате не зафиксирована. Поэтому достаточно из соотв. SHORT-литерных массивов сделать обычные литерные массивы и всё. Тем более, что они в каркасе они большей частью такие и есть (например, TYPE Ident в hook(StdInterpreter.CallHook).Call.

Поэтому ограничение в DevCPS.MaxIdLen = 256 таким же и останется.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Toward Ultimate Unicode
СообщениеДобавлено: Четверг, 27 Февраль, 2014 19:21 

Зарегистрирован: Вторник, 29 Август, 2006 12:32
Сообщения: 2662
Откуда: Россия, Ярославль
Учитывая вот это http://www.unicode.org/faq/basic_q.html#14 получается, что неплохо бы заменить ещё и UCS-2 на UTF-16 прежде чем приступать к модификации компонентов и ядра.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Четверг, 27 Февраль, 2014 19:37 

Зарегистрирован: Суббота, 26 Ноябрь, 2005 02:12
Сообщения: 473
Откуда: KZ
Евгений Темиргалеев писал(а):
Поэтому достаточно из соотв. SHORT-литерных массивов сделать обычные литерные массивы и всё. Тем более, что они в каркасе они большей частью такие и есть (например, TYPE Ident в hook(StdInterpreter.CallHook).Call.

То есть изменить типы данных DevCPT.Name и DevCPT.String (ARRAY OF SHORTCHAR => ARRAY OF CHAR) ?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Юникод для идентификаторов КП
СообщениеДобавлено: Четверг, 27 Февраль, 2014 22:57 
Модератор
Аватара пользователя

Зарегистрирован: Среда, 16 Ноябрь, 2005 00:53
Сообщения: 4625
Откуда: Россия, Орёл
Alexander Shiryaev писал(а):
Евгений Темиргалеев писал(а):
Поэтому достаточно из соотв. SHORT-литерных массивов сделать обычные литерные массивы и всё. Тем более, что они в каркасе они большей частью такие и есть (например, TYPE Ident в hook(StdInterpreter.CallHook).Call.

То есть изменить типы данных DevCPT.Name и DevCPT.String (ARRAY OF SHORTCHAR => ARRAY OF CHAR) ?
В общем да, идея такая. DevCPT.Name как пример подходит. DevCPT.String = POINTER TO ARRAY OF SHORTCHAR уже в utf8 хранится, если не ошибаюсь. Там может смысла менять и не будет... сразу...

(я говорил только про то, чтобы во внутреннем представлении задействовать CHAR-цепочки, подразумевая во внешнем utf8)


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 69 ]  На страницу Пред.  1, 2, 3, 4

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Вся информация, размещаемая участниками на конференции (тексты сообщений, вложения и пр.) © 2005-2024, участники конференции «OberonCore», если специально не оговорено иное.
Администрация не несет ответственности за мнения, стиль и достоверность высказываний участников, равно как и за безопасность материалов, предоставляемых участниками во вложениях.
Без разрешения участников и ссылки на конференцию «OberonCore» любое воспроизведение и/или копирование высказываний полностью и/или по частям запрещено.
Powered by phpBB® Forum Software © phpBB Group
Русская поддержка phpBB