OberonCore

Библиотека  Wiki  Форум  BlackBox  Компоненты  Проекты
Текущее время: Пятница, 29 Март, 2024 01:19

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3
Автор Сообщение
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 13:11 
Аватара пользователя

Зарегистрирован: Четверг, 08 Октябрь, 2009 15:00
Сообщения: 3774
Борис Рюмшин писал(а):
Ну размер то файлов никак не изменится (для русского), при переходе на UTF8. Будет тоже самое, по сути. Вот, кстати, тексты полностью на CHAR перевести можно было бы.

Главное изменить принцип дробления на куски. Чтобы это дробление было только по признакам атрибутов, а не по типу CHAR/SHORTCHAR.
Сделав ASCII тексты в CHAR - мы получим увеличение размера odc всех файлов ББ.
С Utf8 мы получим, что те файлы, что есть сейчас вообще не изменятся, а вот русские тексты будут занимать намного меньше, чем сейчас.

Борис Рюмшин писал(а):
И проблема не только в экспортированных их Kernel процедурах, а в том, что юникодизация выполнена не штатными средствами. Если бы поддержки юникода в КП не было, разговор про utf8 внутри имел бы смысл, но она есть.

Стоит попробовать. Раз это не так сложно, как вы говорите, то ждем тестовую реализацию!


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 14:35 
Администратор

Зарегистрирован: Вторник, 15 Ноябрь, 2005 01:14
Сообщения: 4695
Откуда: Россия, Орёл
Иван Денисов писал(а):
Главное изменить принцип дробления на куски. Чтобы это дробление было только по признакам атрибутов, а не по типу CHAR/SHORTCHAR.
Сделав ASCII тексты в CHAR - мы получим увеличение размера odc всех файлов ББ.

Это правда, настолько существенно?
Иван Денисов писал(а):
С Utf8 мы получим, что те файлы, что есть сейчас вообще не изменятся, а вот русские тексты будут занимать намного меньше, чем сейчас.

Почему? Кириллица занимает два байта в utf8, как и в CHAR. Не изменится ничего.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 15:14 
Аватара пользователя

Зарегистрирован: Четверг, 08 Октябрь, 2009 15:00
Сообщения: 3774
Борис Рюмшин писал(а):
Иван Денисов писал(а):
Главное изменить принцип дробления на куски. Чтобы это дробление было только по признакам атрибутов, а не по типу CHAR/SHORTCHAR.
Сделав ASCII тексты в CHAR - мы получим увеличение размера odc всех файлов ББ.

Это правда, настолько существенно?

С рациональной точки зрения, не ясно, зачем делать характеристики системы хуже...

Борис Рюмшин писал(а):
Иван Денисов писал(а):
С Utf8 мы получим, что те файлы, что есть сейчас вообще не изменятся, а вот русские тексты будут занимать намного меньше, чем сейчас.

Почему? Кириллица занимает два байта в utf8, как и в CHAR. Не изменится ничего.

Из-за того, что изменится способ разбиения текста на куски. Я попробую провести эксперимент.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 15:37 

Зарегистрирован: Понедельник, 28 Ноябрь, 2005 10:28
Сообщения: 1428
Борис Рюмшин писал(а):
Почему? Кириллица занимает два байта в utf8, как и в CHAR. Не изменится ничего.

viewtopic.php?f=131&t=6203


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 19:24 
Администратор

Зарегистрирован: Вторник, 15 Ноябрь, 2005 01:14
Сообщения: 4695
Откуда: Россия, Орёл
Ну так я не против реализацию то в порядок привести. Только к полному CHAR, без utf8.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 19:52 

Зарегистрирован: Понедельник, 28 Ноябрь, 2005 10:28
Сообщения: 1428
В принципе да, пока у нас array of char, utf-8 выглядит неестественно.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Предложение: убрать UTF8 из BlackBox
СообщениеДобавлено: Среда, 25 Декабрь, 2019 20:32 
Аватара пользователя

Зарегистрирован: Четверг, 08 Октябрь, 2009 15:00
Сообщения: 3774
Я так понимаю, что если хранить в CHAR, то загрузка текстов будет быстрее происходить? Ведь конвертация не потребуется. Так?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Суббота, 24 Апрель, 2021 11:09 
Аватара пользователя

Зарегистрирован: Четверг, 08 Октябрь, 2009 15:00
Сообщения: 3774
Кто-то готов развивать эту тему? Надо заменить SHORTCHAR в компиляторе, в ядре и других местах на CHAR.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Понедельник, 03 Май, 2021 22:10 

Зарегистрирован: Понедельник, 28 Ноябрь, 2005 10:28
Сообщения: 1428
Забавно, когда-то я именно с этого начинал. Может, даже выкладывал здесь. Но потом появилась реализация Центра с utf-8. Мне она показалась более простой.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Вся информация, размещаемая участниками на конференции (тексты сообщений, вложения и пр.) © 2005-2024, участники конференции «OberonCore», если специально не оговорено иное.
Администрация не несет ответственности за мнения, стиль и достоверность высказываний участников, равно как и за безопасность материалов, предоставляемых участниками во вложениях.
Без разрешения участников и ссылки на конференцию «OberonCore» любое воспроизведение и/или копирование высказываний полностью и/или по частям запрещено.
Powered by phpBB® Forum Software © phpBB Group
Русская поддержка phpBB