OberonCore

Библиотека  Wiki  Форум  BlackBox  Компоненты  Проекты
Текущее время: Четверг, 28 Март, 2024 12:15

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3
Автор Сообщение
 Заголовок сообщения:
СообщениеДобавлено: Понедельник, 20 Август, 2007 22:21 
Аватара пользователя

Зарегистрирован: Пятница, 20 Январь, 2006 13:18
Сообщения: 37
По поводу только графического отображения, каюсь, слегка нафантазировал.
В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований.

Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся).
Еще в ASCII были введены служебные символы, которые на текущий момент фактически не используются, а совместимость с ними приходится поддерживать. Да, на некотором этапе это удобно, но потом остается куча мусора, который нафиг не нужен, а для совместимости приходится за собой таскать.

Вводить специальные символы есть смысл только если без них совершенно нельзя обойтись, а если можно - то нужно обходится без них.

Иван Горячев писал(а):
Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ?

А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д???
По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде.
Для каждого отдельного языка правила сформулировать можно, а для всех - нет.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re:
СообщениеДобавлено: Вторник, 21 Август, 2007 03:18 

Зарегистрирован: Суббота, 26 Ноябрь, 2005 10:37
Сообщения: 875
Откуда: Россия, Владивосток
alek111 писал(а):
А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д???

Это наверно не совсем стандарт, но UTS 10 Unicode Collation Algorithm. Ну и есть файл SpecialCasing.txt в стандарте


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вторник, 21 Август, 2007 19:30 
Аватара пользователя

Зарегистрирован: Пятница, 20 Январь, 2006 13:18
Сообщения: 37
Иван Горячев писал(а):
Это наверно не совсем стандарт, но UTS 10 Unicode Collation Algorithm. Ну и есть файл SpecialCasing.txt в стандарте

Это, может быть и стандарт, но он описывает алгоритм, которому нужно предварительно сказать что и как сортировать. Т.е. вы сначала должны сами определить в каком порядке вам нужна сортировка.

Как я уже писал, в общем случае преобразование регистров невозможно потому что:
- не во всех языках есть понятие регистра;
- не во всех языках в которых есть понятие регистра можно поставить строгое соответствие между двумя символами; (в некоторых языках есть по несколько форм одного и того же символа)
- если два языка используют сходные алфавиты (например на основе латиницы) то это не значит, что и преобразования регистров у них одинаковые (гипотетический пример: есть языки А и Б, в языке А большой букве Т соответствует маленькая буква t, а в языке Б - маленькая буква m)


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re:
СообщениеДобавлено: Вторник, 21 Август, 2007 21:14 

Зарегистрирован: Вторник, 29 Ноябрь, 2005 21:41
Сообщения: 1030
alek111 писал(а):
По поводу только графического отображения, каюсь, слегка нафантазировал.
В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований.
Меня как раз подробности и интересуют. Остановился на области выделяемой стандартом для корпоративного использования т.е. тот о котором говорил выше и расширяемый вниз. Буду благодарен за информацию о том, какие корпорации зарезервировали в нем место на данный момент.
alek111 писал(а):
Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся).

Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет.
alek111 писал(а):
Иван Горячев писал(а):
Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ?

А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д???
По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде.
Для каждого отдельного языка правила сформулировать можно, а для всех - нет.
Как я понимаю, приватные символы по начертанию не определены. Но раз для определения правила преобразования необходим дополнительный параметр, то почему его нельзя ввести автоматически в общем виде?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Re:
СообщениеДобавлено: Вторник, 21 Август, 2007 22:54 
Модератор
Аватара пользователя

Зарегистрирован: Понедельник, 14 Ноябрь, 2005 18:39
Сообщения: 9459
Откуда: Россия, Орёл
GUEST писал(а):
Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет.

В смысле? Параграфы, что ли, и разные виды пробелов? Я думал, они стандартные...

А если нужны свои служебные "символы", то можно просто свои невидимые views внедрять.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Re:
СообщениеДобавлено: Среда, 22 Август, 2007 18:28 

Зарегистрирован: Вторник, 29 Ноябрь, 2005 21:41
Сообщения: 1030
Илья Ермаков писал(а):
В смысле? Параграфы, что ли, и разные виды пробелов? Я думал, они стандартные...
В смысле появления оных. Что представляется затруднительным, если не сказать больше.
Илья Ермаков писал(а):
А если нужны свои служебные "символы", то можно просто свои невидимые views внедрять.
Вопрос исключительно в стоимости. Обсуждать можно будет только после появления альтернатив. :D


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Среда, 22 Август, 2007 23:06 
Аватара пользователя

Зарегистрирован: Пятница, 20 Январь, 2006 13:18
Сообщения: 37
GUEST писал(а):
alek111 писал(а):
По поводу только графического отображения, каюсь, слегка нафантазировал.
В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований.
Меня как раз подробности и интересуют. Остановился на области выделяемой стандартом для корпоративного использования т.е. тот о котором говорил выше и расширяемый вниз. Буду благодарен за информацию о том, какие корпорации зарезервировали в нем место на данный момент.

Там нельзя зарезервировать место. Общий смысл всех "приватных" символов в том, что они неопределены и каждый может использовать их как угодно, но среди них выделены так называемые "системные приватные" символы, которые вводятся не на уровне конечного приложения, а на более высоком уровне, например библиотеки или фреймворка.
GUEST писал(а):
alek111 писал(а):
Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся).

Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет.

Давайте заведем, а то я никак не могу понять цель обсуждения.
GUEST писал(а):
alek111 писал(а):
Иван Горячев писал(а):
Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ?

А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д???
По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде.
Для каждого отдельного языка правила сформулировать можно, а для всех - нет.
Как я понимаю, приватные символы по начертанию не определены. Но раз для определения правила преобразования необходим дополнительный параметр, то почему его нельзя ввести автоматически в общем виде?

Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется???


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re:
СообщениеДобавлено: Четверг, 23 Август, 2007 17:25 

Зарегистрирован: Вторник, 29 Ноябрь, 2005 21:41
Сообщения: 1030
alek111 писал(а):
Давайте заведем, а то я никак не могу понять цель обсуждения.
На Ваше усмотрение. Сейчас мне непонятно что в ней обсуждать.
alek111 писал(а):
Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется???
Вы имеете в виду, что варианты логики преобразований нельзя заранее предусмотреть? Если же нет, то почему не считать, что нужен один из них?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пятница, 24 Август, 2007 21:12 
Аватара пользователя

Зарегистрирован: Пятница, 20 Январь, 2006 13:18
Сообщения: 37
GUEST писал(а):
alek111 писал(а):
Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется???
Вы имеете в виду, что варианты логики преобразований нельзя заранее предусмотреть? Если же нет, то почему не считать, что нужен один из них?

Даже все варианты того, что нужно преобразовывать нельзя предусмотреть, а уж варианты преобразований и подавно. А если не предусмотреть всех вариантов преобразований, то вы отсекаете кучу языков.

Это мы привыкли, что каждая буква имеет по одному начертанию в двух регистрах, а в других языках часто все совсем не так. Например в греческом у нескольких букв есть по два или три начертания в нижнем регистре, они абсолютно равнозначны для сортировки, но ставятся в разных частях слова. И это один из самых простых примеров.

Не нужно забывать, что юникод это кодировка для представления символов, а не букв, т.е. это просто набор картинок, некоторые из которых можно комбинировать для получения более сложных картинок, а некоторые позиции в кодировке имеют специальное значение. Никакой информации о языке или алфавите нигде нет, поэтому правила сортировки и преобразования регистров неопределены. (а по какому критерию можно сортировать картинки???, а в "UTS 10 Unicode Collation Algorithm" как раз и дается механизм как можно задать эти критерии, но это не стандарт, это механизм)

Кстати, где можно найти документ, в котором описывается употребление юникода в ББ???


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Вся информация, размещаемая участниками на конференции (тексты сообщений, вложения и пр.) © 2005-2024, участники конференции «OberonCore», если специально не оговорено иное.
Администрация не несет ответственности за мнения, стиль и достоверность высказываний участников, равно как и за безопасность материалов, предоставляемых участниками во вложениях.
Без разрешения участников и ссылки на конференцию «OberonCore» любое воспроизведение и/или копирование высказываний полностью и/или по частям запрещено.
Powered by phpBB® Forum Software © phpBB Group
Русская поддержка phpBB