OberonCore https://forum.oberoncore.ru/ |
|
Поддержка юникода в BlackBox1.6rc5 https://forum.oberoncore.ru/viewtopic.php?f=3&t=453 |
Страница 3 из 3 |
Автор: | alek111 [ Понедельник, 20 Август, 2007 22:21 ] |
Заголовок сообщения: | |
По поводу только графического отображения, каюсь, слегка нафантазировал. В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований. Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся). Еще в ASCII были введены служебные символы, которые на текущий момент фактически не используются, а совместимость с ними приходится поддерживать. Да, на некотором этапе это удобно, но потом остается куча мусора, который нафиг не нужен, а для совместимости приходится за собой таскать. Вводить специальные символы есть смысл только если без них совершенно нельзя обойтись, а если можно - то нужно обходится без них. Иван Горячев писал(а): Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ? А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д??? По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде. Для каждого отдельного языка правила сформулировать можно, а для всех - нет. |
Автор: | Иван Горячев [ Вторник, 21 Август, 2007 03:18 ] |
Заголовок сообщения: | Re: |
alek111 писал(а): А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д??? Это наверно не совсем стандарт, но UTS 10 Unicode Collation Algorithm. Ну и есть файл SpecialCasing.txt в стандарте |
Автор: | alek111 [ Вторник, 21 Август, 2007 19:30 ] |
Заголовок сообщения: | |
Иван Горячев писал(а): Это наверно не совсем стандарт, но UTS 10 Unicode Collation Algorithm. Ну и есть файл SpecialCasing.txt в стандарте Это, может быть и стандарт, но он описывает алгоритм, которому нужно предварительно сказать что и как сортировать. Т.е. вы сначала должны сами определить в каком порядке вам нужна сортировка. Как я уже писал, в общем случае преобразование регистров невозможно потому что: - не во всех языках есть понятие регистра; - не во всех языках в которых есть понятие регистра можно поставить строгое соответствие между двумя символами; (в некоторых языках есть по несколько форм одного и того же символа) - если два языка используют сходные алфавиты (например на основе латиницы) то это не значит, что и преобразования регистров у них одинаковые (гипотетический пример: есть языки А и Б, в языке А большой букве Т соответствует маленькая буква t, а в языке Б - маленькая буква m) |
Автор: | Сергей Оборотов [ Вторник, 21 Август, 2007 21:14 ] |
Заголовок сообщения: | Re: |
alek111 писал(а): По поводу только графического отображения, каюсь, слегка нафантазировал. Меня как раз подробности и интересуют. Остановился на области выделяемой стандартом для корпоративного использования т.е. тот о котором говорил выше и расширяемый вниз. Буду благодарен за информацию о том, какие корпорации зарезервировали в нем место на данный момент.В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований. alek111 писал(а): Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся). Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет. alek111 писал(а): Иван Горячев писал(а): Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ? А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д??? По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде. Для каждого отдельного языка правила сформулировать можно, а для всех - нет. |
Автор: | Илья Ермаков [ Вторник, 21 Август, 2007 22:54 ] |
Заголовок сообщения: | Re: Re: |
GUEST писал(а): Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет. В смысле? Параграфы, что ли, и разные виды пробелов? Я думал, они стандартные... А если нужны свои служебные "символы", то можно просто свои невидимые views внедрять. |
Автор: | Сергей Оборотов [ Среда, 22 Август, 2007 18:28 ] |
Заголовок сообщения: | Re: Re: |
Илья Ермаков писал(а): В смысле? Параграфы, что ли, и разные виды пробелов? Я думал, они стандартные... В смысле появления оных. Что представляется затруднительным, если не сказать больше.Илья Ермаков писал(а): А если нужны свои служебные "символы", то можно просто свои невидимые views внедрять. Вопрос исключительно в стоимости. Обсуждать можно будет только после появления альтернатив.
|
Автор: | alek111 [ Среда, 22 Август, 2007 23:06 ] |
Заголовок сообщения: | |
GUEST писал(а): alek111 писал(а): По поводу только графического отображения, каюсь, слегка нафантазировал. Меня как раз подробности и интересуют. Остановился на области выделяемой стандартом для корпоративного использования т.е. тот о котором говорил выше и расширяемый вниз. Буду благодарен за информацию о том, какие корпорации зарезервировали в нем место на данный момент.В "приватном" диапазоне есть поддиапазон для системного использования. Подробности см. часть15 стандарта 4.0. Но все это очень не рекомендуется использовать без очень веских оснований. Там нельзя зарезервировать место. Общий смысл всех "приватных" символов в том, что они неопределены и каждый может использовать их как угодно, но среди них выделены так называемые "системные приватные" символы, которые вводятся не на уровне конечного приложения, а на более высоком уровне, например библиотеки или фреймворка. GUEST писал(а): alek111 писал(а): Но объясние мне - дураку, почему нельзя обойтись без служебных символов (все ведь обходятся). Не надо так сердиться. Подобные объяснения выходят за рамки этой темы. Я предпочел бы, чтобы они присутствовали в теме " Как нам избавиться от использования служебных символов в BlackBox?", которой сейчас нет. Давайте заведем, а то я никак не могу понять цель обсуждения. GUEST писал(а): alek111 писал(а): Иван Горячев писал(а): Я правильно понимаю, что для "приватных" символов стандарт определяет правила преобразования регистров, сортировки, нормализации и т.д. ? А для каких многоязычных кодировок стандарт определяет правила преобразования регистров, сортировки и т.д??? По моему, если кодировка определяет начертания символов это невозможно. Во многих языках верхний и нижний регистр не совпадают, а иногда бывает по несколько начертаний одного символа одного и того-же регистра отличающиеся положением в слове. Т.е. можно привести массу примеров того, что базирующиеся на начертании кодировки не могут обрабатываться автоматически в общем виде. Для каждого отдельного языка правила сформулировать можно, а для всех - нет. Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется??? |
Автор: | Сергей Оборотов [ Четверг, 23 Август, 2007 17:25 ] |
Заголовок сообщения: | Re: |
alek111 писал(а): Давайте заведем, а то я никак не могу понять цель обсуждения. На Ваше усмотрение. Сейчас мне непонятно что в ней обсуждать.alek111 писал(а): Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется??? Вы имеете в виду, что варианты логики преобразований нельзя заранее предусмотреть? Если же нет, то почему не считать, что нужен один из них?
|
Автор: | alek111 [ Пятница, 24 Август, 2007 21:12 ] |
Заголовок сообщения: | |
GUEST писал(а): alek111 писал(а): Да потому что непонятно, что вам нужно. Сколько регистров в вашем языке? один, два,три, десять??? и какова логика преобразования между ними??? и как это все употребляется??? Вы имеете в виду, что варианты логики преобразований нельзя заранее предусмотреть? Если же нет, то почему не считать, что нужен один из них?Даже все варианты того, что нужно преобразовывать нельзя предусмотреть, а уж варианты преобразований и подавно. А если не предусмотреть всех вариантов преобразований, то вы отсекаете кучу языков. Это мы привыкли, что каждая буква имеет по одному начертанию в двух регистрах, а в других языках часто все совсем не так. Например в греческом у нескольких букв есть по два или три начертания в нижнем регистре, они абсолютно равнозначны для сортировки, но ставятся в разных частях слова. И это один из самых простых примеров. Не нужно забывать, что юникод это кодировка для представления символов, а не букв, т.е. это просто набор картинок, некоторые из которых можно комбинировать для получения более сложных картинок, а некоторые позиции в кодировке имеют специальное значение. Никакой информации о языке или алфавите нигде нет, поэтому правила сортировки и преобразования регистров неопределены. (а по какому критерию можно сортировать картинки???, а в "UTS 10 Unicode Collation Algorithm" как раз и дается механизм как можно задать эти критерии, но это не стандарт, это механизм) Кстати, где можно найти документ, в котором описывается употребление юникода в ББ??? |
Страница 3 из 3 | Часовой пояс: UTC + 3 часа |
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/ |