OberonCore

Библиотека  Wiki  Форум  BlackBox  Компоненты  Проекты
Текущее время: Четверг, 28 Март, 2024 23:02

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 47 ]  На страницу Пред.  1, 2, 3  След.
Автор Сообщение
СообщениеДобавлено: Суббота, 02 Октябрь, 2010 14:32 

Зарегистрирован: Пятница, 25 Сентябрь, 2009 13:10
Сообщения: 1177
Откуда: Мариуполь
Разумеется, глупо отрицать необходимость существования текстового представления. Нужно лишь не увлекаться им где попало, а использовать с умом.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Суббота, 02 Октябрь, 2010 14:44 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Роман М. писал(а):
Разумеется, глупо отрицать необходимость существования текстового представления. Нужно лишь не увлекаться им где попало, а использовать с умом.

Сам формат/протокол текстовый. По умолчанию. До тех пор пока не воткнешься во какие-либо ограничения (скорее всего это будут ограничения либо по объему либо по производительности). Воткнувшись не стоит сразу радостно садиться за написание бинарного формата. Быть может можно упростить/оптимизировать текстовое. Или же вообще, проще и дешевле увеличить мощности железа.

Конечно существуют например случаи когда видно сразу что текстовый формат тут бесполезен совсем. Т.е. да, можно. Но во-первых будет тормозно. а во вторых будет всё равно не наглядно. Т.е. для анализа (например просмотра) содержимого придется тулзой конвертировать в БИНАРНОЕ представление, а уже затем скармливать какой-либо стандартной тулзени. По этой причине например мы сразу взяли google protobuf. а не какой-то там xml, для реализации нашего протокола (зачем оно было описано где-то в отвлеченных темах вроде). И не пожалели об этом. Впрочем, некоторые сериализаторы google protobuf'a умеют сериализовать и в текстовое представление :-) Но это не стандартная фенечка и она нам ни разу не понадобилась.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Суббота, 02 Октябрь, 2010 15:48 

Зарегистрирован: Пятница, 25 Сентябрь, 2009 13:10
Сообщения: 1177
Откуда: Мариуполь
Не стоит также забывать о том, что каждое текстовое представление требует создание отдельного лексического анализатора. В свою очередь, возможны трудности, связанные с толкованием текстовых данных. Одной бинарной форме записи может соответствовать множество представлений в текстовой форме. К тому же, с наличием такого количества наций и языков задача становится ещё труднее.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Суббота, 02 Октябрь, 2010 17:25 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Роман М. писал(а):
Не стоит также забывать о том, что каждое текстовое представление требует создание отдельного лексического анализатора. В свою очередь, возможны трудности, связанные с толкованием текстовых данных. Одной бинарной форме записи может соответствовать множество представлений в текстовой форме. К тому же, с наличием такого количества наций и языков задача становится ещё труднее.

Не каждой. Есть xml, json, yaml, ini и т.п. Для которых уже для всех актуальных языков есть готовые библиотеки высокого качества.

Одной текстовой форме также может соответствовать сколь угодно много представлений в бинарной форме. Тут разницы нет никакой.

А в случае необходимости (если мы изобрели совсем велосипедный велосипед в текстовом виде) парсер же пишется элементарно. Для этого также есть туча библиотек и инструментов. Старых проверенных инструментов гарантирующих результат. Программист обязан уметь ими пользоваться.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 01:49 

Зарегистрирован: Понедельник, 22 Март, 2010 13:31
Сообщения: 5
Откуда: Finland
Rifat писал(а):
Думаю еще имеет значение, что тектовый формат человек может посмотреть и проверить правильные ли данные выводятся
Вообще-то человек просматривает не формат, а символы на экране (ранее — бумагу из принтера или телетайпа). Единственное отличие "текстового" от "двоичного" формата состоит во front-end'е, с помощью которого данные показываются/редактируются. Для "текстового" формата front-end получается простейшим, так как, грубо говоря, отображение между кодом символа и знакогенератором - один к одному (оно легко реализуется и на электромеханическом уровне). В этом случае внутреннее (машинное) кодирование данных почти полностью совпадает с внешним (человеко-ориентированным), что, на мой взгляд, является худшим вариантом, ибо не позволяет в полной мере раскрыть потенциал ни того, ни другого.

Полностью соглашусь с автором вопроса, что низкая информационная энтропия (вручную легко исправляются простые ошибки), ну и совместимость с огромным багажом методологий и инструментов, накопленных за 60 лет (а если точнее - то за 3000+, со времени начал финикийского алфавита) являются причинами повсеместного и широкого использования текстового формата. Даже китайцами, которым алфавитная форма записи не очень-то близка.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 09:42 
Аватара пользователя

Зарегистрирован: Пятница, 25 Ноябрь, 2005 12:02
Сообщения: 8500
Откуда: Троицк, Москва
yuriz писал(а):
низкая информационная энтропия (вручную легко исправляются простые ошибки), ну и совместимость с огромным багажом методологий и инструментов, накопленных за 60 лет (а если точнее - то за 3000+, со времени начал финикийского алфавита) являются причинами повсеместного и широкого использования текстового формата. Даже китайцами, которым алфавитная форма записи не очень-то близка.
Как-то забывается обо всем этом (у драконщиков среди прочих; подчеркивая -- возможно, справделиво -- некоторые достоинства графических представлений, они перегибают палку в аргументации).

Текстовый формат -- великая вещь.
Начинается он, кстати, не 3000+ лет назад, а с полноценной членораздельной речи, т.е. O(100К) лет назад. Которая уже имеет все структурные признаки текста.

Держаться ближе к простому текстовому формату -- очень хороший эвристический принцип. Здесь минимализм в свете Принципа Калашникова -- это в точности минимизация довесок к простому текстовому формату. Вон сколько проблем с разными Office'ами, в т.ч. переход на OpenOffice.

Удачно, что yuriz про это явно сказал.
(И удачно, что я это с утречка прочитал, когда мозг полон глюкозы и стреляет ассоциациями мама не горюй :))


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 13:36 
Модератор
Аватара пользователя

Зарегистрирован: Понедельник, 14 Ноябрь, 2005 18:39
Сообщения: 9459
Откуда: Россия, Орёл
В принципе, многие (под влиянием мод на картиночки и диаграммки типа УМЛей) забывают о сильной форме представления - таблицах. Почти текст, но уже двумерно. При этом могут быть как таблицы в смысле... однородного набора данных на пересечении столбцов-строк определённого типа. Так и в смысле, выражаемом словом grid: структурирование листа на "гнёзда", в которые заносится текст.

У меня уже не первый раз было так (например, для проектной документации, при этом ориентированной на заказчика): в процессе составления текста ощущаешь острую необходимость задействовать схемы. Думаешь: "как же я ненавижу чертить какие-то рисунки-диаграммы". Вспоминаешь: "есть же таблицы, надо только придумать удачную структуру grid-а".


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 14:01 

Зарегистрирован: Воскресенье, 06 Апрель, 2008 14:43
Сообщения: 557
Для структуризации логических текстов есть язык Граф В.Д. Паронджанова в книге "Почему мудрец похож на обезьяну". Смотрит http://forum.oberoncore.ru/viewtopic.php?f=62&t=1792, http://forum.oberoncore.ru/viewtopic.php?p=23517#p23517


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 14:14 
Модератор
Аватара пользователя

Зарегистрирован: Понедельник, 14 Ноябрь, 2005 18:39
Сообщения: 9459
Откуда: Россия, Орёл
Разумеется, это известно.
Про то и речь, что для структуризации информации "неграфового" (декларативного) характера использовать что-то мощнее таблиц - "избыточная сложность".
В профессиональной деятельности.

В учебно-методической литературе - отдельно разбирать потребности надо. Что и делает Паронджанов с ГРАФом-ГНОМом.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 19:09 

Зарегистрирован: Понедельник, 28 Ноябрь, 2005 10:28
Сообщения: 1428
Иван Кузьмицкий писал(а):
Ещё раз:
Цитата:
XML documents should be human-legible and reasonably clear.


Цитата:
А у меня там дрова лежат


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 19:48 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
"XML удачно сочетает в себе сложность парсинга текстовых форматов с человеко-нечитаемостью бинарных"


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 20:04 
Модератор
Аватара пользователя

Зарегистрирован: Понедельник, 14 Ноябрь, 2005 18:39
Сообщения: 9459
Откуда: Россия, Орёл
Да модель-то иерархическая у XML простая и, в общем, удобная для моделирования прикладных данных (я бы сказал - для хранения данных объектного характера). Плюс расширяемость. Что вообще делает прирождённые XML-базы кандидатами в "реальные" объектно-ориентированные БД.

Касательно формата - почему сразу не была заложена и унифицирована очевидная идея - компиляции текста в изоморфный бинарник. Текст - только представление. А работа (машинная передача, хранение) - всегда бинарник.

Наши ИСПРАНовцы придумали SXML - изоморфное скобочное представление, соответствующее выражениям языка Scheme: (tag ...), стандартизировали. Даже через W3 протащили, кажется. Хоть меньше этого "буквоблудия".


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 20:08 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Есть же json. И есть стандартный бинарный xml.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 20:13 
Модератор
Аватара пользователя

Зарегистрирован: Понедельник, 14 Ноябрь, 2005 18:39
Сообщения: 9459
Откуда: Россия, Орёл
А что за стандарт?
Насколько я помню, есть стандарт на компрессию текстового XML. Или..?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Воскресенье, 19 Декабрь, 2010 20:23 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Илья Ермаков писал(а):
А что за стандарт?
Насколько я помню, есть стандарт на компрессию текстового XML. Или..?

Или:
http://en.wikipedia.org/wiki/Fast_Infoset
http://en.wikipedia.org/wiki/Wireless_Binary_XML
На самом деле вариантов несколько.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Понедельник, 20 Декабрь, 2010 13:39 
Аватара пользователя

Зарегистрирован: Пятница, 25 Ноябрь, 2005 18:55
Сообщения: 2272
Откуда: Россия, Нижний Новгород
Alexey Veselovsky писал(а):
Кстати, а при чем тут именно сишники? ;-)
А им чаще больно. Инструмент колючий.
Alexey Veselovsky писал(а):
мы сразу взяли google protobuf...пожалели...нам
Ага только надо заменить: мы->я, пожалели->пожалел, нам->мне. Алексей, если говорить о нас как о подразделении VoIP компании "МФИ Софт", то мы взяли и изготовили в 2008 году собственный язык описания объектов сообщений MODeL (Message Object Definition Language), а ты в своём отделе перспективных разработок подразделения VoIP можешь пробовать различные "новые технологии" хоть до опупения.
Info21 писал(а):
Текстовый формат -- великая вещь.
Для чего? Для короткоживущих объектов сообщений (1M сообщений в секунду)? Для таблиц СУБД? Для системы контроля версий? Для конфигурационных файлов? Для долговременного хранения "отдельностоящих" документов?
Info21 писал(а):
Вон сколько проблем с разными Office'ами
Это для долговременного хранения "отдельностоящих" документов.
Info21 писал(а):
я это с утречка прочитал, когда мозг полон глюкозы
Я думал, что глюкоза не в мозгу, а в крови и утром глюкозы минимальное количество (всю ночь не ел).
Илья Ермаков писал(а):
Касательно формата - почему сразу не была заложена и унифицирована очевидная идея - компиляции текста в изоморфный бинарник. Текст - только представление. А работа (машинная передача, хранение) - всегда бинарник.
Вот именно. Описание формата Mapper/Formatter - это одно, а Reader/Writer - совершенно другое.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Понедельник, 20 Декабрь, 2010 13:49 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Сергей Губанов писал(а):
Alexey Veselovsky писал(а):
Кстати, а при чем тут именно сишники? ;-)
А им чаще больно. Инструмент колючий.

Это не так.
Сергей Губанов писал(а):
Alexey Veselovsky писал(а):
мы сразу взяли google protobuf...пожалели...нам
Ага только надо заменить: мы->я, пожалели->пожалел, нам->мне. Алексей, если говорить о нас как о подразделении VoIP компании "МФИ Софт", то мы взяли и изготовили в 2008 году собственный язык описания объектов сообщений MODeL (Message Object Definition Language), а ты в своём отделе перспективных разработок подразделения VoIP можешь пробовать различные "новые технологии" хоть до опупения.

Мы -- это три человека, которые работали над вполне конкретным проектом, решение принималось совместно. И это оказалось правильным решением. Применение MODeL (про который я вообще то знаю), в данном случае было не оправданным.

MODeL и google protobuf вообще говоря ровесники. И то и то появилось в 2008 году. Точнее google protobuf наверняка старше, потому как он появился публично уже готовым (причем версии уже 2.х). MODeL публично так и не появился. Так что "новой технологией" был бы MODeL :-)

Т.о. подразделение VoIP компании "МФИ Софт" использует как google protobuf, так и свой собственный велосипед :-) Это факт.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Понедельник, 20 Декабрь, 2010 13:51 

Зарегистрирован: Вторник, 25 Апрель, 2006 16:21
Сообщения: 2180
Откуда: Нижний Новгород
Сергей Губанов писал(а):
Я думал, что глюкоза не в мозгу, а в крови и утром глюкозы минимальное количество (всю ночь не ел).

Кстати, да. У меня лично голова довольно туго соображет с утра. Нормально функционировать начинает где-то часам к двум дня. Вне зависимости от текущего режима дня.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Понедельник, 20 Декабрь, 2010 14:26 
Аватара пользователя

Зарегистрирован: Пятница, 25 Ноябрь, 2005 12:02
Сообщения: 8500
Откуда: Троицк, Москва
Сергей Губанов писал(а):
Я думал, что глюкоза не в мозгу, а в крови и утром глюкозы минимальное количество (всю ночь не ел).
Глюкоза -- главный источник энергии где угодно в организме.
А в мозге -- единственный.
Попадает в спинномозговой ликвор из крови через гематоэнцефалический барьер в т.наз. сосудистых сплетениях.
Для электрической стрельбы нейронов ее нужно немеряно. Чем более дальние ассоциации (т.е. прострелить через наибольшее количество промежуточных инстанций), тем критичней насыщенность глюкозой.
Как раз утром мозг отдохнувший и насыщенный глюкозой под завязку.
Еда -- не единственный источник глюкозы, тем более что для мозга организм готов на всё.

Сам люблю вечером засидеться.
Но по опыту всякой вычислительной и прочей точной деятельности (где всё очень хорошо меряется количеством ошибок) знаю, что несмотря даже на предельную сонливость с утра ошибок -- если, конечно, число полных циклов сна ночью набрано достаточное -- будет на порядок меньше, чем вечером -- как бы вечером ни был возбужден. При том (и несмотря на то), что 17-18 часов пополудни -- т.наз. время олимпийских рекордов, т.е. организм вроде ощущает себя очень бодро и мощно. Но это мощь физическая, а не интеллектуальная.

Поэтому когда длинная серьезная работа, то стараюсь включить четкий режим с ранним отходом ко сну и ранним вставанием, чтобы поработать 6/7-12. А после обеда какое-нибудь полезное перекладывание бумажек поделать.
Просто опыт.
К сожалению, такой режим в России трудно себе устроить, даже если на работу являться не обязательно.

Если по китайскому обычаю после обеда давануть полный полуторачасовой цикл сна (я в таком режиме пожил полгода когда-то в Китае), то действительно встаешь как огурчик, как будто утром выспавшись. У них обеденный перерыв с 12 до 14, и всё при этом закрывается -- библиотеки, компьютерные классы ... закрывают и всех выгоняют есть и спать. Красота!

Алкоголь, кстати, даже в малых дозах нарушает циклы сна и с утра характерной свежести уже не будет. Для меня это -- главный антиалкогольный аргумент.
-----
ПыСы. Впрочем, не только глюкоза нужна мозгу для электрической "пальбы". Но ведь глюкоза у нас с самого начала немножко метафора. Практически все аргументы сохраняют смысл в любом случае.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: Вторник, 21 Декабрь, 2010 13:31 
Администратор

Зарегистрирован: Вторник, 15 Ноябрь, 2005 01:14
Сообщения: 4695
Откуда: Россия, Орёл
Сергей Губанов писал(а):
Info21 писал(а):
Текстовый формат -- великая вещь.
Для чего? Для короткоживущих объектов сообщений (1M сообщений в секунду)? Для таблиц СУБД? Для системы контроля версий? Для конфигурационных файлов? Для долговременного хранения "отдельностоящих" документов?

Мне кажется надо разделить общение "Человек - Машина" и "Машина - Машина". Текст машине лишняя палка в колесо. А текстовый интерфейс - очень действенная вещь. Очень.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 47 ]  На страницу Пред.  1, 2, 3  След.

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Вся информация, размещаемая участниками на конференции (тексты сообщений, вложения и пр.) © 2005-2024, участники конференции «OberonCore», если специально не оговорено иное.
Администрация не несет ответственности за мнения, стиль и достоверность высказываний участников, равно как и за безопасность материалов, предоставляемых участниками во вложениях.
Без разрешения участников и ссылки на конференцию «OberonCore» любое воспроизведение и/или копирование высказываний полностью и/или по частям запрещено.
Powered by phpBB® Forum Software © phpBB Group
Русская поддержка phpBB