OberonCore • - Детерминированность лексики Оберона

Сообщения без ответов | Активные темы

Список форумов » Вопросы системного программирования » Технологии компиляции

Часовой пояс: UTC + 3 часа

Детерминированность лексики Оберона

Страница 7 из 9

[ Сообщений: 180 ]

На страницу Пред. 1 ... 4, 5, 6, 7, 8, 9 След.

Версия для печати

Пред. тема | След. тема

Автор

Сообщение

igor

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Пятница, 05 Февраль, 2010 19:09

Зарегистрирован: Вторник, 13 Ноябрь, 2007 20:38
Сообщения: 1056

Валерий Лаптев писал(а):

Молчанова - вы хотели сказать...

Еще порекомендую: ...

Да, Молчанова. Спасибо, поправил своё сообщение.

За рекомендации отдельное спасибо.

Вернуться к началу

Валерий Лаптев

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Пятница, 05 Февраль, 2010 20:02

Зарегистрирован: Суббота, 07 Март, 2009 15:39
Сообщения: 3261
Откуда: Астрахань

igor писал(а):

Валерий Лаптев писал(а):

Молчанова - вы хотели сказать...

Еще порекомендую: ...

Да, Молчанова. Спасибо, поправил своё сообщение.

За рекомендации отдельное спасибо.

У меня есть небольшой обзор книг по системному программированию (писал когда-то для БХВ). Соберусь с силами - выставлю в Литературе.

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 11:42

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

В том-то и беда, что книг много, а добыть из них настоящую Истину - занятие затруднительное

Ну не в состоянии я их прочитать все. Моя задача - Знание получить, а не соревнование в скорочтении.
Потому и читаю не очень быстро...

Вот ознакомился намедни с Легаловым.
Про разработку сканера у него, если говорить мягко - престидижитаторство.
А если на сленге, характерном для данного форума - рукосуйство

И что в результате ??? Наблюдаю попытки у igor обязательно "принять решение" в автомате, который "равномощен регулярному выражению". И ведь у Легалова так и написано: прием лексемы происходит обязательно по выходу (джигит, блин!!!) из автомата.
Или патерн для комментария: "/*"{sym}"*/"... Сдуреть можно.

И все время, обращая внимание на "возможные трудности распознавания лексики", приводят FORTRAN в качестве примера. Докопались же до людей, которые и в мыслях не держали создание математических основ лексического и синтаксического анализа :lol:

Вот и получается, что информации - выше крыши.
А доказать, что исходный текст разбивается на лексемы НЕ ОДНОЗНАЧНО - крайне затруднительно
Приходится доказывать, что возможное разбиение исходного текста "3.1415" на лексемы integer period integer - соответствует ВСЕМ синтаксическим правилам.
Коллеги, побойтесь бога, чего тут доказывать :!:

А доказывать приходится потому, что в букварях написано, что сканер - это так, не более чем для удобства. И без него легко и обойтись. Или более туманно: "в принципе, можно и обойтись"
Вот Вам и мораль: начинаем слепо верить Великим => начинаем сомневаться даже в том, что 2x2=4
Ну или по другому: "Верить нельзя никому. Мне - можно" ((c) Мюллер)

В чем собственно был предмет обсуждения-то ??? Он начался с крайнего удивления igor моим постом

То же, но может более коротко:
Использование сканера не просто "более удобно", а позволяет устранить неоднозначность разбиения исходного текста на лексемы (каждая из которых определена регулярным выражением). Сканер не может вернуть не-понять-что, даже для текста '"Х"' он вернет одно значение. И какое значение из двух: CharConstant, или string - определяется разработчиком сканера, а не регулярными выражениями для этих токенов.
Но одно :!:

В этом его главный смысл. А не в неком мифическом удобстве.
Если спросите, где я это прочитал - не скажу (не помню, может и нигде)... При всем изобилии информации

Вернуться к началу

Валерий Лаптев

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 13:29

Зарегистрирован: Суббота, 07 Март, 2009 15:39
Сообщения: 3261
Откуда: Астрахань

Я уже давно удивляюсь разговорам о сканерах и лексерах. Давно пора сделать редактор интегрированной среды не текстовым...

О чем тут Сергей Прохоренко неоднократно гуторил...

Вернуться к началу

Peter Almazov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 13:57

Зарегистрирован: Пятница, 24 Апрель, 2009 16:28
Сообщения: 563
Откуда: Москва

Galkov писал(а):

То же, но может более коротко:
Использование сканера не просто "более удобно", а позволяет устранить неоднозначность разбиения исходного текста на лексемы

Не понял, в чем пафос. С этим никто и не спорит.
----
А чем конкретно не понравился шаблон "/*"{sym}"*/" для комментария?

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 14:31

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

Валерий Лаптев писал(а):

Я уже давно удивляюсь разговорам о сканерах и лексерах

Ну-ну

Нет, у меня удивления нет по этому поводу.
Текст еще далеко не умер. Текст это очень-очень полезная вещь.

Не будет новостью, видимо, что лично я есть большой сторонник именно визуального программирования.
Но тут у меня возникло серьезное подозрение про "закон сохранения сложности". Уменьшая порог вхождения в программирование (что для меня уже не вопрос диспута, а эксперименталный факт) визуальными средами, мы не ликвидируем исходную сложность, а перекладывает это все дело на компилятор.
А существующие технологии и с сегодняшней-то сложностью справляются не очень...
А вот если БЫ осуществить такой интеллектуальный прорыв, чтобы искуство дзена начало умирать по причине бесперспертивности соревнования с ИИ - тогда ДА.
И я бы первый присоединился к Вашему удивлению

Ну и наконец, слова Вирта, обладают глубоким смыслом, мне представляется:

Вирт писал(а):

Однако, кому-то может показаться, что знание о методах трансляции не является необходимым для понимания связи между исполняемой программой и кодом., и еще менее важно знать, как на самом деле пишется компилятор. Личный опыт преподавателя подсказывает мне, что глубокое понимание предмета лучше всего приходит при всестороннем прникновении как в общую идею системы, так и в детали ее реализации.

Хоть я и не преподаватель, но мне тоже кажется, что фундаментальные знания нужны уже потому, что они являются фундаментом для созидания Великого и Вечного

Качество фундамента однозначно повлечет и качество нашей повседневной работы -- как-то так, видимо

Peter Almazov писал(а):

С этим никто и не спорит.

Спорят-спорят. У нас ведь все ходы записаны
Как минимум, до сих пор не верят (не вопрос, мне понятно, что Вы - верите)

Надо переходить дальше (по программе), а консесус взял - и не пришел
Консенсус-то старттопером - необходим категорически, имхо.

Peter Almazov писал(а):

А чем конкретно не понравился шаблон "/*"{sym}"*/" для комментария?

Ну вот видите :wink:

Не пришел, консенсус-то...
ТЕМ, что данное регулярное выражение порождает такие лексемы (например "/* Гы-Гы-Гы */ Га-Га-Га */"), которые мы (и Легалов - тоже) комментариями считать и не собирались вовсе.

Кстати говоря, а слабо записать "честное" регулярное выражение для комментария :?:

Вопрос, естественно, не в коде его реализующем (Вы создавали про это тему - там все абсолютно понятно), а именно в формальной записи.

Вернуться к началу

Peter Almazov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 15:21

Зарегистрирован: Пятница, 24 Апрель, 2009 16:28
Сообщения: 563
Откуда: Москва

Galkov писал(а):

Кстати говоря, а слабо записать "честное" регулярное выражение для комментария :?:

Вот "честное" регулярное выражение для комментария (легаловского):

НачалоКомментария {sym} КонецКомментария

Лексику, как всегда, отделяем

Вернуться к началу

Валерий Лаптев

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 17:50

Зарегистрирован: Суббота, 07 Март, 2009 15:39
Сообщения: 3261
Откуда: Астрахань

Galkov писал(а):

Ну и наконец, слова Вирта, обладают глубоким смыслом, мне представляется:

Вирт писал(а):

Однако, кому-то может показаться, что знание о методах трансляции не является необходимым для понимания связи между исполняемой программой и кодом., и еще менее важно знать, как на самом деле пишется компилятор. Личный опыт преподавателя подсказывает мне, что глубокое понимание предмета лучше всего приходит при всестороннем проникновении как в общую идею системы, так и в детали ее реализации.

Качество фундамента однозначно повлечет и качество нашей повседневной работы -- как-то так, видимо

Не... Давно пора осознать, что в разных областях программирования нужны разные уровни знаний. И не всем программистам требуется такой уровень знаний, который дает Вирт. ИМХО дело инструментальной среды - ОТГОРОДИТЬ рядового программиста-работника от особенностей операционной системы и тем более - аппаратной платформы. Создателям сред глубокие фундаментальные знания, о которых Вирт говорит, необходимы. А программисту, реализующему учет горюче-смазочных материалов - нет. И это беда инструментов, что они не отгораживают такого программиста от необходимости лезть внутрь.
Вот для таких программистов текстовое представление программы нужно только для чтения...

Вернуться к началу

Виктор О

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 18:16

Зарегистрирован: Среда, 30 Сентябрь, 2009 14:45
Сообщения: 147

Galkov писал(а):

Не будет новостью, видимо, что лично я есть большой сторонник именно визуального программирования.
Но тут у меня возникло серьезное подозрение про "закон сохранения сложности". Уменьшая порог вхождения в программирование (что для меня уже не вопрос диспута, а эксперименталный факт) визуальными средами, мы не ликвидируем исходную сложность, а перекладывает это все дело на компилятор.

Тогда вот мнение от противника визуального программирования.

Порог вхождения на уровне "Hello world" - это не порог.
А порог вхождения на уровне любой реальной задачи визуальное программирование только повышает. Потому что поиск, где эта фича, напоминает коварные ходилки, в которых самое нужное рассовано по всем углам. А реализация визуального программирования всегда повышает сложность любого программирования.

Не скажу за оберон, но в дельфях я давно отказался от всякой визуальности - легче написать в блокноте 300-400 строк, а потом отладить, чем искать в закромах все эти свойства.

ИМХО, визуальность нужна тем, у кого недостаток воображения - им трудно представить, как будет выглядеть код в реализации., ИМХО.

Вернуться к началу

Peter Almazov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 19:56

Зарегистрирован: Пятница, 24 Апрель, 2009 16:28
Сообщения: 563
Откуда: Москва

2 Galkov: А Вы когда ссылаетесь на Ахо, какое издание имеете в виду - первое или второе?

Вложения:

1.png [ 48.53 КБ | Просмотров: 16442 ]

2.png [ 31.8 КБ | Просмотров: 16442 ]

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 21:43

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

У меня первое (крррасный дракон). И не знал, что у них разная свежесть...
Если есть "техническая свежесть" - буду бесконечно благодарен, например мылу

Вернуться к началу

Валерий Лаптев

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 23:11

Зарегистрирован: Суббота, 07 Март, 2009 15:39
Сообщения: 3261
Откуда: Астрахань

Вторая книга - значительно обширнее...

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Понедельник, 08 Февраль, 2010 23:54

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

Ну вот, опять читать

Спасибо, коллеги, ОТКРЫЛИ ГЛАЗА :!:

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 02:23

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

Вот какое замечание мне хотелось сделать про лексер... В смысле - сканер.
Возможно, немного забегаю, но предположим (хотя бы в рамках только этого поста), что неоднозначность разбиения исходного текста на лексемы - факт не вызывающий сомнений

Что такое сканер, спрашивается ???
Это такая "машинка", которая делает именно однозначным (и это в нем главное) разбиение исходного текста на лексемы.
Какая для такого поведения дана информация ???
Список патернов (регулярных выражений) для всех токенов (по дядюшке АхО - это класс лексем, а они в свою очередь - конкретная реализация токена в виде ли текста, числа, и т.п.)
По какому принципу разрешается неоднозначность разбиения ???
Во-первых - да по тому самому правилу СДЛ. Не будем наконец вспоминать про фортрановский "DOI=1,"
Во-вторых, при равенстве длин разных лексем - по порядковому номеру в вышеозначенном списке патернов.
Чего происходит после распознавания лексемы по вышеозначенным правилам ???
Самый простой ответ - возврат соответствующего LexemID. Но мы же знаем, что порой ничего возвращать не надо, а надо просто пропускать какой ни то "комментарий"
Поэтому более общим ответом будет - выполнение действий предписанных разработчиком сканера. Т.е., вышеозначенный список патернов должен быть дополнен, каким-то образом, списком действий (Action) для каждого регулярного выражения. А уже у нутре этих Action разработчик явно указывает: то ли возврат соответствующего LexemID, то ли дополнительные действия по подготовке таблиц символов или рассчету аттрибута value, то ли просто - выбрать следующую лексему (без возврата в caller), начиная с некого начального состояния

Все это были довольно очевидные рассуждения. Кроме последних трех слов

Как у нас все работает ??? Сканер скушал некую порцию текста, и вернул некую лексему. Начинает кушать следующую...
Вопрос: по одинаковому ли алгоритму работает наш сканер при распознавании каждой лексемы ???
А вот тут есть фишка, и очень удобная - может и по разному. Т.е., вышеозначенные слова "некого начального состояния" могут иметь смысл указания на переход сканера в состояние приема лексем, отличное от некого default-а
В чем может быть польза... Ну например, по лексеме ASM он может переключиться в режим приема асм-лексем - другой язык таки... А уже в асм-состоянии, по какому-нибудь END - опять в исходное.
Можно по односимвольной лексеме "кавычка" переключиться в состояние sting, и начать хитромудро парсить какие-нибудь esc-коды.

Скажем так, я не обладаю достаточной образованностью, чтобы ответить, описывается ли эта фишка какой-нибудь "грамматикой". Но вот то, что это не усложняет сканер принципиально - точно знаю. Как был автоматом, таким и останется. И графическое представление довольно очевидно: просто "стартовых" состояний, с которых начинают разыгрываться фишки по диаграммам переходов - становится несколько. Ну и списков патернов (вместе с соответствующими Action) становится несколько - по списку на каждое состояние сканера.

Вот Вам пример про ЧЕСТНЫЙ комментарий.
Он в LEX-синтаксисе написан (там фигурные скобки обладают совсем другим смыслом), поэтому поясню.
В состоянии сканера comment работает всего ДВЕ лексемы: двухсимвольная "*)", и односимвольная - sym, типа любой символ. По честному любой, а не по Легалову: тут играть, тут не играть, а тут рыбу заворачивали...
Какая сработает? Да по правилу СДЛ. По срабатыванию первой - вернется сканер в исходное состояние, по второй (один символ) - просто пропустит. И опять - первая или вторая?
Вот и все!!!
Все точно и ясно, и точно и быстро, и глухо как в танке. Ошибиться невозможно.
Вот я и хотел посмотреть на "честный" патерн для комментария, без такой удобной "фишки-состояний"
Я себе его примерно представляю - именно из него ведь код процедуры comment сделан, по правилам Вирта. А код-то Вы видели, и обсуждали в отдельной теме

Вернуться к началу

igor

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 07:49

Зарегистрирован: Вторник, 13 Ноябрь, 2007 20:38
Сообщения: 1056

Galkov оказался такой же упёртый как и я!

("Впэртый" (С) Владимир Лось)

Имхо, в случае с Обероном на "игровой" доске стоит ОДНА фишка. Сканер "за один ход" считывает только ОДИН следующий символ и переводит фишку на другое "игровое поле" (состояние автомата) БЕЗВОЗВРАТНО. Перебором вариантов (для которых и нужна горсть фишек) сканер не занимается, в виду детерминированности синтаксиса.

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 08:54

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

Ну да: "Этого не может быть, потому-что этого не может быть никогда"
Вот я привел выше принцип формализма...
Пишем патерны, снабжаем каждый своими акциями

Рисуем, и смотрим. Показываем пальцем: где, почему, и сколько фишек. Делов-то

А :?:

Вернуться к началу

igor

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 09:48

Зарегистрирован: Вторник, 13 Ноябрь, 2007 20:38
Сообщения: 1056

Galkov писал(а):

Ну да: "Этого не может быть, потому-что этого не может быть никогда"

Все необходимые доказательства и примеры я привёл выше в этой теме. Другое дело, что они не были услышаны. Но тут я уже не виноват.

Вернуться к началу

Galkov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 13:41

Зарегистрирован: Вторник, 11 Август, 2009 11:44
Сообщения: 516
Откуда: Бердск

Неправда Ваша.
Это не доказательства, а витание в облаках было (основанное на понимании диаграмм Вирта в стиле Легалова).
Рассуждения словесами.
А доказательства - это применение формальных правил, к формальным же исходным данным.
Словеса - это субъективно, одни и те же слова, каждый человек может понять по разному.
Формализм - это объективно. Его могут применять совершенно разные люди с одинаковым результатом.

Зря Вы думаете, что не были слова услышаны. Еще как услышаны. Просто словам не верю я безусловно, а Думаю над ними.
И книжки не просто читаю, а именно с большой буквы: Читаю.
Тут уж извините, от своего права Думать - я не откажусь, какие бы Великие мне не рассказывали, что "сканер, это просто для удобства"
Вот мне показалось (т.е., точно утверждать не буду), что слова, Вами произносимые - ну порой просто цитаты из Легалова.
Ноги бы ему за это повыдергивать...

Собственно, "детерминированность" - это одно слово вырванное из контекста.
А контекст был такой:

Цитата:

Мне даже кажется, что наиболее важной причиной выделения лексера в отдельную функциональность - это оставить детерминированность парсеру. Хотя тот уже не просто автомат, а как бы - "стековый". Вот парсер - тот ДА, все альтернативы распознает с первой лексемы, вся недетерминированность сосредоточена в лексере.
Грубо говоря, борьба идет за единичку в определении грамматики: хоть LL(1), хоть LR(1).
По-моему, это более значительная причина, чем указанная Виртом "независимость от конкретного представления ..."

Так я и сейчас придерживаюсь точно такой же точки зрения.
Причем, еще более уверенно. Потому-что еще больше об этом думал.
Если для парсера случится "нам угадать не суждено, как наше слово отзовется" - то будет полный кердык. Как минимум - другая грамматика.
А вот если сканер с первой буквы "не угадает" - никакого криминала.
И именно потому, что "никакого криминала" - и пишут патерны на заморачиваясь на "детерминированность"
Могли заморачиваться. Приводил Вам пример для HexNumber и CharConstant в Дельфи - с первого символа распознаются.
Но не заморачиваются!!! Потому-что проблем-то технических никаких НЕТ (в отличие от парсера - там ЕСТЬ), а человеку понятнее.

igor, если Вы не вереите этому сверх-очевидному факту - ну мне же не жалко :!:

Не у меня же, в конце-концов, проблемы с пониманием...
И не упертый я, а - думающий.
И это не не я говорю бред, а - Вы (встречная просьба извинить за прямоту)

Вернуться к началу

Peter Almazov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 14:07

Зарегистрирован: Пятница, 24 Апрель, 2009 16:28
Сообщения: 563
Откуда: Москва

Galkov писал(а):

Так я и сейчас придерживаюсь точно такой же точки зрения.
Причем, еще более уверенно. Потому-что еще больше об этом думал.

Если Вы уверены в своей правоте, зачем так много слов?
Предположим, Ваш оппонент согласится со всем - что это изменит?

Вернуться к началу

Peter Almazov

Заголовок сообщения: Re: Детерминированность лексики Оберона

Добавлено: Вторник, 09 Февраль, 2010 14:09

Зарегистрирован: Пятница, 24 Апрель, 2009 16:28
Сообщения: 563
Откуда: Москва

igor писал(а):

3. Натыкайте меня носом

в то место в моём файле, из которого следует, что хотя бы одно условие детерминированности нарушено.

Если в файл добавить лексемы > и >= , непонятно почему выкинутые, то FIRST(>)=FIRST(>=).

Вернуться к началу

Страница 7 из 9

[ Сообщений: 180 ]

На страницу Пред. 1 ... 4, 5, 6, 7, 8, 9 След.

Список форумов » Вопросы системного программирования » Технологии компиляции

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения