ilovb писал(а):
Так вот та информация, которая была потеряна при написании Петей слова, и заново восстановлена при прочтении Васей - это и есть смысл. Понятно, что у Васи образ не соответствует полностью образу Пети. Но то, что совпало - это смысл.
Здесь, скорее, "осмысленность". Вася заимел себе какую-то цель (будущий "смысл" как некую функцию, предназначение), и для нее он получает информацию, которую оценивает для себя (субъективно) и решает, как там получается "осмысленность <-> бессмысленность".
ilovb писал(а):
Ну и из этого следует, что делать чисто языковые системы для поиска смысла в текстах - не шибко умное занятие.
Найти смысл в тексте может только мыслящий субъект (в том числе искусственный, да).
Такой субъект должен:
1. строить модели в памяти аналогично человеку (трехмерные визуальные образы, например)
2. взаимодействовать с реальностью подобно человеку (те же органы чувств как минимум)
Так в этом и вся засада-то. У нас, человеков, даже то, что в ИИ называют "распознавание образов", от мышления неотделимо, принципиально всё по-другому работает. А реализовать то, что здесь многократно указывалась как "пресуппозиция" и поддерживать "презумпцию" -- ещё та задача, толком непонятно вообще как ее решать.
Здесь в начале темы была статейка
"Ограничение классических подходов к распознаванию образов" , начало 2000-х, но актуальность всё та же.
Парочка выдержек:
Цитата:
1. Неполнота классической схемы распознавания образов
Классическая схема распознавания, использующая понятия признаков, их комбинирования и последующей классификации, использует несколько неявных, нигде не декларируемых допущений, сводящихся к следующему:
в каждый данный момент воспринимается лишь один образ, при этом уровень информации, связанной с фоном, либо незначителен, либо мы имеем простые инструменты для отделения той части информации, которая связана с фоном, от информации о признаках;
задача субъекта восприятия (человека или робота) сводится к отнесению объекта к одному из классов и ни к чему более.
действительности ни одно из этих допущений не выполняется. Мы (или робот) воспринимаем окружающий мир, содержащий множество объектов. В зависимости от задач одни из этих объектов мы выделяем, другие воспринимаем как фон, и задача распознавания в этом случае значительно сложнее классической схемы: а) мы должны выделить из шумов информацию о признаках множества распознаваемых объектов, при этом заранее не очевидно, что в сигнале считать шумом, а что полезной информацией; т.е. какие признаки выделять из шума. Очевидно, эта задача имеет множество возможных решений и мы должны выбрать нужное; б) мы должны каким-либо образом отнести признаки к какому- то объекту, причем и без численных оценок очевидно, что комбинаторным путем эту задачу не решить, и здесь необходимо использование некоторых принципов, резко ограничивающих число возможных вариантов; в) мы должны далее эти объекты распознать, выделить из них интересующие нас и соотнести их с нашими проблемами.
По поводу второго допущения: распознавание образов не является независимой процедурой, оно встроено в схему восприятия и мышления. И в этой схеме распознавание составляет только часть задачи. Вторая часть задачи – на фоне некоторой относительно инвариантной части выделить особенности образа или ситуации, характеризующие его здесь и сейчас, и использовать эти конкретные особенности в мышлении. Например, когда мы встречаем старого знакомого, то мы не просто относим его к одному из классов, а определяем его настроение, узнаем о проблемах и т.д. И в конце встречи мы не относим полученный нами новый образ к какому-то существующему классу – это невозможно из-за чисто комбинаторных соображений, а конструируем новый образ, состоящий из двух частей: некоторого инварианта I и уникальной переменной части delta, которую мы составляем из элементов наших впечатлений и языка (по сути, понятий, которые тоже можно представить как некоторый класс образов). Таким образом, результат восприятия V по отношению к отдельному выделенному нами образу более правильно выражать формулой:
V = I + delta.
Подчеркнем принципиальную важность представления образов в указанной форме. Работа мышления и интеллекта в значительной мере определяется именно уникальной, а не инвариантной частью воспринимаемых образов, поэтому, не учитывая ее, мы, по сути, выбрасываем наиболее важные слагаемые мышления и интеллекта. Становится очевидным, что только по одной этой причине (неучете уникальной составляющей образа) классическая схема распознавания не может быть использована для моделирования работы интеллекта. Неучет уникальной составляющей образа приводит к так называемому алгоритмическому или автоматному подходу, который эквивалентен работе нервной системы на уровне насекомого. Представляется, что большинство специалистов, занимающихся распознаванием образов согласятся, что разработанные в настоящее время искусственные распознающие системы в лучшем случае достигают уровня насекомого...
И, пожалуй, ключевое:
Цитата:
3. Неадекватность классической схемы при использовании понятия "образ" и его компонентов
В процессе распознавания по классической схеме в отношении распознаваемого образа используется несколько допущений (их можно назвать также принципами, подходами, схемами и т.п.), в частности, следующие: – на пути между исходной «сырой» информацией и конечным распознанным образом вводится некоторый промежуточный этап упорядочения исходной информации, называемый признаком или набором признаков; – распознавание осуществляется по схеме: получение изображения, выделение из него признаков, получение образа как комбинации признаков, процесс отнесения образа к одному из классов (назовем это распознаванием снизу вверх); – во всех случаях как набор распознанных признаков, так и получаемый из него образ может быть распознан единственным правильным способом. Насколько обоснованы эти допущения? Рассмотрим первое допущение. Как следует из литературы, «задача выбора признаков… понимается как преобразование (отображение) исходного пространства в пространство признаков меньшей размерности без потери информации» [14, c. 8], т.е. с помощью признаков на первом этапе существенно сокращается как описание образа, так и последующее оперирование информацией относительно образа. На втором этапе признаки используются для построения образа в виде набора признаков, и далее происходит собственно распознавание. Если второй этап любовно, тщательно и детально описан многочисленными авторами, то по поводу первого пишут мало и в основном в терминах целей, а не алгоритмов. Неудовлетворительное состояние этого вопроса отмечается, в частности, в работе [2, c. 152]: «Хорошо мы научились решать задачи, в которых еще до обучения так или иначе уже построено пространство признаков или задан словарь языка… И чем удачнее (человеком, а не машиной) выбраны признаки, тем компактнее образы, а значит, тем успешнее решается задача обучения… Но если признаки заранее не заданы или выбираются случайно и неудачно, то все методы теряют работоспособность, их надежность и качество катастрофически снижаются… Итак, мы еще не научились главному – автоматизации процесса построения таких пространств изображений объектов, в которых объекты были бы компактными». Чтобы понять причины недостаточного внимания к проблеме выделения признаков, рассмотрим распознавание образов на понятийном уровне у человека. Очевидно, что процесс распознавания в этом случае состоит, во-первых, более чем из двух уровней, а во-вторых, на всех вышестоящих уровнях мы работаем, по сути, не с признаками, а с понятиями, которые более правильно представлять как образы, а не как признаки. Например, когда мы распознаем человека, согласно классической схеме мы сначала распознаем признаки. Вчастности, пусть одним из этих признаков будут очки. Но образ очков сам по себе достаточно сложен, и в другой задаче распознавания очки могут выступать в качестве самостоятельного распознаваемого образа, содержащего подобразы, например, линзы и т.д. Следовательно, по крайней мере на уровне понятийного мышления схема распознавания выглядит не как цепочка признак – образ, а как образ 1-го уровня – образ 2-го уровня … – конечный образ. Таким образом, введение понятия признак – это некий интеллектуальный фокус (по крайней мере на уровне понятийного мышления), с помощью которого мы из рассмотрения процесса распознавания выбрасываем собственно распознавание и оставляем более понятную задачу манипулирования образами различных уровней (более понятна она в том случае, когда мы выбрасываем из этой схемы выходы на мышление, т.е. переменную часть образа, см. раздел 1). Эти рассуждения, по-видимому, менее применимы к более простым случаям распознавания, например, речи или несложных изображений. Связано это с тем, что в этом случае в качестве признаков или промежуточного этапа на пути к признакам используются достаточно несложные инварианты (непроизводные элементы по Д. Марру [15]), для которых разработаны алгоритмы получения их из исходной «сырой» информации. Теперь рассмотрим последовательность распознавания: исходная информация – признак – образ. Как указано выше, следуя логике существующего подхода к распознаванию, для сложных случаев ее более правильно выражать цепочкой: исходная информация – образ 1-го уровня… – конечный образ. Но если исходить из экспериментальных данных, то у человека, по крайней мере, при зрительном восприятии, работает совершенно другая схема. В этой схеме наше распознавание сцены в целом базируется прежде всего на некотором целостном понимании, которое в психологии принято называть гештальтом. «Главное эмпирическое существо открытого гештальтизмом феномена целостности перцептивного образа… заключается в доминировании целостной структуры перцепта над восприятием его отдельных элементов» [16, гл. 9]. Может последовать возражение, что эти выводы относятся к процессу мышления – стадии, следующей за распознаванием, когда мы уточняем содержание сцены. Однако имеются веские нейрофизиологические данные, свидетельствующие, что и сам процесс распознавания образов осуществляется по гештальтной схеме. Так, в работе [17] было показано, что разные пространственно -частотные компоненты сложного изображения у живых существ выделяются и описываются в зрительной коре независимо работающими каналами. В дальнейшем в работах В.Д. Глезера [18] и других исследователей была предложена и экспериментально обоснована схема с использованием фурье-преобразования. Низкочастотному фурье-преобразованию соответствуют крупномасштабные детали изображения, высокочастотной части – мелкие детали. Экспериментально было доказано, что крупномасштабные детали человек воспринимает быстрее, чем мелкомасштабные (см. детальный обзор и анализ этого вопроса в [18, гл. 3]). Соответственно и распознавание начинается с крупных деталей, описывающих сцену в целом, а не отдельные ее признаки. Этот вывод является простым следствием из законов передачи информации: малое разрешение требует меньше информации, чем высокое, а в связи с невысокой скоростью передачи информации у человека (примерно 10 2 импульсов/сек на одно нервное волокно) или большим ее объемом, информация о деталях изображения воспринимается распознающей системой (мозгом) заметно позднее, чем очертания сцены в целом. Таким образом, распознавание образов у человека правильнее было бы описывать следующей схемой: исходная информация – образ в целом – уточнение деталей (признаков) образа (распознавание сверху вниз). В более сложных случаях, учитывая, что человек в состоянии оперировать одновременно с 7 ? 2 объектами, схема распознавания, по-видимому, усложняется и выглядит примерно следующим образом: исходная информация – одновременное выделение и предварительное распознавание нескольких образов – одновременное уточнение деталей каждого из образов и распознавание сложного образа или придание смысла сцене (сочетание элементов распознавания сверху вниз и снизу вверх). С учетом состояния искусственных и естественных распознающих систем представляется, что нет и не может быть единой правильной схемы распознавания образов. Возможно использование самых различных схем, причем это определяется предметной областью, задачами исследования и имеющимся инструментарием. Основанием к выбору таких схем должна быть отсутствующая в настоящее время (см. раздел 2) общая теория преобразования и передачи информации между представлениями и языками различного уровня и происхождения. В заключение этой темы добавим, что экспериментальные данные [17-19] показывают, что в достаточно сложных распознающих системах, в частности у человека и высших животных, используется одновременно несколько распознающих схем. Рассмотрим теперь допущение о единственности распознаваемого образа или образов. Очевидно, что это допущение существенно опирается на допущение о единственности классификации. Не оспаривая этого допущения для некоторых простых случаев, заметим, что в сложных случаях оно, как правило, не выполняется [20, гл. 2]. Например, специалистам хорошо известно, что при описании социально-экономических процессов в зависимости от поставленных целей возможны самые различные системы классификации. По-видимому, этот вывод можно распространить на все сложные системы и на все неполные и неточные описания, т.е. за исключением специальных случаев, практически на все, что мы используем для описания и представления информации на понятийном уровне. В таких случаях задача распознавания дополняется этапом выбора классификационной системы. Истины ради следует заметить, что даже у такой совершенной распознающей системы, как человек, процесс классификации сложной информации осуществляется не в процессе распознавания, а в процессе анализа информации, т.е. мышления. Здесь мы еще раз убеждаемся, что грань между распознаванием и мышлением очень тонкая и мы не можем рассматривать распознавание без мышления. Более того, сам процесс мышления, оказывается, также может быть встроен в процесс распознавания. Таким образом, отметим в заключение данного раздела, что приведенные в начале раздела допущения классической схемы распознавания либо применимы только для наиболее простых частных случаев (использование единственной классификации), либо работают с точностью до наоборот (схема распознавания снизу вверх), либо приводят к подмене задачи распознавания (введение понятия «признак» без процедур его получения).