Главная > Распознавание образов > Лекции по теории образов: Регулярные структуры
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 9. Образы в математической семантике

9.1. Введение

В этой главе мы рассмотрим математическую семантику в свете нашей теории отображений между алгебрами изображений и формальными языками.

Алгебра изображений будет построена при помощи образующих, которые представляют отношения. Таким образом, мы подойдем к формальным языкам с семантической точки зрения. Затем алгебра изображений будет рассмотрена в терминах подобий, локальной и глобальной регулярности.

Семантическое отображение образует категорию в алгебраическом смысле слова, и мы изучим соответствующие морфизмы.

Будут представлены также стратегии построения семантических отображений, обладающих специальными свойствами, связанными с потребностью в памяти.

Теоретические рассуждения будут дополнены примерами и результатами машинных экспериментов.

9.2. Введение в математическую семантику

2.1.1. Может ли теория образов оказаться полезной в семантических исследованиях и поможет ли она в вопросах, касающихся того, как обучается семантике (должен обучаться) человек (машина)? Термин «семантика» возник сравнительно недавно, в XIX веке, однако сам этот предмет вызывал интерес у философов с незапамятных времен. На протяжении всей истории крупнейшие философы в той или иной степени уделяли внимание вопросу о том, как слова, предложения, грамматика и язык соотносятся с явлениями реального мира.

При рассуждениях обычно пользовались неформальными средствами, математика в явном виде не применялась.

2.1.2. В последнее время были сделаны попытки формализовать понятия семантики, в особенности эта тенденция проявилась в двух областях: лингвистике и вычислительной математике.

В формальной лингвистике это как будто началось тогда же, когда начались исследования, связанные с формализацией синтаксиса в 60-х годах.

Наиболее ранняя из известных нам работ — это (Katz, Fodor, 1963), где семантические структуры были преобразованы в то, что теперь называется -деревья — это формальные конструкции, отражающие смысл лингвистических высказываний. Лингвисты продолжили исследования в этом направлении, и в результате появилась обширная литература. Важным понятием в этой литературе является семантическая сеть. Как правило, выбиралось некое подмножество естественного языка, обычно английского, и производилась попытка формализовать его семантику машинной программой. Ожидалось, таким образом, что логическая строгость, требуемая при составлении машинной программы, поможет выявить принципиальные трудности. Следует отметить важную работу (Woods 1970). Интересное описание этого подхода читатель найдет у Симмонса (Simmons 1973).

2.1.3. Исследования, о которых мы говорили выше, в значительной степени пересекались с работами в области искусственного интеллекта, однако акценты были несколько различными. В исследованиях, проводившихся в рамках искусственного интеллекта, цель часто заключалась в том, чтобы создать программу, отвечающую на произвольные вопросы в пределах некоторой достаточно ограниченной предметной области. К этой категории исследований принадлежит и хорошо известная работа Винограда (Winograd 1972).

Во многих работах этого направления делалась попытка не только создать машинную программу, иногда предназначенную для практических целей, но также продвинуться в понимании семантических структур. Несмотря на многочисленные скептические отзывы об этих попытках, мы полагаем, что некоторые исследования, в том числе упомянутые нами выше, действительно улучшили наше понимание семантики языка.

2.1.4. Насколько известно автору, математическая формализация применялась лишь в нескольких работах. В одной из этих работ (Sandewall 1971) в роли математического инструмента выступало исчисление предикатов.

В 1977 г. автор совместно с П. Вегнером организовал семинарские занятия по семантике в университете Брауна. Во время этих занятий была рассмотрена обширная литература, преимущественно статьи из журналов по лингвистике и вычислительной математике. Попытки математической формализации встречались нам очень редко, и вообще математики как таковой в этих работах было мало.

Одна из причин, почему математика применялась так мало, вероятно, заключалась в том, что не было найдено математической теории, пригодной для анализа семантических структур. Мы полагаем, что теория образов представляет собой подходящий инструмент. В этом разделе мы продолжим исследования, начатые во втором томе в разд. 2.4. Они были также освещены в работе (Grenander 1978b).

В частности, будет сделана попытка показать, что математическая семантика может быть выражена в терминах отображений пространств конфигураций и алгебр изображений. Подобные отображения составляют основу теории образов, их роль настолько же велика, как роль морфизмов в алгебре.

2.2.1. В какой-то степени мы будем следовать подходу Витгенштейна 1), изложенному в его «Логико-философском трактате» (Wittgenstein), однако наши рассуждения, разумеется, будут выдержаны в формальном математическом стиле. В последующих

-абзацах мы напомним читателю о некоторых положениях Витгенштейна, имеющих отношение к рассматриваемым нами вопросам.

С одной стороны, высказывания Витгенштейна стимулируют размышления, с другой стороны, они зачастую весьма туманны, и эта туманность, по-видимому, намеренная. Например, когда он говорит о «предметах», остается не совсем ясно, имеет ли он в виду материальные объекты или данные, поставляемые наблюдениями (см. Примечания А).

2.2.2. Мир состоит из фактов. Факт — это некоторый набор объектов, связанных какими-либо отношениями. Объекты представляют собой материальную основу мира. Некоторые факты могут состоять из других фактов, но существуют и неделимые (одиночные) факты. Последние мы будем называть атомарными фактами.

2.2.3. Будем обозначать множество объектов через Т, а множество операций — через О. Операции, воздействуя на объекты, порождают простые факты. Операция может воздействовать на один объект, или на два, или на три и т. д. Можно сказать, что она представляет собой «-местную функцию, или функцию от аргументов.

Если применять все операции ко всевозможным комбинациям объектов, то мы получим множество атомарных фактов. Витгенштейн, возможно, не предполагал, что «-местная операция

может применяться к любой комбинации из объектов. В таком случае операции представляют собой частичные функции.

Другое множество операций воздействует на атомарные факты из и в результате появляются составные, или сложные, факты. Множество всех таких фактов служит онтологической основой для понимания мира.

2.2.4. Конечно, Витгенштейн не занимался формализацией подобного рода; вероятно, он был бы против любой попытки формализации. Это привнесло бы слишком большую точность, при этом пропала бы «многомерная» туманность.

2.2.5. Изображение — это модель мира, в которой элементы, соответствующие объектам, группируются в структуры. Изображение также представляет собой факт.

Высказывание состоит из имен. Это факт, его элементы связаны друг с другом некоторыми отношениями, и это также изображение возможной комбинации объектов.

В некотором смысле структура изображения должна быть «конгруэнтна» реальной ситуации, которую она представляет. «Конгруэнтность» в данном случае не означает тождественности, соответствие здесь может быть более тонким.

Это соответствие, если бы его можно было сформулировать точно, придало бы смысловое значение высказываниям. Витгенштейн, вероятно, не имел в виду обычного естественного языка, когда говорил о высказываниях. По всей видимости, он подразумевал «научный язык», или язык, каким он должен был бы быть.

2.2.6. Читатель, знакомый с теорией образов, заметит сходство между некоторыми из ее основных концепций, с одной стороны, и положениями Витгенштейна — с другой. Образующие соответствуют объектам и операциям (операторам), Операторы в О обладают определенной арностью, т. е. количеством аргументов. Конфигурации соответствуют фактам, и соединения, допускаемые в пространстве конфигураций, соответствуют операторам в Совокупность это пространство конфигураций.

2.2.7. В разд. математическая формализация семантики будет проведена через отображения между двумя алгебрами изображений. Философские положения трактата Витгенштейна в какой-то мере повлияли на характер этой формализации.

В более поздний период своей жизни Витгенштейн отказался от «Логико-философского трактата», работы, которую он написал в молодые годы. В дальнейшем мы узнаем кое-что и из более поздних работ Витгенштейна в связи с вопросом об обучении семантике.

2.3.1. Наш наблюдатель, способный высказываться и воспринимать высказывания, будет погружен в мир сенсорных наблюдений. На основе этих наблюдений, а также с помощью априорных знаний он будет делать высказывания или воспринимать высказывания (утверждения) о состоянии окружающего мира, выраженные, как мы будем предполагать, на некотором формальном языке Поскольку наш подход чисто абстрактный, нам не требуется указывать, будут ли эти высказывания повествовательными, утвердительными или же они будут иметь форму вопросов, выражающих оттенки сомнения, будут ли это суждения, повелительные высказывания и т. п.

Тот факт, что мы будем пользоваться примерами, где высказывания будут выглядеть как простые предложения английского языка, отнюдь не свидетельствуют о том, что мы собираемся моделировать семантику английского языка или даже простого его подмножества. Наша цель заключается в том, чтобы понять определенные математические феномены, а не лингвистические. Если эта цель будет достигнута, то можно надеяться, что со временем результаты подобных абстрактных исследований можно будет применить в лингвистике как таковой, однако сейчас говорить об этом слишком рано.

2.3.2. Высказывания наблюдателя должны соответствовать его восприятию мира. Его восприятие, представленное формально как алгебра изображений, будет предметом обсуждения в разд. 9.3. Алгебра изображений должна быть математически последовательной, т. е. непротиворечивой, как это будет показано в частном случае, но она не обязательно должна быть «действительным» или «истинным» описанием мира.

Таким образом, мы оперируем на трех уровнях. «Истинный» мир, формальное описание картины, которую видит наблюдатель, и, наконец, лингвистические высказывания по поводу этой наблюдаемой картины. Мы ограничимся изучением взаимоотношений между двумя последними уровнями.

2.4.1. Все естественные языки содержат в себе некоторые неоднозначности. Об этом уже говорилось так много, что нам нет необходимости останавливаться на этом факте и обсуждать его подробно. При помощи контекста и при проникновении в глубинную лингвистическую структуру от неоднозначности, по-видимому, можно избавиться. Так это или не так, но мы просто потребуем, чтобы грамматически правильные высказывания имели единственное семантическое значение.

Это позволит нам сосредоточить внимание на исследовании подобных семантических отображений, их математическом построении и анализе их свойств, и в особенности изучить вопросы, связанные с потребностью в памяти, и соответствующие ограничения.

Мы займемся этими исследованиями в разд. 9.6-9.7. В заключительных разделах этой главы мы рассмотрим вопросы обучения семантическим отображениям.

2.4.2. К какой бы области ни применялся математический аппарат, всякий раз требуется вводить упрощения, в некоторых случаях весьма существенные. Это положение остается справедливым и в нашей ситуации; мы сможем проанализировать некоторую узкую область с той или иной степенью глубины, но только за счет ограничительных предположений. Мы надеемся, что абстрактный анализ поможет выявить логическое существо проблемы с максимальной возможной ясностью. При этом мы избегнем туманных, слишком общих положений и вскроем скрытые факторы, но за счет некоторого ограничения в диапазоне результатов.

2.4.3. Чтобы найти понятия и концепции, подходящие для математического анализа, мы постараемся рассуждать в диалектической манере, приводя аргументы как за, так и против тех или иных понятий и предположений. Таким путем мы придем к формализации, которая, как мы надеемся, окажется полезной в нашей дальнейшей работе.

2.5.1. Абдукционная машина, рассмотренная в работе (Grenander 1978b, гл. 7), последовательно порождает синтаксические гипотезы, проверяет их, а затем либр принимает их, либо отвергает. В некоторой хорошо определенной лингвистической ситуации она, как выяснилось, приходит в конце концов к системе правильных гипотез.

В одной из ранних теорем (см. примечания Б) автор показал, как синтаксическая абдукция может быть реализована для языков весьма общего типа. Однако эта теорема интересна лишь с теоретической точки зрения, поскольку соответствующий алгоритм будет очень медленным, что объясняется его слишком большой общностью, в нем не используются конкретные свойства структур. Другой недостаток заключается в том, что результаты обучения не накапливаются с опытом, другими словами, обучение как бы не аддитивно. Абдукционная машина, о которой мы говорили в начале этого подраздела, представляется здесь более подходящим средством.

2.5.2. Однако можно ли построить абдукционную машину для порождения семантических гипотез? В дальнейшем мы покажем, что математически это сводится к установлению отношения между конечным множеством (состоящим из продукций для и морфизмами категории. Насколько известно автору, эта математическая проблема до настоящего времени никем не изучалась; мы займемся ею в разд. 9.8.

<< Предыдущий параграф Следующий параграф >>
Оглавление