Главная > Распознавание образов > Лекции по теории образов: Регулярные структуры
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1.2. Примеры регулярных структур

Для того чтобы понять общее, мы будем изучать частное. Начнем мы с одного упорядоченного явления, которое заставляло первобытного человека поражаться и размышлять: движение Солнца, Луны и планет вокруг Земли и относительно звезд.

Еще в большинстве ранних культур было замечено, что звезды можно считать фиксированными, даже прикрепленными к какой-то невидимой сфере, и вращающимися относительно оси, проходящей через Полярную звезду. Движение Солнца и Луны также представлялось как круговое относительно Земли как центра. Действительно, эти представления прекрасно согласуются со взглядами Платона, считавшего круговое движение единственно идеальным, но проблема-то, однако, на самом деле состояла в том, чтобы привести эту точку зрения в соответствие в внешне нерегулярным возвратно-поступательным движением других планет. Наблюдая, скажем, Юпитер и нанося его последовательные положения на звездную карту, можно обнаружить, что эта планета время от времени изменяет направление своего движения: имеет место обратное движение.

Чтобы учесть возмущающие аномалии такого рода, классическая астрономия была вынуждена модифицировать чисто пифагорову модель Вселенной, предполагавшую существование нескольких сфер, помещенных внутри друг друга, перейдя к представлениям, которым было суждено стать моделью, описанной Птолемеем в его «Альмагесте». Идея состояла в сохранении кругового движения в качестве основного, но допускалось объединение таких движений в сложные движения. Окружности оказываются связанными между собой так, что некоторая точка, принадлежащая одной из них, будет двигаться по эпициклоиде. Таким образом, результирующее движение будет иногда реализовываться как попятное движение, что объясняет аномалию.

Птолемееву вселенную можно представить в виде схемы, приведенной на рис. 1.2.1 (см. примечание 1.2.А); здесь Земля помещена в центре, Луна и Солнце вращаются вокруг нее по окружностям со

слабым эксцентриситетом, а пять планет движутся по эпициклоидам. Эта красивая модель Вселенной дала возможность астрономам давать с определенной точностью численные прогнозы. По мере повышения точности астрономических наблюдений приходилось уточнять и птолемееву модель, чтобы она согласовывалась с новыми данными, и достигалось это при помощи введения в модель дополнительных окружностей. Последний вариант модели включал 39 окружностей.

Рис. 1.2.1

Птолемей сформулировал свои взгляды в «Альмагесте», указав, что его целью было показать, что все явления, происходящие на небе, есть результат равномерного кругового движения. Он задался целью доказать, что кажущиеся нерегулярности в поведении планет можно объяснить при помощи таких движений и что исключительно подобного рода движения присущи божественной природе Вселенной. В этом заключалась тогда основная задача математики, опиравшейся на философию.

В процессе эволюции этих моделей от простейшей, приведенной на рис. 1.2.1, к более сложным основная идея, очевидно, заключалась в объединении отдельных заданных движений — круговых движений — друг с другом. Равномерное круговое движение определяется плоскостью, на которой оно реализуется, центром окружности, находящимся на этом плоскости, ее радиусом и ее угловой скоростью (всего семью параметрами). С другой стороны, все круговые

(кликните для просмотра скана)

движения связаны друг с другом простыми пространственными и временными преобразованиями, так что можно было бы, вероятно, говорить о круговом движении как о структурном элементе, используемом для описания соответствующих регулярностей поведения небесных тел.

При введении в систему новой окружности ее центр размещается на другой окружности. Действие полученной таким образом системы соответствует тому, что может видеть наблюдатель, находящийся на Земле, по мере течения времени. Его представления о планетной системе, хотя и подтверждаемые наблюдениями, принципиально ошибочны как в отношении действительного ее устройства, так и в отношении тех логических построений, которые служат ему моделью. Эти различия могут казаться схоластической казуистикой, но скоро мы убедимся в том, что они будут возникать в различных формах снова и снова. Это приведет нас к введению ряда формализованных понятий, которые будут играть важную роль в нашем математическом изучении регулярности.

Можно сказать, что круговые движения являются атомами эпициклических моделей Вселенной. Согласно атомистическим представлениям, восходящим еще к Демокриту и Эпикуру, материя состоит из атомов, которые сами уже являются неделимыми. Соединение атомов друг с другом образует вещества и смеси. Значительно позднее этому положению была придана количественная формулировка, основанная на установлении фиксированных соотношений весов веществ, образующих химическое соединение. Вода должна содержать водород и кислород в соотношении 1 : 8, аналогичные фиксированные соотношения имеются и для других химических соединений (закон Пруса).

Дальтон сформулировал это положение, используя понятия атомов и относительных атомных весов. Химические соединения были разделены на простые — содержащие атомы только одного типа, двойные — содержащие два атома, тройные, четверные и так далее. Введя символические изображения для веществ, он применял простые диаграммы для описания соединений, как это показано на рис. 1.2.2 и в табл. 1.2.1, взятых из работы (Dalton, 1808).

Таблица 1.2.1 (см. скан)

(см. скан)

Приведем цитату из этой же работы: «Мельчайшие частицы всех однородных тел совершенно одинаковы по весу, очертаниям и т. д.» Другими словами, «любая элементарная частица воды подобна всякой другой элементарной частице воды; любая элементарная частица водорода подобна всякой другой элементарной частице водорода и т. д.». Атомы любого заданного типа имеют различную локализацию, но обладают одними и теми же внутренними свойствами. Если два предмета, сделанные, скажем, из железа, являются различными и выглядят различными, то, согласно приведенной точке зрения, это происходит потому, что различаются соответствующие конфигурации, а не потому, что каким-то образом различается природа их атомов.

Изображения, помещенные на рис. 1.2.2, наглядно представляют комбинации атомов, они подготовили почву для современьой

системы химической нотации, предложенной Берцелиусом. Эта нотация позволяет придать выразительную форму законам, определяющим состав веществ, что позволяет компактно представить строение молекул.

Регулярности строения молекул проявляются еще в большей степени при использовании структурных формул, указывающих валентность каждого атома. Последняя представляет собой число связей, образуемых одним атомом в определенных химических соединениях. Так, метан, например, имеющий эмпирическую формулу , может быть представлен структурной формулой (1.2.1(a))

в данном случае валентность атома водорода равна единице, а валентность атома углерода — четырем. В структурной формуле бензола атомы имеют те же валентности, но размещены иначе (1.2.1 (б)).

В структурных формулах мы впервые встречаемся со случаем, когда топология структуры связей предоставляется в явном виде. Возвращаясь к пройденному, мы обнаруживаем, что топология соединения «атомов» присутствовала также и в наших предыдущих примерах, но не столь отчетливо. В моделях с эпициклоидами, например, различные орбиты соединялись друг с другом в определенном порядке, что можно считать топологией системы. Начиная с этого момента, мы будем сознательно обращать внимание на топологию комбинаций, построенных из элементарных (непроизводных) объектов.

Рис. 1.2.3

Пусть эти объекты остаются по-прежнему физическими атомами. Обычный кристалл каменной соли, изображенный схематически на рис. 1.2.3, состоит из атомов натрия (черных) и атомов хлора (белых), образующих кубическую решетку. Если считать все атомы натрия «идентичными» и подобным же образом считать «идентичными» все атомы хлора, то структура не изменяется, если ее несколько сместить в каждом из трех ортогональных направлений. При этом предполагается, что кристалл бесконечен по всем направлениям.

Мы видим, таким образом, что в данном случае понятия «тот же самый» или «идентичный», которые вначале мы применяли лишь по отношению к отдельным атомам, теперь употребляются применительно

ко множеству всех атомов натрия, с одной стороны, и ко множеству всех атомов хлора, с другой стороны: перенос обеспечивает перемещение в новое положение кристалла в целом. Идеальный наблюдатель воспринимает кристалл после такого перемещения как неизменившийся, и то же самое справедливо для некоторых других видов движения в евклидовом пространстве.

Кристалл обнаруживает симметрию — классическое геометрическое свойство, играющее важнейшую роль в физике и химии, по крайней мере с девятнадцатого века. В формальном смысле симметрия означает, что некоторая структура инвариантна относительно некоторой группы преобразований. Эти преобразования могут быть заданы в пространстве или во времени, и понятие симметрии становится строгим лишь после того, как такая группа определяется.

Успех классификации кристаллических структур, основанной на 230 пространственных группах, продемонстрировал мощь идеи симметрии. Можно ожидать, что в исследовании общих проблем регулярности симметрия должна играть существенную роль. Следует отметить в то же время, что в нашем дальнейшем изложении симметрия будет выступать как некое следствие упорядоченности, т. е. будет скорее производным свойством, чем первичным.

Конечно, идеальный наблюдатель, способный точно «видеть», где расположены все атомы, — это чисто гипотетический наблюдатель. Детальное изучение сложных кристаллических структур стало доступно лишь после того, как фон Лауэ ввел в кристаллографию рентгеновские методы. Используя электромагнитное излучение с длиной волны, достаточно малой по сравнению с размерами атомной решетки, фон Лауэ «просвечивал» структуру и наблюдал результаты просвечивания. Полученный эффект (например, в том виде, как он выглядел на фотографической пластинке) довольно сложным образом связан с соответствующим типом кристалла. Следовательно, реальный наблюдатель имеет дело с изображением, требующим досконального анализа, расшифровки, прежде, чем можно будет получить ответ о расположении атомов.

Это препятствие является типичной особенностью многих научных закономерностей. Взаимосвязь между идеальной структурой, определяемой незыблемыми законами, и тем, что реально поддается наблюдению, может быть в высшей степени сложна, и поэтому математический анализ становится затруднительным. В любом варианте теории образов такая взаимосвязь должна приниматься во внимание.

Прежде чем закончить с этим примером, необходимо упомянуть об одной идее Маккея. Он рассмотрел случай, названный им обобщенной кристаллографией и связанный с изучением регулярных структур, обладающих большей, чем кристаллы, сложностью. Подробности читатель может найти в работе (Mackey 1974).

Исследование дискретного кристалла было основано на рассмотрении распространения волн определенного типа. Возьмем обратный случай — рассмотрим свойства волн в непрерывной среде и способ описания образов волнового характера.

Пусть объектом нашего рассмотрения служат волны в однородной среде, определяемые следующим волновым уравнением:

В этом уравнении эллиптический дифференциальный оператор второго порядка (скажем, с постоянными коэффициентами), с — константа, определяемая свойствами среды, и — некоторая скалярная величина типа давления. Координата может принимать значения в пространстве (колеблющаяся струна), (мембрана, производящая звук) или (колеблющийся воздушный столб). Элементарный способ решения уравнения (1.2.2) заключается в следующем. Попытаемся «разделить переменные»:

в результате уравнение (1.2.2) принимает вид

или, при введении постоянной X,

Величина будет представлять собой некоторую комбинацию выражений или, в наиболее интересном случае некоторую комбинацию из Все это означает, что необходимо найти собственные функции эллиптического дифференциальноо оператора учитывая соответствующие граничные условия. Обозначим их через соответственно собственным значениям

Следующим шагом является попытка получить разложение в ряд

где амплитуда, фазовый угол; при этом мы оптимистически предполагаем, что ряд сходится в некотором разумном смысле. Для того чтобы этот метод срабатывал, оператор естественно, должен иметь чисто точечный спектр, расположенный на отрицательной полуоси.

Оставим в стороне технические подробности — нас в данном случае интересует способ, при помощи которого временная

зависимость (1.2.6) сводится к записи в виде некоторой линейной комбинации тригонометрических функций. Последняя характеризуется частотами вида это гармоники колеблющейся среды. Для многих систем подобного типа соотношение (1.2.6) описывает все решения, хотя справедливо это утверждение лишь с некоторыми оговорками. Таким образом, анализ непрерывной системы ведется в категориях дискретного множества гармонических колебаний. Именно этот механизм придает традиционным музыкальным инструментам их характерное звучание в отличие, например, от электронных музыкальных инструментов.

Используя в качестве исходных некоторые элементарные функции, как, например, в данном случае тригонометрические функции можно воспроизвести на их основе обширный ансамбль временных образов. Процесс их порождения включает две разновидности вычислений.

Первая из них заключается в том, что мы просто берем одну из функций, скажем и изменяем ее амплитуду посредством умножения на некоторую скалярную величину, получая в результате Это изменение не является кардинальным, поскольку можно сказать, что все функции вида с фиксированным и произвольной амплитудой А «звучат» одинаково. Изменяется лишь интенсивность, но не качество.

Второй этап вычислений заключается в суммировании всех функций, полученных на первом этапе. Это означает, что из множества функций при помощи суперпозиции строится единственная функция; этот прием характеризует способ работы уха слушателя или, скорее, возможный способ его работы. При отсутствии шумовых возмущений второй этап вычислений представляет идеального наблюдателя в смысле аддитивности.

В историческом отношении эти математические идеи восходят к Фурье, хотя он развил их в ином физическом контексте — применительно к аналитическому изучению распространения тепла. Современникам должно было казаться парадоксальным его утверждение, согласно которому разложению в тригонометрический ряд поддается произвольная функция. Ныне, когда работа с ортогональными рядами стала делом обыденным, а понятие сходимости стало в духе функционального анализа менее жестким, идея полноты (систем функций) стала привычной.

Если задана некоторая -полная ортонормированная система скажем, при и -функция из класса то эту функцию можно описать с помощью некоторой последовательности коэффициентов Фурье вида

Знание такой последовательности определяет функцию однозначно почти всюду.

В принципе ничего не изменится, если системы функций обладают двойной, тройной или произвольного порядка индексацией. Необходимо лишь обладать уверенностью в том, что массив постоянных содержит также и информацию о значении индекса, соответствующего каждому элементу.

Пусть, например, необходимо представить некоторую функцию скажем, из класса таблицей значений где а обозначает элементы системы функций. В таком случае построение однозначного представления приводит, естественно, к требованию, чтобы все а, входящие в таблицу, были различными. В противном случае возникает линейная зависимость и, как следствие, неоднозначность.

Функции, таким образом, представляются числовыми массивами, форма которых должна определяться соображениями удобства и в которых должны использоваться только различные значения а. Здесь шла речь о классе однако можно воспользоваться и другими функциональными пространствами, в том числе более простыми, конечномерными, например с многочленами вплоть до определенного порядка. В любом случае мы имеем дело с некоторой регулярной структурой, хорошо известной в функциональном анализе.

Большинство из рассмотренных нами до сих пор регулярных структур обладают тем общим свойством, что они уже сформулированы на математическом языке и возникли либо в рамках собственно математики, либо пришли из наиболее математизированных наук — физики и астрономии. Прежде чем переходить к образам, возникающим в других естественных и гуманитарных науках, давайте подытожим рассмотренное нами выше.

Во-первых, очевидно, что все эти образы построены из некоторых элементарных объектов; т. е. атомистичны по своей природе. Сами эти объекты в различных конкретных случаях обладают различными математическими свойствами в соответствии с понятием «сходства» состоящем в том, что два объекта, в сущности, одинаковы, хотя не обязательно идентичны.

Во-вторых, эти объекты соединены друг с другом некоторым специальным способом, который иногда представляется схемой, описывающей топологию соединений. Существенность отдельных связей на множестве введенных соединений определяется специальными правилами. Можно сказать, что такие структуры являются комбинаторными.

В-третьих, комбинациям объектов, построенным в соответствии с определенными правилами, придается путем введения идеального

наблюдателя некоторая интерпретация. Интерпретация, или значение, комбинации зависит от точки зрения наблюдателя, т. е. от того, каким образом он ее воспринимает.

И наконец, в-четвертых, реальные образы могут концептуально отличаться от только что упомянутых идеальных и, следовательно, характер соответствия между реальными и идеальными образами должен быть точно определен.

Имея в виду эти четыре пункта, продолжим изучение образов, встречающихся в естественных науках. Как же описываются регулярности в биологии, например в ботанике? Что представляют собой логические принципы, лежащие в основе классификационных схем ботанической систематики? Эти вопросы возвращают нас в далекое прошлое (смотрите Примечания Г), и поэтому мы кратко остановимся на идеях Линнея и Адансона.

Divisio et Denominatio - расчленение и наименование — это основная задача биолога. Так считал Карл Линней, один из основателей систематической ботаники. Молодой Линней, подобно своим современникам, полагал, что растения, как и другие формы жизни, разделяются на виды, семейства и так далее в соответствии с установлением Творца в его плане Вселенной. Виды рассматривались как неизменные, данные раз и навсегда. Правда, позже, под влиянием своих наблюдений над гибридами, Линней отказался от этих «статических» взглядов и стал допускать возможность изменений. Во всяком случае, ботаник должен разделять растения на группы родственных особей. Критическим в этом утверждении является слово «родственный»: не очевидно, что оно должно значить или как его следует интерпретировать для того, чтобы разглядеть «божественный план творения».

Допуская, что эта возвышенная цель может оказаться для смертного недостижимой, Линней предложил более скромную систему — знаменитую линнеевскую классификацию по половым признакам. В этой классификации Линней разделил растения на 24 класса:

(см. скан)

(см. скан)

Эти 24 класса подразделяются в свою очередь в зависимости от числа столбиков пестика, чему соответствуют названия Monogynia (одно-пестичные), Digynia (двупестичные) и так далее.

Линней подчеркивал, что его система была искусственной, в основу были положены не подлинные связи между растениями, но скорее несколько известных и поддающихся наблюдению признаков, в частности особенностей органов размножения. Независимо от того, обнажала или нет эта система классификации истинную суть дела, она оказалась очень полезной, и лишь немногим другим системам в естественной истории удалось добиться того же.

Основополагающая идея в классификационных схемах такого типа заключается в последовательном расщеплении классов в соответствии со значениями, принимаемыми определенными признаками, например, числом тычинок. Получающиеся в результате осуществления этого процесса классы, упорядочения и т. п. связаны друг с другом отношениями включения, и если при расщеплении пересечения классов исключены, то в результате получается топология, представляющая собой либо дерево, либо некоторое множество непересекающихся деревьев, т. е. лес.

Рассматривая эту проблему, важно также выяснить и то, каким образом ботаники определяют или выделяют вид. Можно взять

какое-то определенное растение и указать, что оно является типичным представителем данного вида. Группировки, относящиеся к более высоким уровням иерархии, такие, как род и семья, задаются с помощью типичного представителя, определяемого через уже введенные группировки низших порядков.

Образец или какая-то разновидность его копии, скажем рисунок или фотография, используются для того, чтобы охарактеризовать некоторую группу. Этот прием, однако, не следует понимать буквально: речь не идет о точном числе листьев, длине ножки или конкретной конфигурации корневой системы — не это важно. Как раз наоборот, ботаник использует свой опыт для того, чтобы выбрать определенные свойства, которые он считает существенными. Ими могут оказаться топология размещения цветков или качественная оценка формы листьев. В сущности, это лишь учет того факта, что биологическая изменчивость влияет на некоторые признаки таким образом, что они не могут составить основу для классификации, в то время как другие признаки — часто это признаки, имеющие качественный характер, — оказываются более постоянными или инвариантными.

Эффективность подобной классификационной схемы зависит от выбора признаков, используемых для разделения. Эти признаки можно рассматривать как непроизводные элементы, порождающие разбиение условного ботанического мира. Некоторая комбинация признаков, представленных в виде поддеревьев в соответствии с правилами, которые должны быть заданы, может затем интерпретироваться как род, вид и так далее.

При таком подходе подмножества, выделяемые в иерархии, определяются при помощи использования непроизводных элементов в качестве вычислимых модулей. Растения, не обладающие различиями ни по одному из используемых в системе признаков, классифицируются как одинаковые или, вероятно, лучше сказать, как подобные, несмотря на то что в других отношениях они могут различаться. Соответствие между идеализированными определениями системы классификации и реальными индивидуальными объектами классификации обычно не является точным и описывать его следует, по-видимому, лишь в статистических категориях

Эта классификационная система, так же как и ее более поздние варианты, является фенетической в том смысле, что в ее основу кладутся исключительно свойства фенотипов. Говорят, что более естественная система классификации должна в качестве отправной точки иметь филогенетические соотношения — в той степени, в которой соответствующие сведения имеются. Знания о том, каким способом растения эволюционировали, могли бы затем использоваться для классификации. В этом случае растения считались бы «родственными», если бы процессы их эволюционного развития имели много общего.

Здесь неуместно обсуждать «за» и «против» правдоподобия каких-либо конкретных таксономических систем. Вместо этого мы займемся методологией классификации. В этой связи необходимо упомянуть об альтернативной точке зрения, которой придерживался Адансон (вторая половина XVIII в.). Он считал, что ботаник, занимающийся систематикой, должен строить таксономическую систему, опираясь не на изолированные признаки, выбираемые более или менее произвольно, а используя множество признаков и принимая решения о взаимной близости или удаленности двух объектов, исходя из корреляции между множествами их признаков. При таком подходе подмножества разбиения — таксоны — будут обладать большей информативностью, но одновременно может оказаться, что таксоны частично перекрываются.

Численная таксономия представляет собой современный вариант метода Адансона; при выделении таксонов в ней используются статистические методы (см., например, монографию (Sokal, Sneath 1963)). Переходя на более абстрактный язык, можно было бы сказать, что исходным является выборочное пространство высокой размерности, а целью — разложение вероятностной меры, введенной в этом пространстве и эмпирически известной, на подмеры. Носители этих подмер могут пересекаться, но в не очень сильной степени.

Один из методов, которому в рамках численной таксономии уделяется много внимания, — это метод главных компонент, используемый для выделения таких подпространств (предпочтительно малой размерности), что большая часть вероятностной меры оказывается близка к одному из них. Осуществляется это при помощи исследования ковариационных матриц. Таким образом, мы, нет сколько неожиданно, снова сталкиваемся с собственными векторами, рассматриваемыми в качестве непроизводных объектов, подобно тому как при изучении колебательной среды возникали собственные функции.

Следовательно, можно ожидать, что в таксономических задачах мы встретимся с некоторыми мерами, выполняющими роль непроизводных элементов, связанных топологическими отношениями. Последние, поддающиеся представлению с помощью графов, в простейшем случае — деревьев, описывают иерархию регулярной структуры. Мы могли бы, с другой стороны, предпочесть воспользоваться аппроксимацией мер мерами, носителями которых служат линейные многообразия, и в этом случае работать с собственными векторами и собственными пространствами, натянутыми на них.

Общие принципы, развитые ботаниками-систематиками, вполне поддаются переносу и в другие области, однако их трудно применять для анализа сложных и диффузных явлений.

В качестве соответствующего примера укажем на классификацию болезней, используемую в медицине. Очевидно, что эта классификация

служит не только для того, чтобы организовать значительный объем знаний: группировка явлений и обозначение их соответствующим названием служат также и для того, чтобы поставить в соответствие этому названию определенные действия или терапию. Конечно, трудно представить процесс постановки диагноза в явном виде с помощью точно определенного дерева решений или распознающего алгоритма. Существует даже как будто широко распространенное и носящее в значительной степени эмоциональный характер предубеждение против самой возможности хотя бы частичной формализации какого бы то ни было процесса постановки диагноза на алгоритмическом уровне.

Несмотря на существование такой пессимистической точки зрения, в этом направлении предпринимается много попыток применительно к определенным (обычно небольшим) группам заболеваний. Хороший пример такого рода приведен в работе (Peterson et. at. 1966) - в ней приведено дерево решений для синдрома Штейна — Левенталя (см. рис. 1.2.4). Этот рисунок обнаруживает сильное сходство с классификацией растительного мира в ботанической систематике. Как и в предыдущих случаях, непроизводными элементами можно считать действия, указанные в нижней части рисунка.

Отметим, что эти паттерны не рассматриваются как примеры формализации заболеваний, что могло бы показаться естественным. Само понятие заболевания, однако, столь расплывчато, что попытка анализировать его в терминах распознающих алгоритмов может придать обсуждению лишь мнимую и искусственную «точность». Исключение представляют те случаи, когда заболевание можно определить, поставив ему в соответствие одну или несколько четко ограниченных причин. В противоположном случае мы оказываемся втянутыми в онтологическую дискуссию о собственно существовании болезней. При этом предпочтительно говорить о синдромах — комплексах симптомов — или о решениях (комплексах действий), как, скажем, в предыдущем примере. Для того чтобы оценить алгоритм принятия решения, его следует сравнить с процессом постановки диагноза врачом, а также учесть результаты последующих наблюдений. Элементарное, но очень поучительное обсуждение этой проблемы можно найти в работе (Peterson et. at. 1966).

Следует отметить, что, хотя на рис. 1.2.4 дается неявное определение синдрома, естественнее рассматривать его как некоторую решающую функцию. Ее основное назначение — распознать синдром и выбрать надлежащее действие. Это типичный пример значительной доли работы, выполняемой в рамках распознавания образов — научного направления, посвященного главным образом распознаванию закономерностей (образов) и построению алгоритмов, обеспечивающих осуществление распознавания. Сущность образов и определение того, что они собой представляют, обычно оставляются

Рис. 1.2.4 (см. скан)

без внимания, за некоторыми исключениями, о которых речь пойдет в данном разделе ниже.

К числу наиболее изученных биологических закономерностей,

несомненно, относятся паттерны, связанные с формой и ее формированием, причем как в процессе индивидуального, так и эволюционного развития. Подавляющее большинство этих исследований имеет описательный характер и не предусматривает использование каких-либо математических средств, за исключением, быть может, такой «математики», как вычерчивание кривой по точкам. Анатомия по природе своей аналитична в том смысле, что ее метод предполагает разделение организма на некоторые подмножества, которые в свою очередь разбиваются на еще более мелкие подмножества и так далее. Тело состоит из туловища, головы, конечностей и так далее, а конечности делятся соответственно на более или менее четко определенные части, и т. д.

Описание элементов, относящихся к различным уровням иерархии, дается словесно, возможно лишь с добавлением некоторых числовых характеристик статистической природы. Заманчиво провести математическую формализацию процесса сегментации, и такие попытки действительно предпринимаются (см. ниже «грамматики изображений»), В связи с этим упомянем лишь знаменитую работу ДАрси Томпсона (dArcy Thompson 1961) «О росте и форме». Одной из главных тем этой работы является поиск общих принципов, определяющих регулярность биологических организмов.

Самым очевидным из этих принципов является симметрия, которая наблюдается в живых организмах относительно определенных осей, скажем дорсовентральной, или плоскостей, например медиальной. Больший интерес вызывают принципы, с помощью которых можно попытаться получить более полное объяснение процессов формообразования: минимум потенциальной энергии, площади поверхности и иные разновидности изопериметрической задачи, а также максимум прочности для данной массы. Многие биологи, судя по всему, относятся весьма скептически к таким претенциозным попыткам (типа идей ДАрси Томпсона), и, возможно, они правы. Тем не менее, какова бы ни была степень применимости этих идей к реальному миру, сама гипотеза, состоящая в том, что подобные принципы порождают закономерности, обладает гипнотической привлекательностью и заслуживает того, чтобы ею занялись математики (см. Примечания Б).

К образам в биологии можно, однако, подойти и совершенно с другой стороны, почти «перпендикулярной» упоминавшейся выше. Вместо того чтобы задаваться вопросами, что представляют собой регулярности, характеризующие жизнь, и как обстоит дело с их математическим описанием и проведением математического анализа, можно было бы сформулировать задачу следующим образом: пусть выбрано некоторое животное или группа животных — какие образы оно (они) могут воспринимать и как это восприятие организовано?

Большинство постановок такого типа (а известно их множество)

связаны со зрительным восприятием. Отправной точкой при этом служит нейронная сеть, реализующая обработку, а мы пытаемся найти связи зрительных раздражителей со свойствами отдельных нейронов и архитектурой сети в целом. Применительно к этому подходу упомянем здесь лишь две важные работы: статью (Hubel, Wiesel 1965) и статью (Lettvin et. al. 1959), в которых содержится ряд поразительных наблюдений. Параллельное направление исследований, проводимых в рамках психологии, сосредоточилось на выработке закономерностей посредством обучения в лабораторных условиях, что позволяет исключить влияние побочных воздействий, явлений и аномалий.

Допустим, что мир, в котором действует животное, упорядочен в виде некоторой регулярной структуры, можно предпринять математическое изучение идеализированных нейронных сетей и попытаться выяснить, какие свойства сети необходимо постулировать с тем, чтобы она была в состоянии распознавать определенные образы и обучаться их различению. Вероятно, изучение подобных формальных процессоров образов, по крайней мере в настоящее время, позволит нам узнать больше о математических свойствах регулярности, чем, собственно, о реальном мире. Один пример такого исследования, выполненного в рамках теории образов, приведен в гл. 6 второго тома нашей книги.

Менее фундаментальный характер имеют те образы, которые можно наблюдать в поведении человека при стереотипных условиях, скажем при изучении движения. Для того чтобы выполнить задание на ручную работу, человек-оператор будет осуществлять некоторую последовательность движений, работая руками и, быть может, ногами. С точки зрения метода, излагаемого в данном разделе, было бы естественно заняться поиском непроизводных элементов — элементарных движений и попытаться выяснить, как они объединяются в образы движений. Именно это и служит предметом исследования при изучении двигательной активности (см., например, Larkin 1969). Правила, определяющие возможности объединения определенных элементарных движений и запрещающие те или иные объединения, отражают непрерывность движений, налагают ограничения на энергию, необходимую для перехода от одних движений к другим, и так далее.

В этой связи следует упомянуть и образы, которые могут возникнуть из образов движения. Допустим, что мастеровой делает какую-то вещь. В его распоряжении имеются определенные инструменты, некоторые исходные материалы и, что самое важное, определенный набор движений, которые он может совершать руками. Последние представляют его мастерство. Какие формы он может создать при заданных условиях? Насколько они сложны, сколько времени необходимо для их воспроизведения?

Подобные вопросы возникают также и в связи с процессорами

образов: проблема состоит в том, как образы движения индуцируют пространственные образы и как технические ограничения и вариации влияют на получаемые в результате формы. Конечно, атомистическая концепция движения рук может оказаться неадекватной, слишком ограниченной, не обеспечивающей досконального понимания подобных производственных процессов. Так это или нет, может показать лишь тщательное рассмотрение конкретных случаев (см. Примечания В).

За исключением последнего примера, мы обсуждали лишь образы, встречающиеся в природе. А как обстоит дело с миром, создаваемым человеком: является ли характер его образов принципиально отличным от характера образов, изучаемых в естественных науках?

Естественные языки обнаруживают регулярности, существование которых вполне очевидно, но их точный характер уловить очень трудно. Читателю, знакомому с современным состоянием лингвистики, хорошо известно, что языковые образы, определяемые морфологией и синтаксисом, могут рассматриваться в терминах порождения. В самом деле, лингвисты подчеркивают, что грамматика задается определенными правилами: поверхностная структура языка, сбивающая с толку своим сложным и противоречивым обликом, скрывает набор правил и трансформаций. Число последних, т. е. правил и трансформаций, может быть большим, но оно конечно. Рассмотрим вкратце пример, иллюстрирующий сказанное, но прежде сделаем одно замечание исторического характера.

Панини, филолог, создавший грамматику санскрита, быть может, первую подробную грамматику индоевропейского языка, описал процесс формирования слов, опираясь на понятие корня слова. Точная дата его работы неизвестна, но известно, что филолог Панини действительно жил за несколько веков до нашей эры. Его работу называют «одним из величайших достижений человеческого разума». Причина, по которой необходимо упомянуть здесь об этой работе, заключается в «порождающем подходе», согласно которому получение слов из корней — непроизводных основ происходит посредством применения определенных правил в определенном порядке. Регулярности в образовании слова объясняются, следовательно, через непроизводные элементы, состоящие из правил и корней. Удачный выбор правил обеспечивает достижение в грамматике существенной экономии. Процитируем работу (Robins 1967): «Это стремление к экономии было явно присуще создателю древнеиндийской грамматики; комментатор замечает, что экономия даже половины длины краткой гласной при формировании грамматического правила является для филолога таким же событием, как рождение сына».

Требование, чтобы правила, используемые для анализа образов, обладали простотой и образовывали некоторую точную систему,

в изучении регулярности возникает периодически и, в сущности, неизбежно. Система правил не должна содержать избыточных утверждений, а отдельные правила должны быть логически независимы. С другой стороны, система должна быть полной с тем, чтобы ее мощь позволяла ей работать с теми образами, которые могут встретиться.

Недавно в рамках работ, связанных с порождающими грамматиками, была предложена точная формализация грамматик непосредственных составляющих. Эта формализация выполнена применительно к различным уровням порождающей способности грамматики: автоматные языки, бесконтекстные языки и так далее. Основное правило остается одним и тем же: из некоторого конечного множества правил с помощью правил и вспомогательных понятий выводится некоторое бесконечное множество предложений Оно содержит предложения, построенные в соответствии с грамматикой, т. е. допускаемые грамматикой

Рис. 1.2.5

Так, например, предложение «the dog chased the little boy» можно рассматривать как порожденное посредством процедуры, представленной на рис. 1.2.5. Как мы видим, начальный символ последовательно разлагается на синтаксические составляющие-группы: (группа существительного), (глагольная группа), (определители), (существительное), V (глагол), (прилагательное). Сначала применяется правило и составляющие и расписываются по отдельности. Для разложения группы существительного используется правило а для глагольной группы — правило Затем производится разложение группы существительного, но на этот раз включающей факультативное прилагательное, на и . И наконец, производится подбор лексических единиц: для определителя, для существительных и так далее.

Если оставить в стороне технические подробности (а их здесь много, и они весьма запутанные), то становится очевидно, что в данном случае мы работаем с правилами подстановки как с непроизводными элементами — либо такими, как заменяющими одну синтаксическую составляющую другими, либо

таними, как little (маленький), результатом применения которых является подстановка соответствующих лексических единиц.

В данный момент нас интересует исключительно принцип действия, лежащий в основе схем типа приведенной на рис. 1.2.5. Объединяя непроизводные элементы так, чтобы они сочетались друг с другом, мы получаем диаграмму, интерпретацией которой служит нижняя строчка, содержащая лексические единицы и рассматриваемая как одно из предложений, правильных в смысле данной грамматики. Эта диаграмма на самом деле представляет собой некоторую формулу, вычисляющую предложение почти так же, как формулы (1.1.2) или упоминавшиеся в том же разделе арифметические выражения, порождающие последовательности.

Тот факт, что топология структуры, приведенной на рис. 1.2.5, является деревом, не вносит принципиальных отличий от случаев, рассмотренных нами выше. В сущности, для того, чтобы иметь возможность работать и с другими случаями, нам необходимо ввести топологии самых различных типов.

В лингвистической литературе конечность формальных грамматик считается существенным фактором, однако в рамках нашего исследования регулярности она не имеет решающего значения. В самом деле, многие из наших регулярных структур относятся к сфере анализа и содержат континуумы: они не обязательно конечны.

Задача описания идеального языка отличается, естественно, от задачи анализа употребления — это различие между знанием языка и речевым исполнением. Обращаясь к регулярностям в употреблении языка, естественно ввести вероятностные — или метрические — аспекты с тем, чтобы иметь возможность пользоваться точными характеристиками, говоря о том, что является широко распространенным и что — исключением. Не вполне очевидно, однако, каким образом можно ввести «шумовые свойства» — следует ли воспользоваться при этом просто частотами лексических единиц или имеется возможность также описывать на вероятностном языке синтаксическую изменчивость?

Допустим теперь, что мы работаем с языковыми образами, допускающими представление в рамках некоторой заданной формальной грамматики, а сам язык задан на множестве слов Определение класса дистрибуции указывает, допускают ли два слова один и тот же контекст. Точнее, это значит, что для произвольных цепочек и и слов предложения построенные посредством конкатенации, должны быть оба либо выводимыми, либо невыводимыми в данной грамматике, если утверждается, что х и у принадлежат к одному и тому же классу дистрибуции.

Соответствующие классы эквивалентности выражают некоторую инвариантность, заключающуюся в том, что любое слово грамматически правильного предложения можно заменить произвольным словом у из того же класса, не нарушая грамматической правильности.

Это просто тавтология в смысле прямого определения класса дистрибуции. Часто, однако, классы дистрибуции определяются (или частично определяются) не синтаксически, в частности семантикой. Что интереснее, синтаксическая «одинаковость» слов может в определенной степени задаваться априори. Соображениями подобного типа пользовалась Кулагина и другие исследователи; читатель, интересующийся этими проблемами, можег обратиться к монографии (Marcus 1967), в частности к главам первой и третьей, посвященным языкам с хорошо развитой морфологией.

Интересный побочный эффект формальных грамматик проявился в распознавании образов. При несколько упрощенном подходе распознавание образов можно считать состоящим из двух различных областей исследований. В первой из них объектом изучения служат алгоритмы, программное обеспечение и аппаратура, необходимые для реализации процесса распознавания. Это направление исследований в значительной мере носит статистический характер и использует хорошо известные статистические методы и понятия, примененные к задачам распознавания. Подобные задачи будут возникать в нашем исследовании, но они не будут его главной темой.

Вторая область представляет для нас в данном контексте больший интерес, поскольку ее объектом исследования являются собственно образы, их природа и определение. Она не ограничивается исключительно реальными языковыми образами — совсем наоборот — большая часть приложений не относится к лингвистике. Тем ие менее мы будем обсуждать ее в лингвистическом контексте, поскольку возникла эта тема у нас в связи с лингвистическими соображениями. Основная идея заключается в использовании формальных грамматик, введенных в теоретической лингвистике, или их модификаций для порождения образов. Этот подход часто называют синтаксическим или лингвистическим методом распознавания образов — см. монографию (Fu 1974), в которой дано исчерпывающее изложение этой темы и приведена обширная библиография.

Одним из пионеров синтаксического подхода был Нарасимхан, который в работе, появившейся еще в 1964 г. (см. список литературы), обратился к трекам, наблюдаемым в пузырьковых и искровых камерах.

В самом примитивном изложении процедура выглядит следующим образом. Изображения, полученные с помощью пузырьковой камеры (фактически это трехмерные образы), подвергаются предварительной обработке, что не просто уже само по себе. Точки, образующие трек, идентифицируются и соединяются из соображений непрерывности. Выделяются особые точки (концевые точки и точки разветвления). Вычисляются значения числовых признаков (таких, как кривизна), и процесс анализа постепенно ведет к получению структурного описания изображения. Или, как пишет Нарасимхан: «Целью любой процедуры распознавания, отвечающей требованиям

практики, должно быть не столько получение решений типа «да», «нет», «не знаю», сколько выработка структуры входных изображений. Однако, как автор уже указывал в другой работе, ни одна модель обработки не способна выработать сколько-нибудь удовлетворительных описаний до тех пор, пока в нее не будет заложена некоторая «порождающая» грамматика того класса образов, для обработки которых эта модель предназначена».

После завершения упомянутых выше первых этапов анализа принимается решение относительно отдельных частей, составляющих изображение. Дуга может быть классифицирована как отрезок прямой или спирали. Кроме того, алгоритм может вести поиск под-изображений, обладающих заданными качественными или количественными характеристиками. Следуя этим путем, можно получить результаты, осмысленные в физическом смысле.

Миллер и Шоу [Miller, Shaw 1968] разработали язык, специально предназначенный для обработки изображений.Этот язык по крайней мере по духу близок к тому, что предлагал Нарасимхан, однако детальная структура грамматик различна. Каждый непроизводный элемент (подизображение) имеет две специальные отмеченные точки — голову и хвост (X); конкатенация непроизводных элементов производится только в этих точках. Классы непроизводных объектов задаются априори, обозначаются определенным именем и, возможно, характеризуются несколькими признаками числовой или нечисловой природы. Подизображения могут обозначаться с помощью верхнего индекса: Существует пустой элемент X, образованный только хвостом и головой, расположенными в одном и том же месте. Обозначим два непроизводных элемента через и введем следующие бинарные операции:

К отдельному непроизводному элементу можно применять следующие операции:

Синтаксис задается следующими правилами порождения предложении

В качестве примера, иллюстрирующего «работу» этого языка, Миллер и демонстрируют анализ изображения, приведенного на рис. 1.2.6.

Рис. 1.2.6

В примере используются изображения, соответствующие случаю, когда исходная частица имеет отрицательный заряд. Частица может отклониться от своей траектории (рассеяние) в результате взаимодействия с положительно заряженной частицей либо претерпеть распад на нейтральную и отрицательно заряженную частицу или «пройти» через все изображение. Непроизводными элементами служат (трек положительной частицы), (трек отрицательной частицы) и (трек нейтральной частицы). Если обозначает некоторый -трек, причем то соответствующие правила можно записать следующим образом:

Эти правила обеспечивают реализацию грамматического анализа рис. 1.2.6 в следующем виде:

В этой связи необходимо упомянуть и еще одну раннюю идею такого же рода — речь идет о методе анализа фотографий хромосом, предложенном Ледли (Ledly 1964). На изображение накладывается

прямоугольная сетка размером 700X500. Степень зачерненности каждой из 350 000 ячеек представляется с помощью восьмиуровневой шкалы. Для того чтобы выделить контур некоторого объекта, представленного на изображении, необходимо выбрать пороговое значение зачерненности и соединить точки, соответствующие выбранному значению порога, непрерывными дугами максимально возможной длины. Как обычно, здесь необходимо применить тот или иной механизм обработки оптических «шумов».

Рис. 1.2.7 (см. скан)

Более существенной особенностью этой процедуры, однако, является использование следующего синтаксического приема. Контур объекта разделяется на дуги, и предпринимается попытка классифицировать их по пяти типам, представленным на рис. 1.2.7 и обозначенным соответственно. Не следует рассчитывать на достижение полного соответствия — речь идет о приближенном представлении дуг окружности. Используется целая иерархия понятий типа «плечо», «сторона», «пара плеч». Синтаксическое правило может (мы приводим здесь просто один из возможных примеров) иметь следующий вид:

плечо плечо или плечо — В или А. (1.2.13)

Это рекурсивное правило указывает, что «плечо» может иметь вид и т. д. Эта идея становится понятнее, если обратиться к сильно идеализированному изображению на рис. 1.2.7(б), где показана сегментация, и к изображению на рис. 1.2.7(в), где представлено только плечо ВАВ (эти рисунки заимствованы из статьи Ледли). Остальные синтаксические правила действуют аналогичным образом.

Более свежие сведения о применении распознавания образов при изучении биологических объектов читатель может найти в работе (Prewitt 1972), там же приведена и библиография. Прежде чем расстаться с проблемой лингвистических аспектов биологических форм и биологических изменений, необходимо упомянуть развивающиеся системы, введенные Линденмайером. Основным кирпичиком системы служит клетка, точнее, клетка вместе с ее текущим состояием.

Это состояние может изменяться во времени так же, как и количество клеток. При условии конечности числа возможных состояний развитие определяется некоторым конечным числом грамматических правил, что может вызвать у читателя ассоциации с марковскими алгоритмами.

Воспользуемся примером, приведенным в работе (Lindenmayer 1975). Пусть состояния клеток образуют «алфавит» Введем следующие правила грамматики:

Отправляясь от начального состояния а и последовательно применяя правила грамматики к отдельным буквам алфавита, получаем развитие:

Отметим, что в данном случае не использовались правила грамматики непосредственных составляющих, однако они появляются в более сложных системах такого рода.

Существенно в этой связи то обстоятельство, что получаемым образам можно во многих случаях придать интересную биологическую интерпретацию. Так, например, система (1.2.15) может интерпретироваться как модель процесса установления формы некоторых видов листьев, если элемент k означает «отсутствие роста» (см. рис. 1.2.8, заимствованный из работы (Lindenmayer 1975)).

Развивающиеся системы вызвали широкий резонанс в среде специалистов по теоретической биологии. Хотя они явно неидентичны синтаксическому подходу к распознаванию образов, общим для обоих методов является использование идеи порождения и конечность. Оба метода предполагают построение линейных цепочек, и оба они были обобщены на двух- и трехмерные случаи. Сведения по поводу систем Лннденмайера можно найти в работе (Culik, Lindenmayer 1976), а поводу синтаксического подхода к распознаванию образов — в монографии (Fu 1974); обратите, в частности, внимание на приложения .

Для большей части литературы, посвященной синтаксическому распознаванию образов, характерно то обстоятельство, что авторы

основное внимание уделяют алгоритмам распознавания, обращая меньше внимания на математические свойства собственно образов. С этим же обстоятельством связано и то, что редко сколько-нибудь глубокому анализу подвергается математическая связь между идеальными образами и теми образами, которые реально наблюдаются. Реальный образ необходимо подвергнуть предварительной обработке, часто с помощью специфических методов фильтрации и сглаживания, прежде чем применять к нему алгоритм распознавания.

Рис. 1.2.8

Вернемся теперь к языку в строгом смысле этого слова, однако теперь обращая основное внимание на то, в какой форме он представляется: в виде устной речи, в рукописной форме, в виде литературного произведения и так далее. Большое внимание в литературе по распознаванию образов уделялось, в частности, буквенно-цифровым объектам, результатом, чего явилось множество исследований, правда довольно поверхностных. Исключение составляет одна из первых работ в этой области (Eden 1961), посвященная распознаванию стилизованного почерка.

Исходное допущение Идена состояло в том, что рукописные символы можно строить, пользуясь некоторым числом штрихов. Некоторые из них представлены на рис. 1.2.9(a). Сколь большим следует выбирать значение зависит от степени приближения, которой мы хотели бы добиться, с учетом того, что большие значения сопровождаются ростом сложности. Следует ли включать, например, точку, которая ставится над буквой палочку, пересекающую букву Это все, однако, детали, в которые здесь не следует вдаваться. Вместо этого мы обратимся к более существенным аспектам такого способа порождения символов. Отметим следующие три момента.

Во-первых, все символы порождаются с помощью нескольких основных элементов — штрихов. Это обстоятельство резко ограничивает множество возможных образов (или объектов, их представляющих).

Во-вторых, штрихи комбинируются не произвольно, а в соответствии с определенными правилами. Можно потребовать, чтобы штрихи соединялись друг с другом непрерывно или чтобы определенные комбинации штрихов не допускались. Подобная регулярность также ведет к ограничению формы получаемых образов. Букву можно разложить на четыре элемента, представленные на рис. 1-2.9(б).

В-третьих, число базисных элементов можно ограничить и еще больше. Посмотрим на штрихи 1 и 2. Второй штрих можно рассматривать как результат перемещения вниз первого. Аналогичным образом штрих 6 можно считать зеркальным отображением относительно горизонтального зеркала штриха 3. В более общем случае исходными являются элементы, представленные на рис. 1.2.9(в); к ним применяется некоторый набор преобразований, включающий определенного вида переносы, отражения и повороты. При этом всеп штрихов предстают как результат некоторой операции, примененной к одному из четырех базисных штрихов. Таким образом, мы еще больше ограничили количество элементов.

Рис. 1.2.9

Итак, резюмируем конструкцию нашей модели. Используя в качестве исходных средств некоторый набор непроизводиых элементов и некоторый набор преобразований, мы порождаем некоторое множество простых символов (штрихов). Последние соединяются в соответствии с заданными правилами, что приводит в конечном счете к получению искомого результата — символов.

Важность работы Идена определяется не столько ее утилитарной пользой с точки зрения построения алгоритмов распознавания стилизованного почерка — она несколько сомнительна, — сколько логикой его подхода и той ясностью, с которой он обнаружил некоторые фундаментальные аспекты формирования образа.

При переходе от «письменного» языка к «устному» мы сталкиваемся с исключительной сложностью и богатством речевых образов. Для того чтобы ввести какую-то упорядоченность, специалисты пытаются разделить речевые образы на некоторые элементарные

единицы — фонемы, несущие, как предполагается, большую часть информационной нагрузки образа. Главная идея заключается в рассмотрении фонемы как объекта, представляющего собой совокупность ряда дифференциальных признаков и (бинарных) указаний на наличие или отсутствие соответствующих дифференциальных признаков. Примерами подобных признаковых пар служат звонкость — глухость, длительность — краткость и так далее. Фонема, обладающая подобными свойствами, представляет собой некую абстракцию, а не реальный звук.

Фонемы, однако, существуют не изолированно — наоборот — они подчиняются определенным отношениям и образуют некоторую структуру, а законы, которым она подчиняется, и должны выявляться фонологом. Трубецкой, один из творцов современной фонологии, сформулировал это положение следующим образом:

«Un systeme phonologique n'est pas la somme mecanique de phonemes isoles, mais un tout organique dont les phonemes sont les mem-bres et dont la structure est soumise a des lois» 11.

В основополагающей работе (Lieberman et at. 1967) было показано, что человек не передает и не воспринимает отдельные объекты, в совокупности образующие слитную речь. Вместо этого он, судя по всему, использует изощренную схему кодирования, обеспечивающую воспроизведение сложной системы звуковых образов, отличающейся наличием взаимосвязей между ее частями.

Физическую реализацию речи — изменения давления воздуха — можно рассматривать .как некоторый временной ряд, поддающийся спектральному анализу. В рамках такого подхода было выполнено много работ, и они представляют для нас определенный интерес, поскольку в них изучается такой тип регулярной структуры, с которым мы до сих пор еще не встречались.

Очевидно, что на интервалах порядка нескольких секунд этот временной ряд не может быть стационарным. Имеются, однако, основания полагать, что на более коротких интервалах он квазистационарен по крайней мере, как первое приближение. Если это так, то спектральная функция на этих временных интервалах является естественным математическим средством, которым следует воспользоваться при изучении данного временного ряда.

Эмпирическое изучение подобных спектров позволило еще очень давно обнаружить, что они имеют чрезвычайно интересную форму, часто связанную с высокой концентрацией энергии на определенных частотах — формантах. В таком случае нескольких формант может оказаться достаточно для получения приближенного описания

некоторых звуков в статическом режиме. Переходы между квазистационарными отрезками оказываются более сложными.

Оставив в стороне конкретные примеры изучения, мы можем сказать, что в математическом смысле вышеизложенное эквивалентно объединению различных стационарных случайных процессов. Они определены на смежных непересекающихся интервалах, причем граничные условия на стыках не заданы. Этот случай отличается от регулярных структур, рассматривавшихся нами выше, в том отношении, что непроизводные объекты в данном случае представляют собой случайные процессы, это соответствует следующему (более высокому) уровню абстракции по сравнению с предыдущими случаями. За исключением этого отличия — а оно является основным, — структура, как и прежде, формируется комбинаторными способами из непроизводных объектов.

Читатель должен обратить внимание на то обстоятельство, что регулярные структуры, только что рассмотренные нами, имеют много общего с теми регулярными структурами, с которыми мы имеем дело в естественных науках. Одно из различий состоит в том, что в естественных науках формализация часто заходит дальше, а исследование, производимое математическими средствами, может быть более глубоким. Это различие имеет мало или вообще ничего общего с различиями, существующими между количественными и качественными методами: и те, и другие могут формулироваться и изучаться математически.

В еще большей мере это замечание относится к случаям, которыми мы сейчас займемся; они отличаются невысоким уровнем математического формализма. Первый пример относится к прекрасному исследованию народных сказок, опубликованному Проппом в 1927 г. в работе, открывшей в этой области новую эпоху, но не получившей широкой известности среди западных филологов вплоть до конца 1950-х годов.

Свое исследование Пропп посвятил попыткам создать некую морфологию народной сказки, которую можно было бы использовать для разложения сказки на составляющие универсального характера. Роль непроизводных элементов при этом главным образом выполняли поступки dramatis personaell и их функциональная роль в сказке в целом. Вероятно, можно было бы сказать, что в формальном смысле эти функции были абстрагированы от их семантического содержания в максимально возможной степени. Как бы то ни было, главной задачей является представление сказки в виде некоторой последовательности непроизводных элементов, некоторой формулы, выражающей синтагматическую структуру сказки.

Приведем несколько типичных непроизводных элементов; мы

сохранили здесь нотацию Проппа (полный список непроизводных элементов можно найти в книге (Пропп 1969) с. 149—155).

(см. скан)

Мы привели лишь малое подмножество используемых им непроизводных элементов, но оно позволяет составить некоторое представление о характере этих непронзводных элементов. Результатом анализа конкретной сказки является некоторая формула. Формулы, соответствующие различным сказкам, можно сравнивать, отыскивая сходства и различия. Хотя собственно исследование Проппа ограничивается синхроническими аспектами проблемы, его методология открывает путь к диахроническим исследованиям.

Внешне бесконечные вариации народных сказок подчиняются, если принять методологию Проппа, жестким закономерностям; как он сам пишет, «... они подтверждают наш общий тезис о полном единообразии строения народных сказок».

Пропп был предтечей современной школы исследователей, занимающихся отысканием регулярностей в повествовании. Это направление, центром развития которого явился Париж, испытало также влияние структуралистов, особенно Леви-Стросса, давшего критический анализ работы Проппа со структуралистских позиций.

Основной принцип, использованный Леви-Строссом при изучении мифов, состоит в том, что предстающее в мире мифов как хаос можно понять на некотором обобщенном уровне. Миф строится из элементов-составляющих, однако смысл мифа не содержится в этих изолированных элементах. Смысл этот следует искать в том способе, с помощью которого эти элементы объединяются (см. работу (Levi-Strauss 1955), разд. 2.6.). Преобразования применяются

к этим элементам, что порождает парадигматические схемы, однако они не могут применяться к элементам по отдельности и оказывают влияние на систему в целом. Элементы-составляющие представляют собой отношения или пучки отношений, и анализ мифа явно нацелен на эти элементы, а также на способ, прн помощи которого они объединяются в некоторую структуру.

Подобные подходы определенно напоминают представления, уже обсуждавшиеся в данном разделе, но поскольку их формализация не была доведена до такой же степени, мы сочли за благо проявить некоторую осторожность. Сходство действительно бросается в глаза, но, возможно, оно не является достаточно глубоким.

Более основательную аналогию можно обнаружить, обратившись ко взглядам, выраженным Витгенштейном в его «Логико-фи-лософском трактате». Многие из его афоризмов, очевидно, отражают атомистично-комбинаторно-интерпретативиые идеи, совершенно аналогичные тем, что обсуждаются нами здесь. Поскольку мы еще вернемся к этому предмету в девятой главе, не будем вдаваться в дальнейшие подробности.

Мы покидаем теперь твердую почву, однако продолжим тем не менее наше продвижение и рассмотрим, каким образом интеллектуальные доктрины можно расщеплять на ведущие темы. Понятие «доктрина» используется в данном случае в широком смысле и может означать, скажем, гамильтонову механику, томизм, психоанализ или статистическую теорию.

Холтон (Holton 1973) предложил для характеристики любой теории использовать трехмерную метафору. Всякая теория содержит элемент, связанный с эмпирическими аспектами и «реальным миром»; будем называть его компонентой Теория содержит и еще одну компоненту, имеющую аналитический характер, базирующийся на логическом исчислении и использующий (нетривиальные) тавтологии; будем называть ее компонентой у. Эти компоненты, естественно, не требуют точного определения.

Или, как гласит знаменитый афоризм Юма: «...спросим, содержит ли она какие-либо отвлеченные рассуждения, касающиеся величин или чисел? Нет. Содержит ли она какие-либо эмпирические рассуждения, касающиеся материи, фактов или критериев? Нет. Предайте ее огню, ибо в ней не может содержаться ничего, за исключением софистики и лжи».

Холтон считает, что кроме компонент х и у необходима и третья компонента — Она представляет темы, т. е. основные понятия, язык и идеи. Он иллюстрирует это положение на примере физического понятия силы. Компоненту могли бы составить измерения результатов, вызванных воздействием силы, а компоненту у — векторный анализ в применении к силам. Компонентой служит некоторый принцип действия, энергия у Аристотеля, vis в «Началах»

Ньютона, Kraft в девятнадцатом веке. Именно этот аспект представляет «принцип действия» теории.

Другими примерами тем служат «законы сохранения», «атомистическая дискретность», «волновая природа», «эволюция», и т. д. Читателю, интересующемуся подробностями, следует обратиться к уже упоминавшейся книге Холтона (в частности, к с. 47—68). Заманчиво выглядит вопрос, можно ли формализовать способ, посредством которого доктрины конструируются из тем, в категориях регулярных структур, подобных рассматриваемым нами.

В своей знаменитой лекции, посвященной открытию автоморфных функций, Анри Пуанкаре обсуждал проблему открытия в математике, рассматривая его как плодотворную комбинацию идей. Он воспользовался при этом очень глубокой метафорой: атомы мысли; сцепленные между собой.

Наша задача не сводится к простой идентификации атомов мысли, или тем; она предполагает также отыскание тех правил, которые обеспечивают возможность сцепления этих тем между собой.

Давайте конкретизируем обсуждение, обратившись к одной определенной доктрине, а именно к статистической теории. Что мог бы представлять собой «тематический анализ» статистики? Можно ли выделить в ней какие-то главенствующие аспекты?

Обратившись практически к любому элементарному учебнику по статистике, мы обнаружим довольно много вероятностных моделей — статистических гипотез, однако количество тем существенно меньше. Некоторые из них встречаются часто, как, например, понятие случайного эксперимента, или, точнее, бернуллиева случайная величина. Будем обозначать ее в общем случае как где вероятность успеха в случайном эксперименте.

Еще одну тему представляет статистическая независимость, играющая фундаментальную роль в теории вероятностей и используемая в большинстве статистических моделей, хотя и не всегда в явном виде.

Арифметические функции также являются такими темами, которые повсеместно используются в статистике при построении моделей, так же, впрочем, как и некоторые другие функции.

Теперь можно приступить к формированию простых производных гипотез, например, для биномиального распределения:

Здесь предполагается, что четыре члена, входящие в правую часть выражения, следует интерпретировать как независимые реализации. Аналогичным образом при использовании в качестве тем предельных процессов можно получить распределение Пуассона и

нормальное распределение . Можно ввести распределения

и получить выражение для F-распределений

и т. д. Таким способом можно получать стандартные статистические гипотезы и в принципе можно убедиться в том, что небольшого количества тем достаточно для объяснения регулярностей процессов формирования гипотез элементарной статистики. Мы еще вернемся к этому предмету в гл. 6, где он будет рассмотрен более подробно.

Пора закрывать этот перечень частных случаев регулярных структур. Было бы нетрудно ввести в него еще много случаев, однако едва ли это требуется для того, чтобы проиллюстрировать следующий тезис: основу всех рассмотренных случаев составляет одна и та же идея.

с самого начала отметили, что наш выбор примеров непроизволен, и читатель сейчас сможет увидеть это более отчетливо. Все примеры имеют атомистический характер: исходным материалом служат непроизводные элементы и в результате их соединения между собой возникает некоторый ансамбль структур. Мы изучаем не отдельные законы, но лишь комбинаторную регулярность. Из рассмотренных примеров следует (с учетом этого существенного ограничения), что мы приходим к нескольким проблемам, которые возникают многократно:

Изучение понятия «сходства» непроизводных элементов.

Регулярные структуры обладают внутренней топологией.

При каких условиях непроизводные элементы могут сцепляться между собой?

Что представляет собой функция, присваиваемая отдельной «формуле»?

Каким образом эта функция связана с наблюдаемыми объектами?

Таковы вопросы, на которые должны быть даны ответы, и в гл. 2 мы приступим к их представлению с помощью точных формализмов.

<< Предыдущий параграф Следующий параграф >>
Оглавление