Главная > Распознавание образов > Лекции по теории образов. Синтез образов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.4. Временные и другие одномерные образы

Всюду в этом разделе будем полагать, что тип соединения линейный, образующие определены на действительной прямой, являющейся опорным пространством. Это определяет направление изменения времени.

Мы начнем с изучения последовательностей целых чисел, рассматриваемых не как абстрактные символы, а как числа. Всем нам знакомы тестовые вопросы по проверке умственных способностей, когда требуется продолжить заданную короткую последовательность. Рассмотрим три последовательности

Можно предположить, что I будет распознана как арифметическая прогрессия вида , удовлетворяющая рекуррентному соотношению , так что ее последующими членами оказались бы

Последовательность II может рассматриваться как часть геометрической прогрессии удовлетворяющей соотношению Ее продолжение имело бы вид

Наконец, последовательность III можно считать арифметической последовательностью второго порядка: где , имеющей продолжение

Строго говоря, подобная задача, безусловно, имеет не единственное решение, однако нас не это интересует. Основная идея, которая не всегда ясно высказывается, состоит в том, что требуется построить последовательность и ее продолжение при помощи простой комбинации известных арифметических операций. Она, естественно, укладывается в формализм образов.

Действительно, пусть для образующих со связями и с признаком а имеем Функция связывает показатели связей Если в качестве отношения согласования выбрать «равенство», то получаем рассматриваемые нами образы числовой последовательности.

Различные классы функций приведут к различным классам образов: арифметическим, арифметическим

порядка, геометрическим и т. д. В данном случае полезно смотреть на образующие как на макрообразующие от образующих более низкого уровня и, следовательно, рассматривать образы числовой последовательности как выводимые из операторных образов.

Случай 3.4.1 (образы арифметической последовательности). Последовательности рекурсивно порождаются исходя из конфигурации операторов (см. случай 2.7.1), где все и множеством показателей связей служит или его подмножества. Тогда результирующие конфигурации последовательностей состоят из наборов целых чисел, связанных друг с другом по линейному типу связи. Для идентификации изображений используется функция причем 2 конфигурации последовательностей считаются идентичными по модулю тогда и только тогда, когда при всех . В качестве функции можно взять, например, первую компоненту набора из чисел.

В данном случае входными и выходными значениями операторов являются целые числа. Для примера можно использовать в качестве образующих бинарные операции сложения и умножения при и унарные операции сложения с а и умножения на а при Тогда приведенная выше последовательность III может быть выведена из конфигурации, состоящей из образующих «сложение», «сложение », «умножение», «умножение на 2», «умножение на . Очевидно, показателями связей образующих более низкого уровня служат области и интервалы, в данном случае совпадающие с и его подмножествами.

Теперь рассмотрим некоторые образы, встречающиеся при выработке пряжи. Пряжа состоит из волокон, мы предположим, что они располагаются параллельно главной оси пряжи и одинаковы, если не учитывать их длину и положение. Мы не будем вдаваться в подробности интересного вопроса о пространственной структуре пряжи, которую она приобретает в процессе прядения.

Образующими будут отрезки прямой и мы примем, что и показатель каждой связи равен ординате у переднего конца волокна Длина является еще одним характерным признаком. Поскольку будут рассматриваться лишь пряжи, состоящие из волокон одного сорта, то требуется лишь один класс образующих, . Отношение связей будет выбрано в виде у у.

Случай 3.4.2 (образы в виде тонких прядей). Выбирая и такими же, как и выше, в качестве 5 — группы параллельных

переносов будем использовать результирующее пространство конфигураций для получения образов в виде прядей применять правило идентификации, по которому две конфигурации идентичны, если на любом участке числа их волокон равны.

Конечно, мы могли бы использовать в качестве показателя связи концевую точку Многие виды пряжи имеют не одинаковую структуру, так что начальные и концевые точки могут вести себя по-разному. Это можно объяснить спецификой процесса протягивания. При синтезе таких образов об этом не следует забывать. Рассмотрим конфигурацию и будем считать ее длинной прядью. Еще в 1945 г. Мартиндейлом было указано на невозможность точного управления положением волокна, поэтому необходимо описывать структуру пряди в вероятностных терминах. В введем меру следующим образом. Правые концевые точки образуют однородный процесс восстановления с непрерывной функцией распределения разностей Все длины независимы друг от друга и от и имеют функцию распределения Р со средним

Наблюдатель увидит изображение в положении Эта функция кусочно-постоянна всюду, за исключением начальных и концевых точек, где она имеет соответственно скачки —1 или Ее можно охарактеризовать при помощи

Два диаметрально противоположных образа показаны на рис. 3.4.1. В случае как так и Р имеют лишь одну точку роста и мы получаем вполне регулярную прядь. С другой сто роны, если экспоненциальна, Р непрерывна, так что образуют пуассоновский процесс, то имеем случайную прядь. Конечно, возможны также промежуточные образы.

Ясно, что при таких допущениях и имеем

или, если считать при то

и теория восстановления приводит нас к довольно очевидному результату

Аналогично для ковариационной функции сначала при имеем

Недиагональные члены этой двойной суммы имеют вид

Их оценка тем же методом дает

Рис. 3.4.1. (см. скан)

Диагональные члены должны рассматриваться отдельно, так как один и тот же встречается в двух условиях. Преобразуя их, получаем

где индикатор события, заключенного в скобки. Следовательно, (4.7) приводится к виду

причем ковариационную функцию можно выразить в виде

В частности, дисперсия равна

Тогда для спектральной плотности имеем

или, после двухкратного интегрирования по частям,

Эти образы могут быть использованы для вывода новых образов, соответствующих процессу протягивания. Прядь движется вдоль своей оси с постоянной скоростью и находится под одним роликом В. На некотором участке между В и другим роликом волокна внезапно увеличивают свою скорость.

Именно участок, где происходят изменения скорости, может отличаться нерегулярностью, возможно, из-за взаимодействия соседних волокон. Чтобы получить некоторое представление о том, что представляют собой выводимые образы, рассмотрим весьма идеализированную модель.

Рассмотрим длинную случайную прядь, координаты начальной точки волокон которой есть Волокно поступает в задний ролик В со скоростью и ускоряется до скорости на участке (см. рис. 3.4.2), где Отсюда следует, что координаты начальных точек протягиваемой пряди с точностью до аддитивной константы могут быть представлены в виде

где .

Предположим, что все имеют одну и ту же функцию плотности распределения которая, безусловно, обращается в нуль вне некоторого конечного интервала. Определим структуру

Рис. 3.4.2.

выводимого образа, в данном случае свойства изображения волокна в зависимости от у. Легко найти среднее, так как

Оценка, проводимая так же, как и раньше, дает

где

Как и следовало ожидать, (3.4.14) просто означает, что ввиду сохранения массы средняя толщина пряди уменьшилась в раз.

Чтобы получить свойства второго порядка выводимого образа пряди, заметим, что при

где соответствует сумме слагаемых при сумме остальных слагаемых. Тогда

и вычисляется так же, как и раньше.

Резюмируя сказанное, мы видим, что выводимый образ с точностью до множителя имеет то же среднее значение и ковариации, что и первоначальный образ. Коэффициент изменчивости выводимого образа в раз больше, чем у первоначального. Это согласуется с эмпирически установленным фактом, что в процессе протягивания имеет место тенденция к росту относительной нерегулярности образа пряди.

Мы пришли к несколько озадачивающему результату — ковариационная функция не меняется в процессе протягивания, если не считать ее -кратного уменьшения. Например, не изменяется ее масштаб длины. Ее спектр не становится более концентрированным, как этого следовало бы ожидать, учитывая волны, эмпирически наблюдаемые в процессе протягивания пряди. Наша модель недостаточно подробна, чтобы учитывать это явление. Попытки такого рода могут быть найдены в работах Фостера (1951) и Рао (1961).

Следует отметить, что выводимый образ изменяется менее очевидным образом, чем это можно установить при помощи свойств второго порядка. Новые положения передних концов уже не образуют пуассоновский процесс: введена зависимость, и больше нельзя применить экспоненциальное распределение.

В образах пряжи размерность пространства определяется опорным пространством. Для других одномерных образов, обсуждаемых в этом разделе, опорным пространством будет служить временная ось.

В случае речевых образов можно провести исследование на различных этапах их воспроизведения. Например, можно рассматривать речь на довольно абстрактном уровне, считая ее линейной цепью атомных единиц, скажем фонем. Фонемы соединяютсядруг с другом в соответствии с правилами и частотами, которйе характеризуют говорящего и язык, которым он пользуется. С другой стороны, можно измерить некоторую физическую величину, такую, как вариации звукового давления, выражающую акустический эффект речи. Существуют еще другие уровни, хотя для данного обсуждения этих двух уровней достаточно.

Каким будет образ акустической волны, выводимый из цепочки фонем? При простом и довольно наивном подходе предполагается, что каждой фонеме может соответствовать корректно определенная форма акустической волны. Другими словами, конфигурация сцепленных фонем может привести к выводимой конфигурации где обозначает форму волны во времени, соответствующей фонеме Это привело бы к гомоморфизму основанному на простом правиле подстановки

где состоит из возможных форм волны во времени, соответствующих фонемам.

Форма волны во времени необязательно определяется с помощью . Показатели связей могут пока остаться неопре деленными и будут заданы позже при помощи условий непрерывности. Или может быть задан лишь спектр функции, а не вся функция в целом. В любом случае мы имеем незначительные модификации, и они в принципе мало что меняют.

Однако известно, что этот подход не применим. Читателю следует обратиться к авторитетной статье, написанной в 1967 г. Либерманом, Купером, Шанквейлером и Стаддерт-Кеннеди по изучению речевого кода и роли контекста в акустических оттенках. Кодирование не является простым шифром, , а представляет собой по существу сложное отображение Либерман и другие показали, каким образом это кодирование в некоторых отношениях отличается от простого цифрового кодирования. Спектральная компонента отрезка речевой волны, — форманта, — может быть непосредственным образом изменена под воздействием следующего за ним звукового элемента. Не существует также корректно определенных границ в звуковом сигнале, по которым можно было бы разбить его на интервалы, соответствующие фонемам. Они также указали, что «в действительности спектрограммы чрезвычайно трудно читать». В общем их данные свидетельствуют о том, что отображение цепочки фонем в акустические сигналы не является таким простым, как можно было бы ожидать.

Было предпринято много попыток объяснять наблюдаемые свойства акустического сигнала за счет изменения геометрии голосового тракта и голосовой щели. Исходя из более или менее идеализированных уравнений волн, были предприняты попытки моделирования при помощи ЭВМ; несколько исследователей попытались смоделировать и изучить их аналитически. Насколько это известно автору, последнее (аналитическое исследование) было основано на квазистационарных соображениях (мгновенные спектры). Обзор этих работ приведен в статье Фланагана (1968).

Здесь мы дадим набросок весьма идеализированной системы синтеза образов, однако при этом вовсе не обязательно ограничиваться квазистационарным случаем. Следует предупредить читателя, что имеется в виду лишь изучение возможностей в духе введения этой книги.

Рассмотрим механическую систему, состоящую из гармонических осцилляторов, связанных друг с другом, с коэффициентами соединения и затухания Предположим, что коэффициент затухания мал. При подходящем выборе единиц уравнения системы могут быть записаны в виде

Здесь движущая сила, характеризуемая своим средним значением и спектральной плотностью Система связана в которая пока фиксирована.

Конечно, мы допускаем, что может менять свой характер в определенные моменты времени Больший интерес представляет то, что допускаются мгновенные изменения геометрии, приводящие к увеличению уменьшению . Если (лишь при ), то число уравнений увеличивается на единицу; если что допускается только при , то мы теряем одно уравнение. Максимальное значение равно так что определяется как где фиксированное число.

Когда добавляется новое уравнение, мы исходим из старого значения для новой переменной и нулевого значения ее производной. Обратно, если исключается какое-то уравнение, то сохраняются прежнее значение старой переменной и нулевое значение для ее производной.

Мы интересуемся величиной волны и ее спектральными свойствами, однако для этого, конечно, необходимо рассматривать вектор полностью.

Удобно использовать -мерный вектор-столбец состояния При система будет состоять из уравнений (3.4.18) и уравнений

Предположим, что в любой момент времени, в том числе в переходные моменты времени вектор-столбец является непрерывной функцией. При система находится в покое, .

Обозначая статическое решение системы (3.4.18) через при , прямым вычислением получим

причем разумно ввести в (3.4.18) разности Они удовлетворяют системе уравнений, формально совпадающей с

(3.4.18), за исключением того, что член, соответствующий надо приравнять нулю.

Тогда для значений находящихся между двумя переходными точками, можно записать

или в стандартной форме

где

Матрица разбивается на блоки

где обозначает нулевую -матрицу, — единичную -матрицу и -матрицу:

Если последующих переходных момента, то

Мы воспользуемся (3.4.25) позднее, но сначала рассмотрим более простую задачу, когда решение ведет себя квазистационарно.

Пусть процесс с нулевым средним значением и со спектральной плотностью Если ее спектральный процесс, а через обозначены соответственно матрица спектральной плотности и спектральный процесс стационарного векторного

решения то при помощи простых выкладок получим

Следовательно, для матрицы плотности

где Т — комплексное транспонирование.

Все собственные значения матрицы отрицательны и могут быть выражены в виде

причем для некоторой ортогональной матрицы О имеем

и

Здесь диагональная матрица с элементами

откуда следует, что спектральная плотность для может быть записана в виде

Это выражение имеет непосредственную физическую интерпретацию. Знаменатель дроби станет малым, если

так что частотная компонента будет доминирующей, если не мало. Чем меньше коэффициент потери тем более резко этот эффект будет выражен.

Рассмотрим 2 вида движущей силы Если она образует белый шум, так что является «плоской» вплоть до высоких частот, то значения в (3.4.34) особенно ярко выражены, и спектр -процесса будет иметь большое число пиков, если велико, и меньше, если уменьшается. С другой стороны, если движущая сила имеет узкий спектр, то в спектре порожденной волны появится лишь немного пиков, если даже I достаточно велико.

Этот тип образа в более общем виде может быть описан так:

Случай 3.4.3 (образы стационарного режима). Рассмотрим алгебру изображений в виде абстрактных последовательностей . В качестве образующих для выводимых временных образов используем спектральные меры

Эти образующие в качестве входных и выходных связей имеют концевые точки интервалов (см. начало этого разд.), и устанавливает, что цепочка из принадлежит алгебре изображений, задаваемых в виде абстрактных последовательностей к Изображением является результирующий стохастический процесс, другими словами, мы имеем дело с диффузными образами, и подпроцессы на непересекающихся интервалах трактуются как независимые и стационарные.

Можно также исследовать случай, когда допущение о независимости заменяется условием непрерывности на краях интервалов. Это потребовало бы анализа, аналогичного тому, который был проведен в разд. 2.10, но пока такой попытки сделано не было.

Рассмотренная квазистационарная аппроксимация позволяет нам считать, что первичный образ можно считать набором образующих, характеризуемых длиной колебательной системы, спектром Движущей силы и показателями связей обозначающими концевые точки временного интервала. Выводимый образ характеризуется спектром, задаваемым при помощи (3.4.33), что фактически означает, что мы располагаем лишь отображением образующих как это отмечалось выше. Здесь мы имеем дело с символами, а не с кодом, и поэтому схема не согласуется с фактами; требуется более тщательный анализ.

Изучим переходный режим колебательной системы. Для этого необходимо более точное исследование (3.4.25). Чтобы найти собственные значения -матрицы выразим собственный вектор в виде

где -мерные векторы, а и -мерные

Если соответствующее собственное значение, то мы должны иметь

Один способ подбора решения (3.4.36) состоит в том, чтобы положить выбрать в качестве а и произвольные -мерные векторы. В противном случае, когда , из первого и третьего уравнений получим

причем должно быть корнем уравнения (см. (3.4.29)).

так что

Заметим, что действительная часть всегда отрицательна.

Возвращаясь к общему решению (3.4.25), можно получить выражая в жордановой канонической форме. Экспоненциальная функция от имеет аналогичную форму (см., например Хейл (1969), стр. 99), и понятно, что элемент рассматриваемой матрицы может быть выражен в виде линейной функции от где задается так же, как и в (3.4.39), за исключением, возможно, одного с кратностью, большей чем 1. В этом случае появляется член Кратность корня не создает дополнительных членов, что можно заметить, глядя на нулевые блоки в (3.4.23).

Все это касалось конкретного режима с фиксированным значением Путем последовательного применения (3.4.25) можно получить общее решение, используя произведения матриц При малых значения окажутся комплексными, и мы их запишем в виде

Теперь мы сталкиваемся с интересным явлением, заключающимся в том, что, когда мы пересекаем границы режимов в общем решении, будут появляться члены, имеющие вид суммы и разности частот Эти члены быстро устремляются к нулю, так как их модуль равен однако, несмотря на это, они присутствуют в переходном процессе. Конечно, полный результат снова зависит от того, как изменяется спектр движущей силы в рассматриваемых режимах.

Здесь мы использовали такое, как и выше, однако результат не является просто отображением образующих Действительно, в моменты переходов наблюдается взаимодействие по крайней мере между смежными образующими и, возможно, это взаимодействие имеет место в течение более длительных промежутков времени: здесь мы имеем дело с настоящим кодом. Трудно сказать, имеет ли подобный анализ какое-либо отношение к синтезу реальной речи, но он указывает на возможность, которую стоит иметь в виду.

Рис. 3.4.3.

Временные образы высокой степени сложности также встречаются в записях электрофизиологических сигналов: электрокардиограмм электроэнцефалограмм электромиограмм (ЭМГ). Математическое моделирование таких сигналов началось давно. Во многих попытках использовались разложения по ортогональным функциям, главным образом ряды Фурье. При феноменологическом подходе действительно возникают задачи теории аппроксимации, и необходимо решать, на каких именно свойствах должна основываться аппроксимация, чтобы получить экономичное и точное представление.

Если ограничиться линейными признаками в стационарном случае, то основные признаки могут быть выбраны с использованием четких результатов, полученных Маклуром, что будет обсуждаться в гл. 13. Однако если потребовать, чтобы модель основывалась на физиологических принципах и анатомических фактах, то возникнет необходимость в более тщательном изучении структуры образа. Мы расскажем кратко о попытке такого рода, предпринятой недавно Розенбергом и другими (1972) для случая ЭКГ. При измерениях ЭКГ фиксируются потенциалы кожи, полученные от электродов, размещенных в некоторых точках поверхности тела. Имея девять точек, можно записать 20 показателей на соответствующих дорожках, которые обозначаются через . Показатели имеют различные характеристики. Хотя временные

функции не являются строго периодическими, полезно говорить о «периодах», даже если они не могут быть корректно определены. «Периоды» описываются в терминах своих максимумов, минимумов и соединяющих их дуг при помощи схематического изображения, приведенного на рис. 3.4.3. В дополнение к и фигурам можно также выделить сегменты и Физиологическая интерпретация электрической активности сердца, весьма упрощенно, такова.

Волна начинается в синусном узле, расположенном в стенке правого предсердия (см. рис. 3.4.4).

Рис. 3.4.4.

Волна проходит через стенки предсердия, пока не дойдет до атриовентрикулярного узла у перегородки, после чего имеет место краткое прекращение электрической активности. Затем активируется пучок Гиса и обе ветви этого пучка распространяют импульс правого и левого желудочков. Наконец, волна проходит через стенки желудочков. Скорость распространения волны в различных частях сердца различна. Наибольшей величины она достигает в атриовентрикулярном пучке Гиса и его ветвях.

Во время деполяризации предсердия порождается Р-волна. После короткого интервала начинается деполяризация желудочков, приводящая к контуру

Повторная поляризация, возникающая после этого, порождает Т-волну.

Разумеется, это описание дает лишь поверхностное представление о механизме, исключая такие возможности, как наличие более одной или -волиы, а также бесчисленные аномалии.

Мы преднамеренно не коснулись фактора распространения, приводящего к наблюдаемым различиям в потенциалах кожи.

Вопрос о моделировании ЭКГ, будь то нормальной или патологической, изучался в течение многих лет. Более или менее периодический вид ЭКГ наводит на мысль о применении разложения в ряд Фурье. Следуя афоризму Оскара Уайльда, «единственный способ избавиться от искушения заключается в том, чтобы поддаться ему», многие исследователи действительно поддались искушению и применили это разложение. Их попытки оказались не вполне успешными, и над этим стоит поразмыслить.

Рис. 3.4.5.

1. Пейсмекер (синусный узел Кейта и Флака).

2. Атриовеитрикулярный узел Гиса/Тавара.

3. Пучок Гиса.

4. Правая и левая ветви пучка

Если наша цель состоит лишь в сжатии информации, то, несомненно, методы Фурье могут оказаться полезными. Чтобы изучать образы — как в нормальном виде, так и в аномальном, — требуется менее феноменологический подход, основанный на известных биологических свойствах системы. Учитывая огромную сложность системы с большим числом различных компонент, маловероятно, чтобы ее удалось описать с помощью

простой модели. Требуется модель, описывающая по крайней мере основные компоненты как в отдельности, так и во взаимодействии друг с другом.

К такому типу относится модель, предложенная Розенбергом и другими. Они использовали 13 компонент, связанных так, как это показано на рис 3.4.5. Обозначения расшифрованы в табл. 3.4.1. Диаграмму можно сопоставить с вышеприведенным описанием генерации

Эти 13 компонент являются нелинейными устройствами, основанными на аналогиях механического характера, в рассмотрении которых в данный момент нет необходимости. Решая численно систему уравнений с параметрами, выбранными так, чтобы обеспечить соответствие с эмпирическими данными о частотах и проводимости тканей сердца и тела, получаем смоделированные показанные на рис. 3.4.6.

Таблица 3.4.1 (см. скан)

Пока преждевременно говорить об окончательном успехе этой модели, тем не менее она, несомненно, порождает образы, которые, видимо, находятся в достаточно близком качественном соответствии с нормальными . С помощью этой модели можно также имитировать некоторые аномалии.

Итак, исходя из конфигураций с нетривиальной внутренней структурой, порождаются образы идеализированной модели электрической активности сердца, которые функционируют, как математические машины. Регулярность образа соответствует значениям характерных признаков образующих, входящих в конфигурацию. Меняя значения признаков, можно получить различные изображения, приводящие к семейству классов образов.

Чтобы формализовать вышесказанное так же, как и в случае мы вернемся к образам в виде последовательностей абстрактных символов. Каждой величине сопоставим обыкновенное дифференциальное уравнение порядка где дифференциальный оператор не зависит от времени. Допустим, что на любом интервале уравнение имеет единственное решение

(кликните для просмотра скана)

Случай 3.4.4 (образы операторного режима). Структура конфигурации будет выбрана так же, как и прежде, за исключением того, что теперь в нее включается отношение согласования, по которому вектор должен быть непрерывным на границах между режимами. Изображения идентифицируются как функции времени.

Рис. 3.4.7.

Образующие таких образов в качестве индекса имеют а. Величины (краевые точки режимов) вместе со значениями служат как показатели связей.

Это аналогично случаю 3.4 1, однако следует отметить, что в данном случае мы требуем, чтобы абстрактная -последовательность была допустимой в алгебре изображений. Численный синтез подобного образа показан на рис. 3.7.4, он имеет 4 образующие, каждая из которых является разностным оператором

второго порядка. Признаки образующих выбраны так, чтобы придать временным образам хотя бы какое-то сходство с формой ЭКГ. Отметим, что это сделано с помощью лишь четырех операторов второго порядка.

<< Предыдущий параграф Следующий параграф >>
Оглавление