Шелепин, "Введение в нейроиконику", 2017
ГИПЕРОСТРОТА ЗРЕНИЯ
Принято считать, что существуют стимулы и условия, при соблюдении
которых возможно преодоление ограничений остроты зрения, опреде-
ляемых оптикой и анатомией сетчатки. Эти условия и стимулы известны
давно. Еще в 1631 году директор Монетного двора во Франш-Конте (Бур-
гундия) П. Верньер предложил устройство из двух шкал, в основу которого
заложен принцип коллинеарности двух штрихов в этих шкалах. Психофи-
зический прием измерения точности коллинеарности оказался чрезвы-
чайно важен, без него невозможно было бы возникновение машинострое-
ния — он использован во всех микрометрах, логарифмических линейках
и т. д. (Верньерная острота зрения подразумевает смещение лишь одного
штриха на верхней шкале относительно другого только одного колинеар-
ного штриха на нижней шкале, а не принцип работы нониунса как систе-
мы двух шкал.)
Определение порогов измерения коллинеарности полезно для понима-
ния многих механизмов зрительной системы. Ознакомиться с верньерным
устройством можно, изучив методику измерения размеров с помощью
штангенциркуля. В данном контексте отметим, что отклонение от колли-
неарности двух штрихов в обеих шкалах наблюдатель видит при значениях
значительно меньших, чем это допускает разрешающая способность глаза
(1 угл. мин.). Величина смещения линий друг относительно друга может
составлять всего несколько угловых секунд. Поскольку данные величины
значительно ниже разрешающей способности глаза, верньерный эффект
был отнесен к явлениям гиперостроты зрения. Введение этого термина
было связано с предположением, что у верньерных стимулов информа-
тивным является величина смещения одной линии относительно другой.
Такой точке зрения способствовало само верньерное устройство.
Рассмотрим другой подход, более верный с точки зрения оптики изобра-
жения на сетчатке. На пороге разрешения верньерных стимулов зрительная
система не осуществляет оценку смещения одной линии относительно дру-
гой. Установлено, что пороги разрешения определяет не сдвиг верньерных
линий, а наклон участка изображения возле конца соприкасающихся кол-
линеарных или смещенных линий верньерных стимулов. Необходимо обра-
тить внимание, что наблюдатель почти с такой же точностью, как взаимное
смещение линий, оценивает взаимное смещение двух точек. Единственное
добавочное условие состоит в том, что точки должны быть разнесены на до-
статочное расстояние друг от друга, то есть чтобы условия не противоречи-
ли разрешающей способности двух точек. Этот наклон продемонстрирован
методами цифровой обработки изображений (иконики) на примере двух-
точечного теста (рис. 2.7).
Представим эти изображения на пределе разрешения. Необходимо учи-
тывать размытия изображения этих точек линий оптикой глаза. Обычно
в исследованиях верньерной остроты зрения предъявляют высококон-
трастные двуградационные (черно-белые) стимулы, однако изображения
стимулов, наблюдаемых на пределе разрешения, на сетчатке глаза всег-
да размыты. Характер этого размытия описывается функцией рассеяния
оптики глаза. Чтобы построить изображение такого вида, какое оно имеет
на сетчатке, необходимо провести операцию свертки исходного изображе-
ния с функцией рассеяния точки оптикой глаза (рис. 2.7).
Для правильной цифровой обработки верньерных изображений необ-
ходимо определить соотношение размеров окна обработки изображения
(окна дискретизации) и элемента дискретизации. Этот выбор позволяет
учесть размеры верньерных стимулов и площадь фона. Ширина функции
рассеяния, взятая на половине ее высоты и равная 1 угл. мин., была вы-
брана функциональным элементом разбиения и явилась отправной точ-
кой синтеза и обработки верньерных изображений. Число элементов дис-
кретизации размытого изображения, взятое на половине высоты функции
рассеяния, позволяет соотнести результаты физиологических измерений,
выраженные в угловых минутах, с числом элементов дискретизации (пик-
селей) размытого изображения в ЭВМ, приходящихся на ширину функ-
ции рассеяния [Шелепин, Чихман, 1998].
Предельно малая длина для верньерных стимулов — это две точки, раз-
несенные на то расстояние друг от друга, когда они перестают сливаться в
одну. Это, как было рассмотрено ранее, происходит в соответствии с кри-
терием Рэлея, когда первый максимум функции рассеяния одной точки
совпадает с первым минимумом функции рассеяния второй точки. Функ-
ции рассеяния двух точек в этих условиях пересекаются на половине своей
высоты. Число пикселей полученного размытого изображения в выбран-
ном окне дискретизации компьютера можно соотносить с известными,
согласно критерию Рэлея, угловыми размерами реальных тестовых объ-
ектов. Поэтому шкалы, где единица измерения построена на его основе,
сопоставимы. В результате шкалы изображений для ЭВМ, благодаря об-
щей единице измерений, можно сопоставлять с результатами психофизи-
ческих измерений [Шелепин, Чихман, 1998].
Результат цифровой обработки изображений двумерного амплитудного
пространственно-частотного спектра представляет собой матрицу, в цен-
тре которой расположена нулевая гармоника. По мере удаления от цен-
тра элементы матрицы представляют более высокие гармоники спектра.
Ориентация элементов исходного изображения описывается ориентацией
гармонических составляющих относительно Х-, Y-координат в изображе-
нии двумерного амплитудного пространственно-частотного спектра. Зна-
чения амплитуд на дисплее кодируются яркостью элемента матрицы —
пикселя, а на бумаге — плотностью расположения точек или размером
точек полиграфического растра в соответствующем месте представления
матрицы. В изображениях спектра оценивали положение гармонических
составляющих относительно X-, Y-координат.
В верхней строке рис. 2.7 представлены исходные изображения точек.
В первой клетке одна точка, а в остальных — пары верньерных точек, ими-
тирующих верньерные стимулы с разным сдвигом. В средней строке пред-
ставлены наблюдаемые испытуемым истинные размытые изображения вер-
ньерных стимулов оптикой глаза на сетчатке на пределе разрешения. Видно,
что в результате размытия бесконечно малые точки превратились в нечеткие
пятна в соответствии с функцией размытия точки. Нижняя строка — про-
странственно-частотные спектры размытых изображений, представлен-
ных в средней строке. Главное — наклон основных гармонических состав-
ляющих в спектре, который и определяют ориента ционно-избирательные
нейроны зрительной коры, обеспечивающие простран ственно-частотную
фильтрацию в двумерной плоскости.
В средней части — результат проведенной операции, имитирующей
размытие исходных изображений оптикой глаза. В нижней части рисун-
ка представлены результаты описания размытых изображений (средняя
строка) с помощью двумерного преобразования Фурье. В нижней стро-
ке изображен амплитудный спектр. В центре пятна спектра представле-
на нулевая гармоника. X- и Y-координаты делят квадрат по центру (но
на рисунке они не изображены). Яркость пикселя на рис. 2.7 показывает
амплитуду той или иной гармоники в спектре. Нулевая частота находится
в центре светлых пятен — пространственно-частотных спектров каждого
изображения; чем дальше от центра, тем выше пространственная частота.
Вверху первого столбца рисунка представлено изображение одной точки.
Видно, что размытое изображение одной точки представляет собой круглое
пятно, а спектр равномерен во всех ориентациях, основная энергия сосре-
доточена в области низких пространственных частот, ближе к центру изо-
бражения спектра, так как это спектр не бесконечно малой точки (спектр
которой широк), а реального размытого изображения точки на сетчатке.
Во втором столбце представлено изображение двух точек. Размытое изо-
бражение двух точек, расположенных строго по вертикали друг над другом и
удаленных на расстояние, соответствующее 1 угл. мин., представляет собой
не две отдельные точки, а вытянутое пятно — размытую линию, что соот-
ветствует критерию Рэлея. В третьем столбце рисунка вверху — изображе-
ние двух точек, удаленных на расстояние, соответствующее 1 угл. мин., но
смещенных по горизонтали (на величину порядка двадцати секунд). Размы-
тое изображение этих точек представляет собой также размытую линию, но
с наклоном. Спектр похож на предыдущий, но имеет выраженную наклон-
ную составляющую.
В пространственно-частотном описании важно, где сосредоточена
основная энергия (за исключением постоянной составляющей) амплитуд-
ного спектра изображения. Эта часть спектра в данной задаче выполняет
роль информативного признака, который использует зрительная система.
Цифровая обработка верньерных стимулов позволила подтвердить, что ин-
формативным в изображении верньерных стимулов является ориентация
размытого изображения на сетчатке, которая описана с помощью двумер-
ного преобразования Фурье.
Помимо точек, ориентационный эффект справедлив и для собственно
верньерных линий. Наблюдение вблизи (то есть наблюдение больших кол-
линеарных линий) затрудняет возможность увидеть наклонную составля-
ющую в верньерных стимулах, сдвинутых по вертикали относительно друг
друга на 20 угл. сек. Положение этих линий (как и смещенных точек) экс-
периментаторы обычно интерпретируют как верньерный сдвиг одной ли-
нии относительно другой. Этот сдвиг меньше того, что может обеспечить
разрешающая способность глаза. Как правило, построение верньерных
стимулов осуществляется экспериментатором вблизи, то есть не на пре-
деле разрешения. В этих условиях он не видит изображение размытым и
признак сдвига для него превалирует, а о признаке ориентации надо дога-
дываться. В амплитудном пространственно-частотном спектре одной ли-
нии основная энергия сосредоточена в области низких пространственных
частот. Для двух коллинеарных линий (одна является продолжением дру-
гой, но с разрывом между ними на величину, соответствующую 1 угл. мин.,
и они не имеют сдвига на верньерный манер), двумерный Фурье-спектр
напоминает спектр одной линии, но более широкий. Если коллинеарность
линий нарушена (они сдвинуты на верньерный манер одна относительно
другой), Фурье-спектр совершенно иной, в нем появляется выраженный
наклонный ориентационный низкочастотный компонент. Следует еще
раз отметить, что в неразмытом изображении этих линий наклонный
компонент не очевиден. Цифровая обработка изображений обеспечивает
размытие, то есть имитирует наблюдение на пределе разрешения, имен-
но то, что и присутствует на сетчатке глаза в этих условиях наблюдения.
Затем проводим Фурье-анализ размытого изображения в окне в пределах
10 угл. мин. Область анализа выбрана на основании экспериментальных
данных. Известно, что в пределах 10 угл. мин. увеличение длины линий
понижает пороги распознавания верьерных стимулов. Дальнейшее увели-
чение длины перестает оказывать влияние на пороги распознавания вер-
ньерного стимула. Фурье-анализ в пределах этого окна наиболее четко де-
монстрирует ориентационную составляющую. Превышение угла анализа
снижает наглядность ориентационной составляющей. Повышение длины
линий от самых коротких, равных точкам до 10 угл. мин., приводит к по-
вышению выраженности ориентационной составляющей.
В четвертом столбце вверху (рис. 2.7) представлено изображение двух
точек, удаленных на расстояние, соответствующее 2 угл. мин. Результат
размытия такого изображения позволяет видеть две отдельные точки.
На этом рисунке уже не так явно наблюдается наклонная составляющая.
Для того чтобы увидеть наклон, надо мысленно соединить точки линией.
Описание же изображения этих удаленных точек с помощью двумерного
преобразования Фурье наглядно демонстрирует наличие наклонного ком-
понента. Наклонный компонент ярко выражен в низкочастотной части
спектра, то есть в части спектра, где сосредоточена основная энергия.
Выраженный наклонный ориентационный компонент в простран ст-
венно-частотном двумерном спектре верньерных изображений позволяет
продемонстрировать то, что неявно для неискушенного наблюдателя, но
присутствует в самом оптическом изображении. Благодаря цифровой обра-
ботке тестовых изображений выделяется важнейший признак — ориентаци-
онная составляющая тестового изображения. Величина наклона ее пропор-
циональна величине сдвига линий или точек друг относительно друга. Эту
величину и измеряют рецептивные поля зрительной коры, чувствительные
к ориентации гармонических составляющих пространственно-частотного
спектра изображения. Информативным признаком является ориентация
низкочастотной составляющей амплитудного пространственно-частотного
спектра, поэтому в отличие от сдвига, признак ориентации выделяется ме-
ханизмами в пределах разрешающей способности глаза и обычной остротой
зрения. Поэтому на наш взгляд, потребность в поиске невероятных меха-
низмов гиперостроты отпадает [Шелепин, Чихман, 1998].
Методами цифровой обработки изображений (иконики) и методом ма-
тематического моделирования было продемонстрировано единообразие
механизмов, определяющих остроту и гиперостроту зрения. В обсужде-
нии верньерной остроты зрения обычен акцент на нерешаемой проблеме
измерения в зрительной системе сдвига между наблюдаемыми линиями,
величина которого меньше размера колбочки, то есть меньше элемента
разбиения. Мы перенесли формулировку задачи из нерешаемой пробле-
мы в проблему решаемую. Указали на то, что происходит в этой ситуации
не измерение сдвига, которые задает экспериментатор, а обнаружение
ориентации, то, что задает сама оптика изображения. Обнаружение ори-
ентации пространственно-частотной составляющей в двумерном спектре
является естественным процессом выделения сигнала, присутствующего
в изображении. Это является физическим свойством оптического изобра-
жения. Низкочастотная ориентационная составляющая в двумерном ам-
плитудном пространственно-частотном спектре изображения верньерных
стимулов отражает объективные физические характеристики верньерных
стимулов на сетчатке. Механизмы оценки ориентации в зрительной си-
стеме изучены хорошо после работ Хьюбела и Визела [Hubel, Wiesel, 1959;
1974]. Известна ориентационная разрешающая способность [Field, 1993].
В зрительной системе имеются нейроны, которые выделяют ориентаци-
онную и пространственно-частотную составляющую в изображении. Соб-
ственно, измерения ориентации обеспечивает система ориентационно-
оппонентных нейронов [Шелепин, 1981 а; 1981 б].