Только став очкариком начинаешь понимать проблему
Техническая система, призванная повторить этот путь, встречает те же преграды, но в другом порядке. Первым искажает линза проектора или камеры, после защитное стекло, затем микролинзовый массив, дифракционная решётка, налагается квантовый шум приёмника, затем дискретизация по времени и по уровню, алгоритмическая интерполяция, компрессия, затем интерпретация нейронной сети, которая, как и человеческий мозг, может быть уверена, что видит то, чего на самом деле нет.
Сопоставление двух цепочек показывает, что человек и машина теряют остроту изображения по разному распределению частот: глаз — в низших гармониках аберраций, камера — в высших и в шуме квантования. Если суммировать среднеквадратичные волновые ошибки, то молодой здоровый глаз показывает двадцать–тридцать миллионов угловых секунд максимальной разрешающей способности, но фактически использует лишь половину этого ресурса из-за остаточной аберрации в десять сотых длины волны. Современный микродисплей с угловым пикселем двадцать секунд теоретически превосходит глаз, но после прохождения своей оптической цепи и после добавления шума оказывается на том же уровне — десять–двенадцать сотых волны.
Предел, который нельзя преодолеть ни глазу, ни прибору, — это дифракция на зрачке диаметром три миллиметра: она оставляет минимум шесть–восемь сотых длины волны неустранимой ошибки. Попытка компенсировать меньшее уже не даёт прироста контраста, потому что сетчатка и датчик оба работают на грани своего шумового порога.
Остаётся вопиющий разрыв: человек ощущает картинку чётче, чем измеряет прибор, — благодаря нейропластичности, интерполяции по времени и подавлению высокочастотного шума в зрительной коре. Машина может повторить этот трюк только если научится не повышать разрешение, а снижать избыточные сигналы, оставляя именно те фотоны, которые действительно изменили сцену.
Именно здесь возникает идея фотонной среды, которая не считает, а сравнивает: волновой фронт проходит через многослойную решётку, где каждый слой содержит пространственный спектр эталонного объекта. Если поля совпали — возникает автокорреляционный пик, фиксируемый одним-единственным авалонным фотодиодом. Время распознавания — десять пикосекунд на прохождение, плюс сто пикосекунд на люминесценцию, плюс пятьдесят наносекунд на накопление статистики. Энергия — четыре фемтоджоуля на операцию, что на семь порядков ниже, чем у цифровой свёртки того же размера.
Такая среда не решает проблему квалиа, но освобождает мозг от необходимости «додумывать» картинку, искажённую техническими аберрациями. Она корректирует ровно столько, сколько даёт ощутимый выигрыш: сводит общую волновую ошибку до восьми–десяти сотых длины волны — и останавливается, потому что дальше плато Маршалла-Флока: сетчатка и кора не передают больше информации, как бы ни росло разрешение.
Следовательно, точность технического зрения приближается к человеческой не через гонку мегапикселей, а через отказ от гонки: измерить аберрацию глаза встроенным волновым сенсором, скомпенсировать её тем же стеклом, а всё, что меньше дифракционного предела, оставить мозгу — он дорисует быстрее и дешевле, чем любая фазовая маска.
Свидетельство о публикации №225092901918