18+
Выходит с 1995 года
21 декабря 2024
Принцип предсказывающего кодирования в современных исследованиях

Представляем вашему вниманию запись доклада М.В. Фаликман «Принцип предсказывающего кодирования в современных когнитивных исследованиях» и его обсуждения в рамках Школы антропологии будущего РАНХиГС, состоявшихся 23.04.2020 г.

Мария Вячеславовна Фаликман — доктор психологических наук, руководитель департамента психологии факультета социальных наук, ведущий научный сотрудник научно-учебной лаборатории когнитивных исследований Национального исследовательского университета «Высшая школа экономики», старший научный сотрудник Центра когнитивных исследований филологического факультета МГУ им. М.В. Ломоносова, старший научный сотрудник лаборатории когнитивных исследований РАНХиГС, научный руководитель Московского семинара по когнитивной науке.

Сегодня мне интересно подробное обсуждение в последние годы очень активно обсуждаемого принципа предсказывающего кодирования, с которым мы видим очень резкий рост числа исследований буквально в последние десять лет. Я время от времени «ныряю» в базу данных по медицинским и нейропсихологическим исследованиям, к настоящему времени работ уже тысячи. Резкий рост числа работ, посвященных принципу предсказывающего кодирования приходится где-то на 2015 год, хотя начиналось все очень и очень скромно. Все начиналось с применения принципа предсказывающего кодирования к пониманию того, каким образом устроены процессы торможения, процессы связи между центром и периферией рецептивного поля у клеток сетчатки. Этот принцип предлагалось применять таким образом, что сигналы с рецепторов сетчатки, которые окружают данную конкретную клетку, усредняются и генерируют статистическое предсказание относительно того, что должно прийти на данный конкретный рецептор. То есть, грубо говоря, предсказание на основе контекста, на основе окружения того, что находится вокруг данного конкретного рецептора. Да, это вроде бы очень-очень локальный феномен, но к 2014-2015 году мы видим резкий всплеск интереса к предсказывающему кодированию как механизму и самому представлению о предвосхищении в западных когнитивных исследованиях. В это же время вышли две наиболее яркие монографии: «Предсказывающий разум» Джейкоба Хови (Hohwy J. The predictive mind, 2014) и еще одна совпавшая с ней по времени книжка — «Антиципация: обучение на основе прошлого: российско-советский вклад в науку об антиципации» (Anticipation: Learning from the Past. The Russian/Soviet Contributions to the Science of Anticipation, ed. Mihai Nadin, 2015). Те, кто был на моем выступлении в декабре, видели, что там находится под обложкой, это целый ряд работ начиная от доминаты Ухтомского и заканчивая установкой Узнадзе, естественно, экстраполяция Крушинского, естественно, и акцептор действия Анохина, естественно, понятие модели потребного будущего Николая Александровича Бернштейна. В этом докладе я остановлюсь более подробно на идеях Бернштейна — мне кажется, именно Бернштейн ухватил наиболее точно суть того, что сейчас оказывается ядром современных моделей предсказывающего кодирования.

Что лежит в основе физиологии активности, или биологии активности, как говорит Александр Григорьевич , Николая Александровича Бернштейна? Он пытается понять, как происходит самоорганизация в живых системах. И если говорить о самоорганизации, естественно, начинает с того, что противопоставляет типичному для физиологии того времени принципу реактивности принцип активности. В частности, рассматривает процесс движения как решение двигательной задачи. Я воздерживалась от словосочетания «порождение движения», «построение движения». Собственно говоря, что означает «задача»? Это означает, что перед живым организмом стоит некоторая цель, которая должна быть достигнута в данных условиях на основе той информации, которую организм, опять же, активно «вычерпывает» из среды. И метафора, которую Бернштейн предлагает, это метафора, которую мы все знаем, это метафора построения, выстраивания движения на разных уровнях на основе обратной связи относительно того, как оно устроено. Здесь Бернштейну приходится заменить картезианскую рефлекторную дугу на рефлекторное кольцо, в котором ключевое место занимает решаемая задача и «порции» программы, соответствующие ей, и сличение сигнала, части того, что Бернштейн обозначает как модель потребного будущего, и информации о текущем положении дел с рецепторов, который позволяет осуществлять сенсорные коррекции.

Все хорошо знакомы с тем, как выглядит рефлекторное кольцо Бернштейна, я не буду на этом подробно останавливаться, только обращу ваше внимание на треугольничек «задающий прибор — рецептор — прибор сличения». Мы сегодня увидим его еще не один раз с соответствующей перешифровкой разности между желаемым и текущим состоянием дел, и «скидыванием» этого на исполнительный орган на разных уровнях, что очень важно.

Бернштейн, будучи физиологом, показывает, что движение строится одновременно на разных уровнях, причем только один уровень соответствует непосредственно смыслу решаемой задачи, а остальные уровни «обслуживают» ее решение, тем самым выступая в роли фоновых и реализуя так называемые технические коррекции. Бернштейн сам не нарисовал, как это должно было бы выглядеть, это нарисовала Юлия Борисовна Гиппенрейтер. У нас есть программа, и на каждом из уровней (здесь их два, но движение может, в зависимости от содержания задачи, включать и больше, даже движение точности, ловкости требует уже три уровня, а не два). Мы видим, что программа общая, на каждом уровне задающий прибор, прибор сличения и так далее свои, на каждом уровне коррекции свои, а эффектор, исполнительный орган, — общий. То есть все коррекции, так или иначе, сводятся на этот исполнительный орган. Собственно говоря, задача приобретения двигательных навыков, по Бернштейну, заключается в том, чтобы научиться согласовывать эти иногда противоречащие друг другу сенсорные коррекции, приходящие с разных уровней.

И интересно, что эти идеи оказались востребованы в отечественной психологии восприятия, которая строилась в логике психологической теории деятельности. Опять же, деятельность — это активность. Если мы рассматриваем восприятие как перцептивную активность, нам нужно понять, как эта активность организуется. И оказалось, что логика теории Бернштейна здесь очень неплохо применима. Это прекрасно проанализировала в своей диссертации Ирина Евгеньевна Сироткина (Сироткина И.Е. Роль исследований Н.А. Бернштейна в развитии отечественной психологической науки, 1989), что-то подробнее попытались посмотреть мы с Екатериной Печенковой в своей статье (Фаликман М.В., Печенкова Е.В. Принципы физиологии активности Н.А. Бернштейна в психологии восприятия и внимания: проблемы и перспективы, 2016). Появляется понятие перцептивной задачи. Метафора построения движения превращается в метафору построения образа на основе предвосхищения, преднастройки, что сродни складывающейся в 70-е годы в работах когнитивиста Р. Грегори идеи о восприятии как проверке гипотез. Выдвигается предположение (тоже Юлия Борисовна Гипеннрейтер), что мы можем говорить не об однонаправленном процессе построения образа, а о перцептивном кольце, что происходит параллельно с развитием идеи о перцептивном цикле Ульрика Найссера, где процесс восприятия направляет схема, которая, в свою очередь, модифицируется под влиянием этого процесса. Ну и, наконец, заимствуется идея уровней построения движения, которая отражается в идее уровней построения образа, или иерархии познания, которую развивает, в частности, Борис Митрофанович Величковский, но не только он.

И, что любопытно, мы видим в некоторых случаях реинкарнацию этих идей в работах когнитивистов после 2010 года, начиная от «торжественного шествия» принципов предсказывающего кодирования. Это статья коллектива в главе с Карлом Фристоном (Adams et al. Предсказывающее кодирование, 2013), которые прямо «собирают» из обсуждавшихся в когнитивных исследованиях частей кольцо Бернштейна, утверждая, что перцептивную и моторную системы следует рассматривать не изолированно, а как единую активную машину логического вывода, предсказывающую сенсорные входы во всех модальностях. И фактически это развитие принципа обратной связи, который, так или иначе, озвучивается в самых разных работах когнитивистов начиная с самого конца 90-х годов. В частности, в 2000-м году довольно громко звучит психофизика повторновходящих проводящих путей, которая предполагает межуровневое взаимодействие между разыми уровнями обработки зрительной информации на основе обратной связи. В 2003 году появляется до сих пор активно обсуждаемая и живее всех живых идея о двух типах сознания: сознание феноменальное, чувственная ткань сознания, по сути дела, если мы вспомним Леонтьева, и сознание как доступ, возможность отчитаться. Но мы видим, опять же, разные ее реинкарнации в виде сознания первого порядка, сознания второго порядка…

Идея прямых и обратных связей в восприятии набирает все больше и больше сторонников. В частности, в исследованиях зрительного восприятия эта идея оказывается востребована, прежде всего, с появлением ряда работ, связанных с иллюзиями, основанными на предвосхищении. Например, смысл иллюзии захвата вспышки в том, что мы воспринимаем положение объекта не там, где он находится, а там, где мы ожидаем его увидеть. Два «кита» исследований зрительного восприятия, Патрик Каванах и Стюарт Анстис, публикуют статью, отмечая, что, по всей видимости, механизм этой иллюзии — предсказание положения объекта.

Происходит такой «взрыв», уже «подстеленный», как я сказала, работами начала 2000-х годов, в частности, вот этой вот идеей прямых и обратных связей. Самая цитируемая история про иерархии и перевернутые иерархии в зрительном восприятии — это статья Мерав Ахиссар и Шауля Хохштейна (Ahissar M., Hochstein S. View from the top: hierarchies and reverse hierarchies in the visual system, 2002), которые предлагают рассматривать зрение как сопоставление полученных на основе опыта представлений об окружающем мире и сенсорного входа. Что, в свою очередь, очень сильно напоминает модель упомянутого уже мной сегодня Ричарда Грегори, которую он высказывает еще в 70-х и в 90-х обобщает. Для него восприятие — процесс проверки гипотез, основанных на нашем прошлом опыте. Мы видим входящий сигнал, генератор гипотез и нисходящую обратную связь, которая направлена на сопоставление гипотезы с полученным сигналом.

В 2015 году философ Энди Кларк прямо предлагает рассматривать механизм предсказывающего кодирования как общий принцип работы психики, нужный уже не только для объяснения восприятия и внимания, но и воображения, эмоций, психосоматических эффектов, плацебо-эффектов, и прочее, и прочее, и прочее.

В позапрошлом году появляется статья Карла Фристона (K. Friston: Does predictive coding have a future?, 2018) с таким робко-провокативным названием «Есть ли будущее у предсказывающего кодирования?», где он фиксирует переход к трактовке мозга как органа, активно конструирующего объяснения того, что происходит в окружающем мире. Я специально подчеркнула эти слова: активно конструирующего. И восприятие, в логике работ Фристона, рассматривается как многоуровневый процесс согласования текущих репрезентаций (вспоминаем бернштейновское Istwert) и предсказаний (опять же, вспоминаем бернштейновское Zolder) относительно сенсорного входа, то есть как процесс активного вывода. При этом для Фристона ключевым понятием его концепции предсказывающего кодирования является понятие минимизации ошибки программирования. То есть, грубо говоря, организм, или система, в ходе самоорганизации, получая или активно «вычерпывая» информацию из окружающего мира, стремится минимизировать ошибку прогнозирования, потому что ошибка — это, по сути дела, не связанная, свободная энергия, то есть ошибка — это увеличение энтропии. Самоорганизующаяся система стремится к уменьшению энтропии за счет согласования предвосхищаемого и текущего положения дел.

Отмечу, что в статье Дмитрия Алексеевича Леонтьева почти 10-летней давности (Леонтьев Д.А. Самоорганизация живых систем и физиология поведения, 2011) прямо подчеркивается и подробно анализируется, что Бернштейн решает ровно эту задачу, задачу понимания того, каким образом выстраивается самоорганизация в живых системах.

У Фристона свой ответ на этот вопрос. Он предполагает, что в основе самоорганизации лежит механизм байесовского моделирования, то есть механизм условно-вероятностного прогноза. Наверное, все хорошо помнят, что учинил в 18-м веке преподобный Томас Байес, пресвитерианский священник и автор единственной математической, единственной богословской работы. Он, по сути дела, разработал инструментарий для описания того, каким образом мы можем уточнить вероятность того, что наша гипотеза верна, по мере появления новой информации или новых данных. Базовая ситуация для применения теоремы Байеса — это когда у нас есть две тарелочки, на одной 10 пирожков с вишней и 10 с яблоками, на другой 5 с вишней и 15 с яблоками, и некий человек взял откуда-то пирожок с яблоками. И мы имеем возможность оценить, с какой вероятностью он взял его со второй тарелки, хотя исходно тарелки равны. Наша априорная вероятность 50 на 50, хоть оттуда, хоть оттуда, но у нас появляются новые данные, и мы можем вычислить вероятность, что пирожок оттуда, а не оттуда.

Почему механизм байесовского моделирования сейчас оказался востребован в математической обработке данных, в анализе, в том числе, результатов и психологических экспериментов для уточнения сравниваемых гипотез? Если мы посмотрим, как это работает в восприятии, мы увидим, что основной механизм предсказывающего кодирования восприятия — это уточнение вероятности предсказаний относительно низкоуровневых сенсорных входов на основе обратных связей от более высокоуровневых структур, что, по сути дела, было описано в 19-м веке Германом фон Гельмгольцем в его теории бессознательных умозаключений, на основе которой Гельмгольц объяснял, в частности, возникновение зрительных иллюзий.

То есть, если мы вернемся к идее «байесовского мозга» Фристона, фактически получается, что человек воспринимающий, человек действующий, в логике этих моделей, активно строит допущения о причинах ощущений на основе порождающей модели мира, при этом мозг выступает как «статистический орган», орган, проверяющий гипотезы с использованием инструментария предсказывающего кодирования, в частности, байесовского моделирования.

Что здесь принципиально отличается от Бернштейна. Я напомню, что в «кольце Бернштейна» разница между предвосхищаемым и текущим положением дел считывается внутри одного уровня. В современных моделях предсказывающего кодирования мы все время говорим о межуровневом взаимодействии. И когда сигнал, поступающий с нижележащего уровня, сопоставляется с сигналов вышележащего, с сигналом предсказывающим, разница отправляется на следующий уровень, который сравнивается с предсказанием, идущим с еще более высокого уровня, и тем самым мы пытаемся минимизировать ошибку прогнозирования, ошибку предвосхищения. Причем в последние годы, я бы не сказала, что после декларации Энди Кларком универсальности принципа предсказывающего кодирования, скорее параллельно ему, подобного рода разработки начинают появляться в исследованиях за пределами когнитивных.

В частности, известная исследовательница эмоций и нейрофизиологии эмоций Лиза Баррет предлагает теорию конструируемых эмоций (construction emotion theory) . Подчеркну конструктивистский характер этой модели строго на основе принципа предсказывающего кодирования, который она применяет к трем сферам: регуляция поведения организма в среде, восприятия действия и интероцептивные сигналы, ответ иммунной, эндокринной и периферической нервной системы... На схеме мы видим, что ошибка предсказания передается между этими системами. Вычисленная в одной из них, в висцеральной, она передается дальше в моторную, вычисленное расхождение состояния передается на сенсорные входы.

То есть глобально мы видим, как когнитивная архитектура и вообще представления о психике «от входа к выходу» изменяется на систему многоуровневого и устроенного на основе принципа обратной связи. Это те уровни и кольца, которые в своей модели построения движения, модели решения двигательной задачи, «ухватил» Бернштейн, хотя, напомню, у Бернштейна коррекции в основном случаются внутри уровня; в восприятии, что я связываю с отсутствием эффектора как такового, они оказываются принципиально межуровневыми. Другое дело, что пока непонятно, и исследователи это признают, как, собственно говоря, все эти процессы, процессы байесовского моделирования, реализованы на уровне нейронов, реализованы на уровне взаимодействия между нейронами. Да, мы можем сказать «мозг считает, мозг вычисляет вероятности, мозг предсказывает», но как конкретно мозг это делает, пока неочевидно.

Это все, о чем я хотела поговорить в монологическом режиме и дальше хотела бы поговорить в режиме диалогическом.

Вопросы задают:

Евгений Николаевич Ивахненко (доктор филос. наук): Как, с Вашей точки зрения, предвосхищение, во всей этой модели, оно детерминационно или контентгентно (как замена понятия случайного), то есть не определяется строго детерминистскими какими-то связями? Ведь если мы имеем физиологические структуры, то есть в некотором смысле нейронные связи, то у нас есть претензии на детерминационную модель, в конце концов это все просчитываемо, или все-таки это все имеет контентгенный характер, то есть подразумевается, что может быть и иначе, в таком смысле?

Вероника Валерьевна Нуркова (доктор психол. наук): Когда мы говорим о терминах: принцип, или тезис о, предвосхищающем кодировании — как минимум, два слова, и центральное из них — кодирование. Мы сейчас легко стали употреблять кальки с английских слов, и в данном случае это encoding — запись, фиксация чего-то (я со стороны памяти привыкла говорить). То есть нечто записывается, нечто фиксируется. И если мы говорим о предвосхищающей записи, то вообще восприятие ли это? Может быть, это совсем другой, качественно другой процесс? Потому что когда Вы показывали с иллюзиями, в ситуации со специально заданными условиями это не просто селекция: я воспринимаю то, что ожидаю, а не то, что есть на самом деле, а вообще я кодирую то, чего нет на самом деле, что вообще никак не относится к реальности. То есть я кодирую, и переписываю, и замыкаюсь в круг своих собственных ожиданий, прогнозов, уже существующих у меня репрезентаций, и мир должен действительно постараться, и вмешаться, и «стукнуть меня по голове», чтобы я перестала это делать и как-то на него обратила внимание. То есть это накатанный путь, и должно возникнуть очень интенсивное событие, чтобы «выбить» меня из моей самоподтверждающегося пророчества предвосхищений. Я понимаю, что в моих словах есть некая провокация, но, может быть, здесь есть какой-то другой заход, речь о качественно других процессах?

Юрий Львович Троицкий (канд. ист. наук): Правильно ли я понимаю, что наиболее адекватной и логической экспликацией здесь в качестве возможного языка была бы абдукция? И правильно ли предполагать, что вполне реально расширительное толкование и экстраполяция этих моделей на горизонт пресловутой «двойной спирали мозга» и главной проблемы этого столетия: мозг как биология и мозг как источник мысли?

Софья Сергеевна Сорокина: У меня вопрос сточки зрения развития науки. Насколько, на Ваш взгляд, можно понять развитие этих взглядов как попытку ответить на одну научную проблему — или это некоторые побочные эффекты попыток ответить на другую научную проблему? То есть насколько можно рассматривать эволюцию методологическую как ответ на одну и ту же научную проблему?

Аида Меликовна Айламазьян (канд. психол. наук): У меня сложилось впечатление, что модель Бернштейна более богатая и более жизненная, а вторая модель более механистическая. Мне кажется. Они до Бернштейна еще «не добежали». Как Вы к этому относитесь?

Ведет обсуждение и подводит итоги Александр Григорьевич Асмолов (доктор психол. наук).

 

Запись на канале Школы антропологии будущего РАНХиГС (видео начинается с 1:30).

В статье упомянуты
Комментарии

Комментариев пока нет – Вы можете оставить первый

, чтобы комментировать

Публикации

Все публикации

Хотите получать подборку новых материалов каждую неделю?

Оформите бесплатную подписку на «Психологическую газету»