Создатель модели рабочей памяти Алан Бэддели объясняет, как работает система, которая обеспечивает взаимодействие между окружающей средой и различными аспектами ума.
Термин «рабочая память» впервые был использован в книге Джорджа Миллера, Евгения Галантера и Карла Прибрама, но они его не конкретизировали. Потом его использовали Ричард Аткинсон и Ричард Шиффрин в своей модели краткосрочной памяти, которая имеет большое влияние. Но они не сделали акцента на ее функциональной части ― это сделали мы с Грэхемом Хитчем, переработав их модели.
Наша модель отличается, во-первых, предположением, что кратковременная память может быть разделена на субкомпоненты, во-вторых, мы подчеркиваем, что эта система способна на сложные когнитивные действия и исследования на их базе. Аткинсон и Шиффрин предполагали, что она играет эту роль, но они очень мало ее исследовали. Когда мы начали работать, то обнаружили, что их модель слишком проста, и нам пришлось ее дополнить.
Исходная модель содержала три компонента. Первый — это система контроля над вниманием, которую мы назвали центральным исполнителем. Ей помогали две системы временного хранения: одна — вербальная и акустическая, которую мы в конечном счете назвали фонологической петлей, другая — ее визуально-пространственный эквивалент, визуально-пространственный блокнот. Впоследствии нам пришлось добавить четвертый компонент, который объединяет другие три, связывает их с восприятием и долговременной памятью и, помимо этого, играет роль основы полного сознания.
Центральный исполнитель, безусловно, самый важный и сложный компонент из трех ― это система внимания с ограниченной возможностью обработки информации. Она также используется в других областях, а кроме того, имеет центральное значение в нашем понимании интеллекта как концепции и сложного познавательного механизма. Исполнитель обеспечивается за счет систем временного хранения.
Мы с Грэхемом Хитчем наиболее подробно исследовали фонологическую петлю. Она может хранить информацию, основанную на речевой и звуковой форме, и способна удерживать ее через субвокальные повторения, то есть проговаривание про себя. Доказательства этому пришли из ряда источников, и один из них ― эффект фонологического сходства. Если вы попытаетесь запомнить набор терминов, схожих по звучанию, то это приведет к путанице и плохому результату. А если вы попросите человека запомнить ряд таких слов, как «яма», «день», «корова», «горячий», «солнце», то он или она запомнит их достаточно легко. Однако, если слова звучат похоже, как «рот», «кот», «год», «код», производительность существенно снижается. Системе неважны значения, поэтому, если вы дадите ей пять слов, обозначающих более или менее одно и то же, например: «высокий», «великий», «большой», «длинный», «огромный», «широкий», «крупный», «обширный», ― люди могут их запомнить почти так же хорошо, как и разные слова. Следовательно, система заинтересована в речеподобных звуках. С другой стороны, долговременной памяти важны значения. Если мы удвоим длину последовательности до пяти-десяти слов и дадим людям несколько попыток их запомнить, тогда значение слов станет намного важнее, а вопрос их звучания уйдет на второй план.
Таким образом, у нас есть маленькая герметизированная система, в которой мы можем хранить информацию, проговаривая ее про себя. Этот механизм можно продемонстрировать на ситуации, когда людям необходимо запомнить пять длинных слов, например: «холодильник», «университет», «дифтерия», «носорог», «возможность». Только 50% людей может правильно запомнить ряд из длинных слов, тогда как односложные слова запоминает 90%. Эта система неважна для понимания смысла речи, если вы можете спокойно говорить и слышать. Однако она важна для пополнения словарного запаса и на ранних стадиях обучения чтению. Можно сказать, что эта система полезна, если вам нужно удержать в памяти последовательность звуков в точном порядке.
Визуально-пространственный эквивалент называется блокнотом (sketchpad). Он одновременно хранит и визуальную, и пространственную информацию ― они, как известно, относятся к разным типам информации. Визуальная информация касается таких вещей, как форма и цвет, тогда как пространственная ― данных о местоположении. Таким образом, использование карты или проектирование здания включает пространственную информацию, а изучение иероглифа для китайского слова или запоминание цвета ― это больше визуальное задание. Сейчас мы думаем, что системы визуальной и вербальной временной памяти поддерживаются другими потоками информации.
Возвращаясь к фонологической петле, было показано, что язык жестов у глухих задействует скорее ее, а не визуально-пространственную систему, так что те задачи, которые вмешиваются в вербальную фонологическую память, также мешают языку жестов и чтению по губам. В случае визуально-пространственной системы существует два потока ― визуальный и пространственный, может, еще тактильный, при этом сам тактильный еще включает в себя отдельные рецепторы для ощущения тепла, прикосновений и боли.
Следовательно, каждый случай включает серию потоков восприятия, которые переплетаются и впадают в четвертую систему ― эпизодический буфер. Именно здесь потоки информации могут быть объединены. Для этого, предполагается, у буфера есть несколько измерений: визуальное, пространственное, семантическое и перцептивное, и он объединяет их все вместе и делает доступными сознанию, так что он находится в самом сердце сознания. Когда я впервые предложил идею эпизодического буфера, я думал, что это высокоактивная система, которая манипулирует информацией. Эксперименты, которые мы провели в последние годы, показывают, что это не так. Что он делает, так это играет роль пассивного экрана, на который может быть спроектирован результат объединения и манипуляций, который представляет реальное сознание. Мы не думаем, что это зависит от какой-то конкретной области мозга, ― скорее, это результат объединенной работы нескольких систем мозга. Так или иначе, это требует базового уровня сознания, поэтому, если вы получили травму головы или спите, ваш эпизодический буфер не будет работать в полную силу. Эпизодический буфер ― это что-то наподобие сцены, на которой все происходит, или экрана, на который проецируются события.
Рабочая память располагается в нескольких частях мозга, фонологическая петля ― главным образом в области между височной и теменной долями левого полушария. А процесс повторения информации больше включает лобную область, также известную как центр Брока, повреждение этой области может также привести к нарушению речи.
Визуально-пространственная система в основном вовлекает правое полушарие, но также может простираться и до затылочных долей, в направлении к задней части мозга. Эта область задействуется в визуальных изображениях, в то время как более центральные теменные области ответственны за обработку пространственной информации. Однако факт, что они активируются, вовсе не означает, что именно там хранится информация.
Одна из проблем в попытках использовать функциональную визуализацию для понимания работы памяти заключается в том, что она в значительной степени корреляционная. Мы просто видим, что одна область активна, но мы не видим, действительно ли она необходима той когнитивной задаче, которую мы изучаем. Например, есть интересный контраст между людьми, которые говорят, что видят очень яркие изображения, и людьми, которые говорят, что их не видят. У них одинаково хорошо работает визуальная память, но они свидетельствуют о разном опыте, и, возможно, при этом у них активируются разные зоны мозга. Это как если бы вы обращались к информации из хранилища центрального компьютера, но получить ее могли бы либо на экране, либо в устной версии. Важно то, что было в хранилище, а как это отражается ― интересный вопрос, но его не стоит путать с местом хранения.
Есть система, которую все привыкли называть краткосрочной памятью, и это подчеркивало ее временный аспект, так как предполагалось, что решающим вопросом было, сколько времени пройдет, прежде чем сохраненная информация перейдет в долговременную память. На самом деле это работает совсем не так. Кратковременная память будет держаться долго, если в этот момент не думать ни о чем другом. Более того, долговременная память может начать работу так же быстро, как и кратковременная, тогда они будут идти в параллели, и это намного вероятнее, чем предположение, что действие долговременной памяти существует только в качестве поздней стадии обработки информации.
Долговременная память также содержит серию отдельных и различающихся систем, несмотря на то что все они включены в хранение информации на более продолжительное время, чем рабочая память. В долговременной памяти существует основное различие между тем, что называют эксплицитной (декларативной) памятью, и тем, что называют имплицитной (недекларативной) памятью.
Декларативная память ― это то, что мы обычно понимаем под воспоминанием, что вы вчера кого-то встретили, или под вспоминанием, что столица Франции ― это Париж. Тогда как недекларативная память включает использование сохраненной информации для выполнения более неявных задач в отличие от активного вспоминания. Это часто выражается в изменении способа, которым вы исполняете какое-то действие. Мы описываем это скорее как обучение, чем память, например как обучение навыку езды на велосипеде. Другие эффекты имплицитной памяти могут работать в меньший промежуток времени. Скажем, если я зачитал ряд слов и затем попросил вас идентифицировать их, разговаривая при этом в шумной обстановке, вы покажете лучшие результаты относительно слов, которые услышали только что, не отдавая себе отчета почему. Этот же эффект был продемонстрирован у пациентов с сильной амнезией, которые абсолютно не в состоянии вспомнить, что они слышали какие-то слова сейчас. Так что если вы покажете таким пациентам слово, а потом спросите: «Вы слышали это слово?», то они скажут: «Нет». Однако, если вы дадите им первые несколько букв и попросите угадать слово, которое подходит, они угадают правильно в той же мере, что и здоровые люди, которые не всегда могут вспомнить что-то уже выученное.
Пациенты также покажут форму гедонистического, эмоционального обучения. Если вы дадите кому-то послушать незнакомую музыку, например корейскую, люди обычно сначала находят ее неприятной, но когда они слышат ее несколько раз, то она им нравится больше. Пациенты с амнезией тоже демонстрируют этот эффект, хотя и отрицают, что слышали эту музыку раньше. Существует много таких обучающих систем, которые действуют имплицитно и не нарушены у людей с амнезией. Они также отличаются от эксплицитной памяти для событий и фактов у здоровых людей. Они различные по существу, но их объединяет то, что они независимы от сознательного контроля за их работой.
Эксплицитную (декларативную) систему можно разделить на две широкие категории. Первая называется эпизодической памятью, которая способна непосредственно вспоминать и распознавать определенные эпизоды и события, произошедшие в прошлом. Например, они относятся к воспоминаниям прошлогоднего отпуска, который я провел в России, или к вспоминанию, что я ел на завтрак сегодня. Все это позволяет помнить определенные события, и, чтобы это происходило, нужно, чтобы они были каталогизированы таким образом, чтобы к ним был доступ, ведь то, что вы ели на завтрак сегодня, может быть не тем, что вы едите обычно. Так что необходима систематизация и путь для нахождения конкретных воспоминаний в этом каталоге. Как работает эпизодическая память? Она ассоциативно связывает контекст, время и место, в котором произошло событие, как бы склеивая его. Если вы помните чье-то имя, это позволит вам вспомнить образ самого человека, так как этот тип памяти склеивает разные виды вашего опыта. Правда, это хрупкая память, к сожалению, и она ухудшается с возрастом и сильно нарушена у пациентов с амнезией.
В часто цитируемой работе Джордж Миллер предложил концепцию магического числа семь плюс-минус два. Обычно это понимается так, что мы способны запомнить лишь семь элементов, например семизначный номер телефона. Тем не менее наиболее важный аспект этой работы не само количество семь, а концепция отрезков информации, на основании которой семь элементов могут быть скомбинированы в единый отрезок, например скорее в слово, чем в бессмысленный набор букв. Также это работает и на уровне слов, если мы берем примерно от пяти до пятнадцати несвязных слов. Если они составляют осмысленное предложение, это позволяет фразам выступать в роли отрезков информации, как это делали слова. За прошедшие годы предполагаемый объем рабочей памяти уменьшился, и сейчас мы допускаем ее размер в три-четыре в соответствии с масштабными исследованиями Нельсона Кована.
Работа фонологической петли может быть нарушена у людей с повреждениями областей в левом полушарии мозга, ответственными за язык. Однако иногда у пациентов с сохранившейся способностью к речи может быть сильно нарушена кратковременная вербальная память, и их способность запомнить номер телефона ограничится двумя цифрами. Они не повторяют, так как это приводит информацию в неправильное хранилище. Другие пациенты могут иметь нарушения в визуально-пространственном блокноте. Также бывают случаи нарушения работы центрального исполнителя, как правило, в результате повреждения лобной доли. Это может привести к серьезным проблемам в организации жизни, планировании, ненадежной работе автобиографической памяти и к проблемам в обращении к итоговой памяти, что приводит к конфабуляции (ложным воспоминаниям. — Прим. ред.).
Один пациент, отдыхавший дома после пребывания в реабилитационном центре, спросил у своей жены: «Почему ты продолжаешь говорить людям, что мы женаты?», она ответила: «Но мы ведь женаты, и у нас трое детей. Было бы странным жить вместе, имея трех детей, и не быть женатыми». Когда он начал отрицать, она показала свадебные фотографии, на которые он отреагировал: «Что ж, этот парень похож на меня, и это не я, потому что я не женат». Через час он уже не утверждал этого.
Дело в том, что он не шутил, потому что все его поведение демонстрировало конфабуляцию. Однажды мы видели, как он везет пациента на инвалидном кресле вверх по дороге из реабилитационного центра. Когда мы его остановили, он объяснил, что везет друга посмотреть на систему канализации, над которой он работал как инженер. Он действительно построил такую систему много лет назад, но она располагалась очень далеко, и туда невозможно было добраться пешком.
Поэтому лобные доли очень важны для генерирования и проверки воспоминаний. Проблема извлечения информации может быть продемонстрирована с помощью простого задания: надо попытаться вспомнить названия как можно большего количества животных за 90 секунд. Большинство людей называет дюжину и больше. Наш пациент сказал: «Собака… Их должно быть тысячи… Я уже называл собаку?» Однако он не потерял свои знания, и, когда я спросил его, как называется прыгающее австралийское животное, он немедленно ответил: «Кенгуру». Его проблема была в контроле поиска информации в памяти. Лобные доли важны и для множества других задач, включая исполнительный контроль и выполнение теста на уровень интеллекта. И серьезное повреждение обеих лобных долей может привести к серьезным трудностям.
Существует несколько утверждений, что рабочая память может быть натренирована, и некоторые программы улучшают результаты, показанные на заданиях, выполняемых в рамках тренинга, и на схожих с ними. Но при этом люди не демонстрируют, что это улучшение будет распространяться на такие активности, как обучение математике, чтению или выполнение тестов на уровень интеллекта. Возможно, дополнительный тренинг, направленный на расширение возможностей, изменит это положение, но пока этому есть немного доказательств.
Существуют сотни открытых вопросов, связанных с рабочей памятью. Наиболее активно исследуемые области: визуальная кратковременная память и рабочая память; все большее число людей переключились на исследования визуальной рабочей памяти с исследований визуального восприятия и визуального внимания. До сих пор они сосредоточивались на ранних стадиях визуальной кратковременной памяти, тогда как мы фокусировались больше на роли контроля внимания, часто используя методы, разработанные для изучения вербальной рабочей памяти.
Большая работа была проведена с использованием нейровизуализации, хотя мне не кажется, что благодаря ей мы сильно продвинулись в понимании рабочей памяти. Но в конечном счете, без сомнений, это даст результаты. Я думаю, отсутствие прогресса отражает сложность системы рабочей памяти и факт, что очень дорого и трудно проводить качественные эксперименты с нейровизуализацией, которые были использованы для проверки базовых концептов. Экспериментальный психолог может провести четыре-пять экспериментов с привлечением здоровых людей и будет при этом контролировать все переменные. Иначе обстоят дела с нейровизуализацией.
Более того, многие области мозга вовлечены в процессы рабочей памяти, а методы нейровизуализации позволяют наблюдать лишь активацию разных регионов, что затрудняет получение ясных и воспроизводимых результатов. Сейчас этот метод более успешен в изучении процессов восприятия и моторного поведения, при которых происходит не так много сложных интеракций в мозге.
Если бы я все начинал сначала, я бы, наверное, выбрал изучение влияния эмоций и мотивации на рабочую память. В когнитивной психологии нам не хватает точной концепции ментальной энергии. Когнитивная психология в основном связана с контролем действия. Тем не менее нам также нужно думать о том, что именно контролируется и почему мы вообще действуем. На уровне индивидуума энергия очень важна для достижения цели, однако психологи в значительной степени игнорируют эту область. Для меня это захватывающее и еще не исследованное направление.
Это перевод статьи англоязычного издания Serious Science. Прочитать оригинальную версию текста можно по ссылке.