Мозг — это математика: как нейросети помогают нейробиологам

Иллюстрация: pxfuel
Глубинные нейросети научились так эффективно распознавать объекты, что их используют во многих привычных технологиях: в соцсетях, смартфонах и беспилотных автомобилях. Но в Deep neural networks есть одна проблема: даже разработчики не всегда понимают, как именно алгоритмы принимают решения.
Исследователи из Стэнфордского университета увидели в этом возможность и решили использовать ее для того, чтобы лучше понять, как работает наш мозг. Все началось с того, что в 2011 году профессор Массачусетского технологического института Дэниел Яминс создал систему, которая распознавала объекты вне зависимости от их положения и размеров. Это то, что умеет любой ребенок, но то, чему крайне сложно обучить машину.
Этот алгоритм эффективно работал с животными, машинами, лодками, лицами, фруктами и самолетами. При этом для его тренировки было использовано всего 5,7 тысяч фотореалистичных 3D-изображений. Но результаты он показывал не хуже, чем живой человек.
После этого Яминс и его коллега Джеймс Дикарло захотели понять, как разные отделы мозга специализируются на разных задачах. Например, зачем существует особая зона для распознавания лиц. Изучение глубинных нейросетей показало, что это самый математически эффективный способ решать подобные задачи. Кроме того,
оказалось, что нейросети, распознающие речь, музыку и запахи, работают схожим образом со слуховыми и обонятельными отделами мозга.
Нейросети-визуалы построены как бы на нескольких уровнях: одни уровни могут различать фон и фигуры, другие — искать объекты по краям изображения, третьи — определять цифры или текст. Они умеют выделять закономерности, например, находить сходства между всеми котами или всеми яблоками. При этом в процессе обучения алгоритм сам образует нужные связи и решает, какой уровень за что будет отвечать. Фактически нейросеть учится самостоятельно, за что иногда ее называют «черным ящиком».
Визуальная информация в мозге тоже обрабатывается на нескольких уровнях: сначала определяются общие характеристики — формы, контуры, края, а затем — более сложные, такие, как объекты и лица.
Нейробиолог Нэнси Канвишер, вдохновившись работами Яминса, решила выяснить, почему лица требуют отдельного процесса. Она обучила две нейросети: одну — для лиц, другую — для прочих объектов, и оказалось, что по отдельности они плохо работают с изображениями, для которых они не предназначены.
Но когда Канвишер натренировала одну нейросеть на решение обеих задач, сеть поступила так же, как и мозг человека: разделила процессы распознавания. Первым делом она концентрировалась на простых объектах, а потом — на более сложных формах. В другом эксперименте ученые создали систему, которая повторяла устройство уха и отправляла звук нейросети, предварительно сортируя его по частотным диапазонам.
Самым эффективным математическим решением оказалась система, которая действовала также, как и отделы мозга, отвечающие за слух.
Сегодня Яминс хочет добиться того, чтобы нейросети могли учиться на одном-единственном примере, как это делают люди, которым достаточно один раз увидеть кота, чтобы всю жизнь узнавать котов. Нам же остается удивляться тому, что наш мозг действует также эффективно, как и алгоритмы, построенные на чистой логике.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.