Искусственный интеллект кажется более объективным, чем люди. Просматривая тысячи резюме или медицинских карточек, он относится к ним без эмоций. Однако, его непредвзятость ограничена теми данными, которые он получает.
Истории о том, как ИИ отсеивал женские резюме, потому что большинство технических работников в компании были мужчинами, и он сделал вывод, что мужской пол — характеристика подходящего сотрудника, широко известны. Но бывают и более опасные ситуации.
Например, медицинские исследования могут не включать женщин (или конкретно беременных, кормящих, в менопаузе), из-за чего разработанные препараты или поставленные диагнозы оказываются неподходящими.
Онлайн-приложения, предлагающие обратиться к врачу на основе заданных симптомов, могут интерпретировать боль в спине и руке как один из признаков сердечного приступа у мужчин, и по непонятной причине — депрессии у женщин.
Программы на основе ИИ, которые обещают распознать рак кожи на начальных стадиях, хуже работают с темнокожими людьми, потому что основываются на данных о белых людях и оценивают не только размер и форму родинки, но и контрастность.
Схожая проблема и с алгоритмами распознавания лиц. В статье Forbes говорится, что при обучении нейросети 80% фотографий изображали белых, а 75% – мужчин. В итоге при тестировании оказалось, что точность обнаружения мужских лиц — 99%, а темнокожих женщин — всего 65%.
Причина такого неравенства в том, что за построение алгоритмов отвечают люди, а значит предубеждения, нежелание замечать какие-то группы населения или банальный недостаток данных, напрямую отражается на работе нейросетей.
По данным Всемирного экономического форума, 78% специалистов в области ИИ во всем мире — мужчины. А Bloomberg обнаружил, что в восьми крупнейших технологических компаниях, только 20% технических должностей занимают женщины. В отраслях STEM (наука, техника, инженерия и математика) женщин всего 25%, и только 9% – на руководящих позициях.
Исследовательская компания Gartner, Inc утверждает, что к 2022 году 85% проектов ИИ будут давать ошибочные результаты из-за недостаточно разнообразных данных. Учитывая, что технологии внедряются в нашу жизнь во всех сферах – от поиска работы до лечения смертельных заболеваний – эта информация не радует.