Врачам свойственно ошибаться. Будет ли ошибаться искусственный интеллект, решая диагностические задачи и способны ли алгоритмы сегодня заменить врачей на этапе диагностики?

Неправильный снимок

Однажды ноябрьским вечером 54-летняя женщина из Бронкса приехала в отделение скорой помощи в медицинском центре Колумбийского университета. Она жаловалась на сильную головную боль, её зрение стало расплывчатым, а левая рука онемела и стала слабой. После первичного осмотра врачи назначили компьютерную томографию головы.

Несколько месяцев спустя, в январе следующего года, когда радиологи-интерны на примерах КТ-снимков этой женщины учились расшифровывать анализы, их педагог предложила обратить внимание на неоднородность, которая видна на снимках. Один из интернов обнаружил на снимке затемнение и сказал, что в одном месте снимок выглядит необычно.

«Легко диагностировать инсульт, когда мозг уже мертв. Хитрость заключается в том, чтобы диагностировать инсульт, прежде чем умерло слишком много нервных клеток»

Интерн точно нашел проблемное место. Однако было поздно. Тогда, в ноябре, после КТ-снимка, врачи не смогли поставить правильный диагноз. Через несколько часов после первоначального сканирования, пациентка потеряла сознание и была доставлена в отделение интенсивной терапии. Спустя два месяца женщина все еще была в больнице. Левая сторона ее тела от плеч до ног была парализована.

Диагностика – это настоящее искусство

Как врачи учатся диагностировать? И может ли машина научиться делать тоже самое? Это вопросы, которые давно интересуют и медиков, и ИТ-специалистов.

Для диагностики врач использует историю пациента и результаты осмотра. Все это помогает им собрать первоначальный анамнез. Далее эта информация упорядочивается, после чего формируется полный список возможных причин болезни. Затем предварительные тесты помогают устранить часть гипотез и получить так называемый “дифференциальный диагноз” – набор вероятных заболеваний или их комбинацию.

На заключительном этапе лабораторные тесты, рентгеновское исследование, компьютерная либо магнитно-резонансная томография позволяют окончательно поставить диагноз. Разные вариации этого пошагового процесса были точно воспроизведены в медицинских учебниках на протяжении десятилетий.

Однако диагноз – это настоящее искусство. Это вам расскажут и практикующие врачи, и любители известного сериала про доктора Хауса. Настоящие специалисты могут просто услышать один симптом, например, кашель, высказать предположение: “Это звучит, как пневмония” или “это туберкулез”. После этого задать еще несколько вопросов, например, менялся ли вес пациента, подвергался ли он воздействию асбеста, есть ли у него одышка. В зависимости от ответов, врач-диагност может сгенерировать еще несколько вариантов. А затем, с загадочностью мага, произнести: “Это сердечная недостаточность!”. И оказаться правым.

Как думает врач

Несколько лет назад исследователи в Бразилии изучили то, как думают эксперты-радиологи во время постановки диагноза. Двадцать пять радиологов попросили оценить рентгеновские снимки легких, а специальные приспособления отслеживали деятельность их мозга. На некоторых снимках были отображены патологические поражения легких. На других были показаны рисунки животных, на третьих — контуры букв алфавита. Радиологам демонстрировались снимки всех типов в случайном порядке, при этом их просили назвать как можно быстрее показанные заболевание, животное или букву алфавита. На определение увиденного и озвучивание результата радиологи тратили в среднем 1,3 секунды. При этом во всех трех случаях работали одни и те же участки мозга.

Авторы исследования пришли к подтверждению гипотезы о том, что и в случае постановки диагноза, и при идентификации животного или буквы человеческий мозг действует одинаково.

Когда мы узнаем носорога, мы не сравниваем его с орлом или мышью. Но мы можем сравнить его мысленно с единорогом, броненосцем и маленьким слоном. Точно так же в своей работе радиологи сравнивают снимок пораженного легкого с другими снимками здорового или больного органа, но не думают над тем, а действительно ли это легкое и похоже ли оно на МРТ-снимок головы.

Два вида знания: теория и практика

В 1945 году британский философ Гилберт Райл (Gilbert Ryle) опубликовал результаты свого исследования о двух видах знания. Ребенок знает, что велосипед имеет два колеса, что его шины заполнены воздухом, и что ехать на нем можно, нажимая на педали.

Райл назвал такого рода знания фактологическими, знаниями вида “знаю, что”. Но чтобы научиться ездить на велосипеде, нужно ездить: пробовать нажимать на педали, падать, регулировать силу нажатия. Такие знания ученый назвал “знать, как сделать” либо опытные знания.

На первый взгляд, эти два вида знания взаимозависимы: вы можете использовать фактические знания, чтобы углубить свои знания на опыте, и наоборот. Но Райл предостерег от искушения думать, что “знаю, как сделать” может быть сведено к “знаю, что”. Знание только правил не может научить ребенка ездить на велосипеде. Наши правила имеют смысл только потому, что мы знаем, как использовать их.

У алгоритма есть знания, но нет опыта

Алгоритмическая диагностика состоит в том, чтобы объединить знания первого и второго типа, “знаю, что” и “знаю, как сделать”.

Ранние попытки автоматизировать постановку диагноза тесно связаны с областью явного знания. Например, анализ электрокардиограммы, демонстрирующей электрическую активность сердца в виде линий на странице или экране, — задача очень простая для машины. Соответственно, программы, анализирующие кардиограмму, работают по простым алгоритимам. Определенные формы линий на кардиограмме можно однозначно связать с патологиями сердца, поэтому алгоритмы анализа кардиограммы используются давно и успешно.

В то же время, автоматическая диагностика в других областях – задача более сложная. Например, программное обеспечение, анализирующее результаты маммографии, использует глубинное обучение и учиться распознавать патологию на снимках с аналогичным диагнозом. Действительно, машина, которая видела три тысячи снимков, работает точнее, чем та, которая видела только четыре-пять. И точность постановки диагноза при использовании алгоритмов для анализа маммографии, выросла. Кроме одного, самого опасного случая — мелкоинвазивного рака молочной железы, самой опасной разновидности рака, в диагностике которого как раз особенно были заинтересованы онкологи.

В 2015 году исследователи стали работать над алгоритмами обнаружения меланомы – одного из самых опасных видов рака кожи. По замыслу исследований, если алгоритм научится диагностировать меланому, то любой человек сможет прислать снимок образования на коже и получить точный ответ. Алгоритмы обучались на 14 тысячах снимков – как злокачественных, так и доброкачественных новообразований. Однако эксперимент провалился. Ведь человек руководствуется не только явным, обозримым запасом медицинских знаний и перечнем диагностических правил. Есть еще опыт, дополнительные факторы, которые вам не с первого раза озвучит даже самый опытный клиницист. А есть еще интуиция, которую запрограммировать невозможно.

Научить машину

Джеффри Хинтон (Geoffrey Hinton), ученый из Университета Торонто, очень осторожно говорит о той роли, которую алгоритмы будут играть в клинической медицине и в диагностике.

Его прогноз на будущее автоматизированной медицины основан на простом принципе: “Возьмите любую старую проблему классификации, где у вас есть много данных. Эта проблема может быть решена просто путем глубокого изучения – алгоритмы смогут прочесть снимки и поставить диагноз, предварительно проанализировав десятки и сотни тысяч таких снимков”. Однако не стоит ожидать, что компьютер установит причинно-следственные связи и поставит точный диагноз в условиях существования огромного количества дополнительных факторов, некоторые из которых сложно измерить и классифицировать.

“Например, у вас на пальце есть красный волдырь. Причиной этому может быть ожог от утюга или воспалительный процесс как проявление какого-то аутоиммунного заболевания”, – комментирует Хинтон. – “Система глубинного обучения не имеет никакой объяснительной силы. Черный ящик не может исследовать причину”.

Слово “диагноз” происходит от греческого понятия “распознавание”. Алгоритмы машинного обучения станут лучше, когда научатся отличать родинки от меланом. Но медицина и диагностика в общем выходят за пределы этих алгоритмов. “На сегодня алгоритм может помочь врачу, но никак не заменит его”, — считает Хинтон.