Новости медицины: ИИ OpenAI o1 диагностирует болезни точнее врачей — исследование Science

Искусственный интеллект, способный «рассуждать», теперь диагностирует реальные медицинские случаи не хуже, а то и лучше врачей. К такому выводу пришли авторы исследования, опубликованного в престижном научном журнале Science.

Ученые взяли неизвестные ранее клинические случаи и устроили соревнование: новая модель рассуждений OpenAI — o1 — против старой версии GPT-4, а также против дипломированных врачей и ординаторов. Результат? o1 методично разобрала конкурентов. В тестах с электронными медицинскими картами случайных пациентов отделения неотложки одной из бостонских больниц новая ИИ-модель ставила верный диагноз в более чем двух третях случаев при первичной сортировке. Для сравнения — двое опытных лечащих врачей угадывали правильно лишь в половине случаев.

Доктор Роберт Вахтер, профессор и заведующий кафедрой медицины Калифорнийского университета в Сан-Франциско, назвал результаты «важными» и заявил, что теперь «бесспорно»: современный ИИ превосходит старые языковые модели и докторов в постановке правильного диагноза и выборе дальнейших действий. Вахтер, кстати, не участвовал в исследовании, но написал книгу о том, как ИИ меняет здравоохранение.

Впрочем, без ложки дегтя не обошлось. Вахтер тут же добавил, что до полного внедрения ИИ в клиническую практику нужны еще исследования. «Вопрос в том, насколько это соответствует реальной жизни. Ответ — умеренно хорошо, но не идеально», — написал он.

И это ключевой момент. Исследование ограничивалось только текстовым вводом. Никаких визуальных и звуковых подсказок, на которые врачи обычно полагаются при диагностике: степень distress пациента, медицинские снимки — все это осталось за бортом. По меткому замечанию Вахтера, тест с письменным, часто искусственно «чистым» клиническим сценарием — это совсем не то же самое, что зайти в приемный покой и разбираться с хаосом.

Доктор Ашвин Рамасвами, инструктор урологии в Mt. Sinai, который изучал способность ИИ отвечать на потребительские запросы о здоровье, тоже оценил исследование, но с оговорками. Да, дизайн хорош, но ИИ рассуждал на основе клинической информации, которую уже собрали, отфильтровали и задокументировали люди. В реальной жизни пациенты могут быть напуганы, пьяны или активно умирать — врачи сталкиваются с этими вызовами ежедневно.

«Это ценно и показывает прогресс технологии, но пропускает центральную часть работы „быть врачом"», — резюмировал Рамасвами.

Он также хотел бы увидеть детали ошибок, допущенных и врачами, и ИИ. Если модель ошиблась, но была близка к правильному ответу — это одно. Если же ошибка опасна и необъяснима — совсем другое. В собственном недавнем исследовании Рамасвами, опубликованном в Nature Medicine, он и его коллеги обнаружили, что «режимы отказа» ИИ могут быть «зубчатыми»: нейросеть может блестяще диагностировать редкую сложную болезнь, но пропустить что-то клинически очевидное.

Итог: исследование укрепляет позиции ИИ как «контролируемого инструмента второго мнения для врачей». Сами авторы работы из Beth Israel Deaconess Medical Center в Бостоне подчеркивают «срочную» необходимость дальнейших исследований и клинических испытаний, чтобы понять, как ИИ может улучшить практику и результаты лечения пациентов.

Эксперты из Флиндерского института здоровья в Австралии, написавшие сопроводительную статью в том же Science, согласны: заменять врачей ИИ нельзя. Нужна коллаборация с контролем, контекстным суждением и ответственностью. «Без надежно доказанной эффективности, справедливости и безопасности многие системы ИИ останутся непригодными для клинического использования», — вынесли вердикт ученые.

Итак, очередной прорыв — ИИ умеет ставить диагнозы. 67% точности против жалких 50% у врачей. Старая добрая Science опубликовала, чай не бабка на лавочке нашептала.

Но давайте по существу. Исследование — идеальный, стерильный мир, где пациенты уже превращены в аккуратные текстовые описания. Никто не блюет, не орет, не вырывает капельницу. Идеальные больные для идеальной машины. А в реале — хаос, пьянь, испуганные глаза и «доктор, мне кажется, я умираю». ИИ этого не учитывает. Потому что это не загрузишь в текстовый промпт.

Профессор Вахтер, который книгу написал про ИИ, честно предупреждает: «Это не то же самое, что зайти в приемный покой». Ну спасибо, кэп. Доктор Рамасвами добавляет перцу: ИИ может диагностировать редкую хворь, но пропустить банальный аппендицит. Зубчатые ошибки — красивое название для опасной ерунды.

И самое смешное: авторы взывают к «срочным клиническим испытаниям». Ага, щас. Кто будет отвечать, когда ИИ скажет пациенту с раком «у вас просто стресс»? Кто будет держать ответ перед родственниками?

Резюме: технология движется — это факт. Но пока ИИ годится лишь на роль застенчивого ассистента, который шепчет врачу на ухо свои догадки. Заменять им живого доктора? Только если вы хотите легализовать русскую рулетку в здравоохранении. Безопасность, справедливость, эффективность — без этого ИИ останется дорогой игрушкой для богатых клиник, а не спасением для пациентов.

ИИ поставил диагноз точнее врачей

PEREC.RU

Похожие материалы