Искусственный интеллект сокращает медицинские расходы и обеспечивает точность диагностики
В недавнем исследовании, проведенном на сервере препринтов ArXiv, сравнивались точность диагностики и расход ресурсов систем искусственного интеллекта с показателями врачей в сложных случаях. Команда Microsoft AI продемонстрировала эффективное использование искусственного интеллекта (ИИ) в медицине для решения диагностических проблем, которые врачи с трудом могут расшифровать.
Часто врачи диагностируют у пациентов заболевание с помощью пошагового итеративного опроса и тестирования. Даже имея ограниченную первоначальную информацию, клиницисты сужают круг возможных диагнозов, опрашивая пациента и подтверждая с помощью биохимических тестов, визуализации, биопсии и других диагностических процедур. Решение сложного случая требует широкого набора навыков, включая определение наиболее важных следующих вопросов или тестов, осведомленность о стоимости тестов для предотвращения увеличения нагрузки на пациента и распознавание доказательств для постановки надежного диагноза.
Для оценки точности диагностики в текущем исследовании использовались еженедельные случаи, опубликованные в « The New England Journal of Medicine» (NEJM), ведущем мировом медицинском журнале. Этот журнал обычно публикует истории болезни пациентов из Массачусетской больницы общего профиля в подробном повествовательном формате. Эти случаи являются одними из самых диагностически сложных в клинической медицине, часто требующих нескольких специалистов и диагностических тестов для подтверждения диагноза.
Специально разработанная учеными платформа Sequential Diagnosis Benchmark преобразовала 304 случая в пошаговые диагностические встречи. Медицинские данные варьировались от клинических проявлений до окончательных диагнозов, начиная от распространенных состояний (например, пневмония) и заканчивая редкими расстройствами (например, неонатальной гипогликемией). С помощью интерактивной платформы специалисты по диагностике решают, какие вопросы задавать, какие анализы заказывать и когда подтверждать диагноз.
Агенты ИИ были оценены во всех 304 случаях, в то время как врачи были оценены в подгруппе из 56 тестовых случаев. В этом исследовании было замечено, что агенты ИИ показали лучшие результаты в этой подгруппе, чем врачи. Врачи, практикующие в США и Великобритании со средним клиническим опытом 12 лет, достигли 20% диагностической точности при средней стоимости 2 963 доллара за случай, что подчеркивает неотъемлемую сложность эталона. Врачи потратили в среднем 11,8 минуты на каждый случай, запросив 6,6 вопросов и 7,2 теста.
GPT-4o (последняя версия модели искусственного интеллекта (ИИ) ChatGPT от компании OpenAI) превзошла врачей как по точности диагностики, так и по стоимости. Коммерчески доступные готовые модели предлагали различную точность диагностики и стоимость.
В текущем исследовании также была представлена MAI Diagnostic Orchestrator (MAI-DxO), платформа, разработанная совместно с врачами, которая продемонстрировала более высокую диагностическую эффективность, чем врачи и коммерческие языковые модели. По сравнению с коммерческими новая платформа продемонстрировала более высокую точность диагностики и значительное снижение медицинских расходов более чем в два раза.
В MAI-DxO это было достигнуто путем моделирования виртуальной панели «врачей-агентов» с различными ролями в генерации гипотез, выборе тестов, учете затрат и проверке ошибок.
В отличие от базовых подсказок ИИ, эта структурированная оркестровка позволила системе рассуждать итеративно и эффективно.
Тем не менее, исследование показывает, что структурированные системы ИИ, такие как MAI-DxO, могут однажды поддержать или дополнить врачей, особенно в условиях, где доступ специалистов ограничен или дорог.