Различия были особенно заметны на первом этапе диагностики.
Ученые проверили, насколько точные диагнозы может ставить искусственный интеллект пациентам. Результат оказался неожиданным, пишет TechCrunch.
Отмечается, что в своем новом исследовании ученые под руководством врачей и компьютерных специалистов из Гарвардской медицинской школы и Медицинского центра Бет-Исраэль Диконесс провели ряд экспериментов, чтобы сравнить языковые модели OpenAI с работой врачей-людей.
В одном из экспериментов ученые сосредоточились на 76 пациентах, поступивших в отделение неотложной помощи Beth Israel, сравнивая диагнозы, поставленные двумя лечащими врачами-терапевтами, с диагнозами, сгенерированными моделями OpenAI o1 и 4o. Эти диагнозы оценивались двумя другими лечащими врачами, которые не знали, какие из них были поставлены людьми, а какие - искусственным интеллектом.
"На каждом этапе диагностики модель o1 либо показывала номинально лучшие результаты, либо была наравне с двумя лечащими врачами и моделью 4o", - рассказали ученые.
По словам исследователей, различия были особенно заметны на первом этапе диагностики. Именно на этом этапе доступно меньше всего информации о пациенте и наиболее остро стоит задача принятия правильного решения.
Ученые подчеркнули, что они совершенно не обрабатывали данные заранее. ИИ-моделям предоставлялась та же информация, которая была доступна в электронных медицинских картах.
Ученые поделились, что модель OpenAI o1 смогла поставить "точный или очень близкий к точному диагноз" в 67% случаев сортировки. В это же время один врач ставил точный или близкий к точному диагноз в 55% случаев, а другой - в 50%.
"Мы протестировали ИИ-модель практически по всем критериям, и она превзошла как предыдущие модели, так и базовые показатели наших врачей", - сказал Арджун Манрай, возглавляющий лабораторию ИИ в Гарвардской медицинской школе и являющийся одним из ведущих авторов исследования.
Врач из Beth Israel Адам Родман в разговоре с журналистами The Guardian заявил, что сейчас многие пациенты по-прежнему в вопросах, от которых зависит жизнь или смерть, полагаются именно на врачей, а не ИИ.
"Если мы собираемся сравнивать ИИ-инструменты с клиническими навыками врачей, нам следует начать со сравнения с врачами, которые действительно практикуют в этой специальности. Я не удивилась бы, если бы большая языковая модель смогла обойти дерматолога на экзамене по нейрохирургии, но это не особенно полезная информация", - отметила врач скорой помощи Кристен Пантагани.
Ранее ученые с помощью искусственного интеллекта смогли обнаружить сотни ранее неизвестных геоглифов в пустыне Наска в Перу. Новое исследование позволило значительно ускорить поиск древних рисунков, созданных более двух тысяч лет назад.
Работу провела международная команда под руководством археолога Масато Сакаи из Университета Ямагата в сотрудничестве с исследователями из IBM Research. Они применили систему глубокого обучения для анализа огромной территории плато Наска.