В будущем технология может быть интегрирована в чат-бот Copilot и поисковую систему Bing.
Ученые из Microsoft поделилась впечатляющими результатами в своей последней научной работе. Их система искусственного интеллекта, Microsoft MAI Diagnostic Orchestrator ставит диагнозы в четыре раза точнее, чем группа опытных врачей – и при этом еще и дешевле.
В сообщении в блоге утверждается, что технология работает как консилиум из нескольких ИИ-моделей, включая ChatGPT, Gemini и Grok, каждая из которых отвечает за определенную роль – от сбора симптомов и назначения анализов до финальной проверки диагноза.
На тестах, основанных на 304 сложных клинических случаях из журнала New England Journal of Medicine, "виртуальные врачи" превзошли врачей-людей, определяя правильный диагноз в 80% случаев, тогда как команда реальных терапевтов, каждый из которых имеет опыт работы от 5 до 20 лет, справилась только в 20%. Особенно эффективной оказалась модель o3 от OpenAI – она правильно решила 85,5% задач.
Вместе с тем медицинская система MAI Diagnostic Orchestrator снизила общую стоимость услуги на 20% по сравнению с ее человеческими аналогами за счет выбора экономичных процедур и анализов, заявили в Microsoft.
Версия этой технологии вскоре может быть интегрирована в чат-бот Copilot и поисковик Bing, что облегчит пользователям получение точного диагноза без обращения ко врачам. По словам генерального директора Microsoft в области ИИ Мустафа Сулейман этот инструмент является "подлинным шагом на пути к медицинскому сверхинтеллекту".
В то же время эксперты советуют относиться к результатам исследования с осторожностью, так как диагнозы нейронной сети не основаны на реальном жизненном опыте.
Как УНИАН уже писал, разногласия OpenAI и Microsoft по поводу будущего их партнерства в области ИИ достигли "точки кипения". Разработчики ChatGPT даже готов в качестве "ядерного варианта" обвинить софтверного гиганта в антиконкурентном поведении.
Сообщается, что более 52 тысяч айтишников были уволены по всему миру с начала 2025 года. Причина – потенциал искусственного интеллекта, который может эффективно выполнять рутинные задачи программирования, включая написание кода и тестирование.