یافتههای کلیدی پژوهش
تیمی از محققان مایکروسافت سامانهای به نام MAI-DxO (Microsoft AI Diagnostic Orchestrator) را با عملکرد ۲۱ پزشک عمومی از آمریکا و بریتانیا مقایسه کردند. نتایج نشان داد:
- این سامانه در حل پروندههای پزشکی پیچیده حدود ۸۵٪ دقت داشت.
- پزشکان در همان موارد تنها حدود ۲۰٪ موفقیت کسب کردند.
- هزینه تصمیمگیریها و آزمایشها با کمک این سامانه حدود ۲۰٪ کمتر از عملکرد انسانی بود.
این نتایج نشان میدهد که هوش مصنوعی میتواند در تشخیص بیماریهای دشوار بسیار کارآمدتر عمل کند.

محدودیتها و نکات مهم
با وجود اعداد چشمگیر، پژوهش چند نکته مهم دارد:
- پروندههای غیرعادی: موارد آزمایشی از مجله NEJM انتخاب شدند که بهطور خاص برای دشوار بودن طراحی شدهاند، نه پروندههای عادی روزمره.
- ترکیب چند مدل: سیستم از چند مدل مختلف (Claude، DeepSeek، Gemini، GPT، Grok، Llama و غیره) استفاده کرده است، نه فقط یک مدل ساده.
- نیاز به تأیید قانونی: هنوز این فناوریها تأیید سازمانهای نظارتی مثل FDA را ندارند و در محیط بالینی واقعی آزمایش نشدهاند.
- قابلیت تعمیم: پژوهش فقط روی پزشکان آمریکایی و بریتانیایی انجام شده است؛ نتایج در کشورهای دیگر ممکن است متفاوت باشد.
پیامدها برای آینده پزشکی
- یاریرسان، نه جایگزین: هوش مصنوعی میتواند پزشکان را در تشخیصهای سخت پشتیبانی کند، نه اینکه کاملاً جایگزین شود.
- کاهش هزینهها: تشخیص دقیقتر و سریعتر میتواند جلوی آزمایشها و درمانهای غیرضروری را بگیرد.
- افزایش دسترسی: در مناطق محروم که متخصص کافی وجود ندارد، ابزارهای AI میتوانند کیفیت تشخیص را بالا ببرند.
- لزوم نظارت و شفافیت: استفاده گسترده از این فناوری نیازمند مقررات دقیق، ارزیابی بالینی و اعتماد بیماران است.
بله؛ بر اساس این مطالعه، هوش مصنوعی مایکروسافت در پروندههای پیچیده عملکردی بسیار دقیقتر از پزشکان عمومی داشته است. با این حال، این به معنای برتری مطلق AI در تمام شرایط نیست. آینده پزشکی به ترکیب تواناییهای انسان و هوش مصنوعی بستگی دارد تا بهترین نتیجه برای بیماران حاصل شود.