Γράφει ο:
Αντώνης Γερονικολάου
Γενικός Διευθυντής Αθηναϊκής Γενικής Κλινικής
Στις 9 Φεβρουαρίου 2026 δημοσιεύτηκε στο έγκριτο περιοδικό Nature Medicine μελέτη με τίτλο “Reliability of LLMs as medical assistants for the general public: a randomized preregistered study” η οποία δείχνει ότι τα μεγάλα γλωσσικά μοντέλα δεν βελτιώνουν την ακρίβεια διαγνωστικών αποφάσεων από μη ειδικούς. Η Τεχνητή Νοημοσύνη μπορεί να υποστηρίζει την κλινική εργασία, αλλά δεν υποκαθιστά την κρίση και την ευθύνη του γιατρού, ειδικά σε επείγουσες καταστάσεις.
Η χρήση μεγάλων γλωσσικών μοντέλων (LLMs – Large Language Models) για υποστήριξη ιατρικών αποφάσεων από το ευρύ κοινό έχει αναδειχθεί ως ένα από τα πιο αμφιλεγόμενα ζητήματα στην ανάπτυξη της Τεχνητής Νοημοσύνης. Η πρόσφατη τυχαιοποιημένη μελέτη και η μεγαλύτερη μέχρι σήμερα στο πεδίο, αξιολόγησε την αποτελεσματικότητα των LLMs στη λήψη αποφάσεων υγείας από μη ειδικούς χρήστες. Η έρευνα πραγματοποιήθηκε από το Oxford Internet Institute και το Nuffield Department of Primary Care Health Sciences σε συνεργασία με το MLCommons, με τη συμμετοχή σχεδόν 1.300 διαδικτυακών χρηστών.
Τι έδειξε η μεγαλύτερη μελέτη για τα LLMs στην υγεία
Οι συμμετέχοντες χωρίστηκαν τυχαία σε δύο ομάδες: η πρώτη χρησιμοποίησε LLM (Large Language Model) για να αναγνωρίσει πιθανές παθήσεις και να αποφασίσει την κατάλληλη ενέργεια, ενώ η δεύτερη βασίστηκε σε παραδοσιακές πηγές ή στη δική της κρίση. Τα σενάρια, που δημιουργήθηκαν από κλινικούς ιατρούς, περιλάμβαναν τόσο συνηθισμένες όσο και επείγουσες καταστάσεις. Τα αποτελέσματα έδειξαν ότι η χρήση LLM δεν βελτίωσε την ακρίβεια των αποφάσεων ούτε αύξησε την ασφάλεια των επιλογών. Οι χρήστες συχνά δεν ήξεραν ποιες πληροφορίες ήταν κρίσιμες, παραλείποντας βασικά συμπτώματα, ενώ οι απαντήσεις των μοντέλων συνδύαζαν σωστά και λανθασμένα στοιχεία με πειστική γλωσσική αυτοπεποίθηση. Ιδιαίτερη ανησυχία προκάλεσε η απόδοση σε επείγουσες περιπτώσεις, όπου η αδυναμία διαχωρισμού κρίσιμων ενδείξεων θα μπορούσε να οδηγήσει σε καθυστερημένη ή λανθασμένη παρέμβαση.
Τα ευρήματα της μελέτης αναδεικνύουν ένα θεμελιώδες χάσμα μεταξύ των τυποποιημένων εξετάσεων γνώσεων, στις οποίες τα LLM εμφανίζουν υψηλή επίδοση, και της πρακτικής χρήσης σε πραγματικές συνθήκες. Η κλινική κρίση απαιτεί αξιολόγηση αβεβαιότητας, εντοπισμό ασυμφωνιών και αναγνώριση μη εμφανών κινδύνων, δεξιότητες που δύσκολα αναπαράγονται πλήρως σε ένα μοντέλο Τεχνητής Νοημοσύνης. Επιπλέον, η ιατρική πράξη διέπεται από δεοντολογικό και νομικό πλαίσιο, όπου η ευθύνη για τις αποφάσεις παραμένει αποκλειστικά του ιατρού, κάτι που τα συστήματα ΤΝ δεν μπορούν να αναλάβουν.
Ο ρόλος της Τεχνητής Νοημοσύνης στην κλινική πράξη
Παρά τους περιορισμούς, η Τεχνητή Νοημοσύνη μπορεί να λειτουργήσει επικουρικά, προσφέροντας υποστήριξη σε ανάλυση ιατρικών δεδομένων, εκπαίδευση, διαχείριση φακέλων και εντοπισμό μοτίβων σε μεγάλες βάσεις δεδομένων. Σε αυτό το πλαίσιο, η ΤΝ ενισχύει την ανθρώπινη κρίση, χωρίς να την αντικαθιστά. Συνολικά, η μελέτη καταδεικνύει ότι η Τεχνητή Νοημοσύνη δεν μπορεί να υποκαταστήσει τον γιατρό, ενώ η χρήση της ως αυτόνομο εργαλείο διάγνωσης από το ευρύ κοινό ενέχει σημαντικούς κινδύνους για λανθασμένες αποφάσεις και καθυστέρηση σε επείγουσες καταστάσεις. Η ΤΝ πρέπει να θεωρείται εργαλείο υποστήριξης, όχι υποκατάστατο της κλινικής ευθύνης.


