Μπορεί να συλλέγει ιατρικό ιστορικό και να προτείνει διαγνωστικές υποθέσεις στο επίπεδο πρωτοβάθμιου ιατρού
Τα συστήματα τεχνητής νοημοσύνης που εκπαιδεύονται σε ιατρικά δεδομένα έχουν δείξει επανειλημμένα ότι μπορούν να αποδώσουν καλά σε εξετάσεις, σε σενάρια με ηθοποιούς-ασθενείς και σε εργαστηριακά περιβάλλοντα. Η κριτική που επαναλαμβάνεται κάθε φορά είναι η ίδια: Οι πραγματικοί ασθενείς είναι απρόβλεπτοι, φέρνουν άγχος, ασαφή συμπτώματα και ποικίλα επίπεδα υγειονομικής παιδείας. Μια κλινική δεν είναι εργαστήριο.
Αυτό ακριβώς επιχείρησε να αντιμετωπίσει μια νέα μελέτη που δημοσιεύτηκε στον preprint server arXiv και διεξήχθη στο Beth Israel Deaconess Medical Center στη Βοστώνη. Για πρώτη φορά, το σύστημα AMIE (Articulate Medical Intelligence Explorer) της Google δοκιμάστηκε σε πραγματικές συνθήκες, με 100 πραγματικούς ασθενείς που είχαν ήδη κλείσει ραντεβού για επείγουσα φροντίδα.
Πώς λειτούργησε η δοκιμή
Έως και πέντε ημέρες πριν από το ραντεβού τους, οι ασθενείς συνομίλησαν μέσω κειμένου με το AMIE, το οποίο ανέλαβε να συλλέξει το ιατρικό ιστορικό τους. Σε αντίθεση με ένα στατικό ερωτηματολόγιο, το σύστημα προσάρμοζε δυναμικά τις ερωτήσεις του ανάλογα με τις απαντήσεις, ακολουθώντας λογική κλινικής συνέντευξης. Κάθε αλληλεπίδραση παρακολουθούνταν σε πραγματικό χρόνο από εσωτερικό ιατρό μέσω κοινής οθόνης. Η περίληψη της συνομιλίας και μια αυτόματα παραγόμενη κλινική ανάλυση προωθούνταν στον γιατρό που θα έβλεπε τον ασθενή.
Οκτώ εβδομάδες μετά, ανεξάρτητοι γιατροί αξιολόγησαν τυφλά τα διαγνωστικά σχέδια του AMIE και των ανθρώπων ιατρών, συγκρίνοντάς τα με το τελικό κλινικό αρχείο κάθε ασθενούς.
Τι έδειξαν τα αποτελέσματα
Στο βασικό κριτήριο ασφάλειας, το AMIE πέρασε χωρίς πρόβλημα. Κατά τη διάρκεια και των 100 συνομιλιών, ο επιτηρούντας γιατρός δεν χρειάστηκε να σταματήσει ούτε μία φορά την αλληλεπίδραση για λόγους ασφάλειας. Στην αξιολόγηση των διαφορικών διαγνώσεων, οι τυφλοί αξιολογητές δεν βρήκαν στατιστικά σημαντική διαφορά στη συνολική ποιότητα μεταξύ AMIE και ανθρώπων ιατρών. Η καταλληλότητα και η ασφάλεια των προτεινόμενων θεραπευτικών σχεδίων ήταν επίσης συγκρίσιμες.
Σημαντικό εύρημα ήταν και η αλλαγή στάσης των ασθενών απέναντι στην ιατρική τεχνητή νοημοσύνη. Οι βαθμολογίες εμπιστοσύνης αυξήθηκαν σημαντικά μετά τη συνομιλία με το AMIE και παρέμειναν υψηλές ακόμα και αφού οι ασθενείς είδαν τον γιατρό τους.
Πού υστέρησε το σύστημα
Οι γιατροί υπερτέρησαν στην πρακτικότητα και την οικονομική αποδοτικότητα των θεραπευτικών σχεδίων. Αυτό αντικατοπτρίζει κάτι που η τεχνητή νοημοσύνη δεν είχε πρόσβαση κατά τη διάρκεια της δοκιμής, καθώς τα πλήρη ιατρικά αρχεία των ασθενών, τη γνώση του τοπικού συστήματος υγείας και τους πρακτικούς περιορισμούς που αντιμετωπίζει ένας γιατρός στην καθημερινή κλινική πράξη.
Αξίζει επίσης να σημειωθεί ότι η μελέτη δεν έχει ακόμα υποβληθεί σε ομότιμη αξιολόγηση, καθώς δημοσιεύτηκε ως preprint. Το δείγμα των 100 ασθενών σε μία μόνο κλινική δεν επαρκεί για να εξαχθούν γενικεύσιμα συμπεράσματα, και οι ίδιοι οι ερευνητές τονίζουν την ανάγκη για μεγαλύτερες πολυκεντρικές δοκιμές σε διαφορετικούς πληθυσμούς.