Νέα μελέτη εξετάζει πώς «κρυφά» μοτίβα στην ανθρώπινη φωνή θα μπορούσαν να λειτουργήσουν ως πρώιμοι δείκτες ασθένειας.
Ο καρκίνος του λάρυγγα, που συχνά αποκαλείται «φωνητικό κουτί», παραμένει ένα σημαντικό παγκόσμιο πρόβλημα υγείας. Το 2021, περίπου 1,1 εκατομμύρια άνθρωποι διαγνώστηκαν παγκοσμίως και περίπου 100.000 πέθαναν από τη νόσο.
Το κάπνισμα, η βαριά κατανάλωση αλκοόλ και η μόλυνση από τον ιό των ανθρωπίνων θηλωμάτων αποτελούν βασικούς παράγοντες κινδύνου. Τα ποσοστά επιβίωσης ποικίλλουν σημαντικά, κυμαινόμενα από 35% έως 78% μέσα σε πέντε χρόνια με θεραπεία, ανάλογα με το σημείο ανάπτυξης του όγκου και το στάδιο στο οποίο διαγιγνώσκεται.
Η έγκαιρη διάγνωση παίζει καθοριστικό ρόλο στη βελτίωση της έκβασης. Σήμερα η διάγνωση βασίζεται συνήθως σε ρινοενδοσκόπηση με βίντεο και σε βιοψίες ιστών οι οποίες είναι επεμβατικές και συχνά δύσκολα προσβάσιμες άμεσα. Οι καθυστερήσεις στην επίσκεψη σε ειδικό μπορεί να επιβραδύνουν τη διάγνωση και τη θεραπεία.
Νέα έρευνα που δημοσιεύθηκε στην επιθεώρηση «Frontiers in Digital Health» προτείνει μια διαφορετική προσέγγιση. Οι επιστήμονες διαπίστωσαν ότι ανεπαίσθητες αλλαγές στη φωνή ενός ατόμου μπορούν να αποκαλύψουν ανωμαλίες στις φωνητικές χορδές. Αυτές οι «βλάβες των φωνητικών χορδών» μπορεί να είναι ακίνδυνες, όπως οζίδια ή πολύποδες, αλλά μπορούν επίσης να υποδηλώνουν πρώιμο στάδιο καρκίνου του λάρυγγα. Τα ευρήματα δείχνουν μια πιθανή νέα χρήση της τεχνητής νοημοσύνης: την αναγνώριση πρώιμων ενδείξεων καρκίνου μέσω ανάλυσης της φωνής.
«Εδώ δείχνουμε ότι με αυτό το σύνολο δεδομένων μπορούμε να χρησιμοποιήσουμε φωνητικούς βιοδείκτες για να διακρίνουμε φωνές ασθενών με βλάβες στις φωνητικές χορδές από εκείνες χωρίς τέτοιες βλάβες» δήλωσε ο Δρ. Φίλιπ Τζένκινς μεταδιδακτορικός ερευνητής στην κλινική πληροφορική στο Πανεπιστήμιο Υγείας και Επιστήμης του Όρεγκον, κύριος συγγραφέας της μελέτης.
Η κλινική πληροφορική είναι ένα εξειδικευμένος κλάδος της Πληροφορικής Υγείας που ασχολείται με τη χρήση δεδομένων, πληροφοριών και τεχνολογίας για τη βελτίωση της παροχής φροντίδας υγείας, την ενίσχυση της ασφάλειας των ασθενών και τη διευκόλυνση του έργου των επαγγελματών υγείας.
Η γέφυρα τεχνητής νοημοσύνης
Ο Τζένκινς και η ομάδα του συμμετέχουν στο έργο «Bridge2AI-Voice» που αποτελεί μέρος της πρωτοβουλίας «Bridge to Artificial Intelligence» του Εθνικού Ινστιτούτου Υγείας των ΗΠΑ. Αυτή η εθνική προσπάθεια στοχεύει στην εφαρμογή της τεχνητής νοημοσύνης σε σύνθετα βιοϊατρικά προβλήματα. Για τη μελέτη αυτή οι ερευνητές εξέτασαν τον τόνο, το ύψος, την ένταση και την καθαρότητα της φωνής χρησιμοποιώντας την πρώτη δημόσια έκδοση του συνόλου δεδομένων Bridge2AI-Voice το οποίο περιλαμβάνει 12.523 ηχογραφήσεις από 306 συμμετέχοντες στη Βόρεια Αμερική.
Μόνο ένα μέρος αυτών των ηχογραφήσεων προερχόταν από άτομα με διαγνωσμένο καρκίνο του λάρυγγα, καλοήθεις βλάβες των φωνητικών χορδών ή άλλες διαταραχές φωνής όπως σπασμωδική δυσφωνία και μονόπλευρη παράλυση φωνητικής χορδής.
Η ομάδα ανέλυσε διάφορα μετρήσιμα χαρακτηριστικά της ομιλίας. Αυτά περιλάμβαναν τη μέση θεμελιώδη συχνότητα (δηλαδή το ύψος της φωνής), το jitter (μικρές διακυμάνσεις στο ύψος) και το shimmer (μεταβολές στο πλάτος). Επίσης μέτρησαν τον λόγο αρμονικού προς θόρυβο, ο οποίος συγκρίνει τον οργανωμένο ήχο με τον θόρυβο στο φόντο της ομιλίας.
Σαφείς διαφορές παρατηρήθηκαν στον λόγο αρμονικού προς θόρυβο και στο ύψος της φωνής μεταξύ ανδρών χωρίς διαταραχές, ανδρών με καλοήθεις βλάβες και ανδρών με καρκίνο του λάρυγγα. Παρόμοια μοτίβα δεν εντοπίστηκαν στις γυναίκες, αν και οι ερευνητές σημειώνουν ότι ένα μεγαλύτερο σύνολο δεδομένων ίσως αποκαλύψει σημαντικές τάσεις.
Η μελέτη υποδηλώνει ότι οι αλλαγές στον λόγο αρμονικού προς θόρυβο μπορεί να βοηθήσουν στην παρακολούθηση της εξέλιξης των βλαβών στις φωνητικές χορδές και να υποστηρίξουν την έγκαιρη ανίχνευση του καρκίνου του λάρυγγα, ιδιαίτερα στους άνδρες. «Τα αποτελέσματά μας δείχνουν ότι μεγάλα, πολυκεντρικά σύνολα δεδομένων που συλλέγονται με ηθικό τρόπο, όπως το Bridge2AI-Voice, θα μπορούσαν σύντομα να καταστήσουν τη φωνή μας έναν πρακτικό βιοδείκτη για τον κίνδυνο καρκίνου στην κλινική πράξη» αναφέρει ο Τζένκινς.
Με αυτά τα αρχικά αποτελέσματα το επόμενο βήμα είναι η εφαρμογή των αλγορίθμων σε μεγαλύτερα σύνολα δεδομένων και η αξιολόγηση της απόδοσής τους σε κλινικά περιβάλλοντα.
«Για να περάσουμε από αυτή τη μελέτη σε ένα εργαλείο τεχνητής νοημοσύνης που αναγνωρίζει βλάβες στις φωνητικές χορδές, θα εκπαιδεύσουμε μοντέλα με ακόμη μεγαλύτερα σύνολα ηχογραφήσεων, επισημασμένα από ειδικούς. Στη συνέχεια πρέπει να δοκιμάσουμε το σύστημα ώστε να διασφαλίσουμε ότι λειτουργεί εξίσου καλά για γυναίκες και άνδρες. Εργαλεία υγείας που βασίζονται στη φωνή ήδη δοκιμάζονται πιλοτικά. Με βάση τα ευρήματά μας, εκτιμώ ότι με μεγαλύτερα σύνολα δεδομένων και κλινική επικύρωση, παρόμοια εργαλεία για την ανίχνευση βλαβών στις φωνητικές χορδές θα μπορούσαν να μπουν σε πιλοτική φάση μέσα στα επόμενα λίγα χρόνια» λέει ο Τζένκινς.





