Categories: Technology

Η νέα τεχνολογική ανακάλυψη που δίνει ελπίδα στους ανθρώπους που δεν μπορούν να μιλήσουν


Ερευνητές στις ΗΠΑ δημιούργησαν μια συσκευή που εμφυτεύεται στον εγκέφαλο και αποκωδικοποιεί την εγκεφαλική δραστηριότητα, μετατρέποντας την αυτομάτως σε συνθετική ομιλία. Η νέα καινοτόμος συσκευή, που χρησιμοποιεί μεθόδους τεχνητής νοημοσύνης, υπόσχεται να επιταχύνει και να κάνει πιο φυσική την επικοινωνία μέσω συνθετικής ομιλίας, σε σχέση με ό,τι ήταν εφικτό έως τώρα, δίνοντας έτσι τη δυνατότητα να ακουστεί η (έστω τεχνητή) φωνή ανθρώπων που δεν μπορούν να μιλήσουν, όπως οι παράλυτοι και οι άνθρωποι με νευρολογικές βλάβες.

Η ομιλία φαίνεται απλή, αλλά στην πραγματικότητα είναι ένα από τα πιο πολύπλοκα πράγματα που κάνει ένας άνθρωπος, καθώς απαιτεί τον ακριβή και δυναμικό συντονισμό πολλών μυών της φωνητικής οδού. Πολλοί ασθενείς με νευρολογικές κυρίως παθήσεις (εγκεφαλικό τραύμα, εγκεφαλικό επεισόδιο, Πάρκινσον, πλάγια αμυοτροφική σκλήρυνση κ.α.) χάνουν τη δυνατότητα ομιλίας, όπως ήταν η διάσημη περίπτωση του Βρετανού επιστήμονα Στίβεν Χόκινγκ.

Για να επικοινωνήσουν, αναγκάζονται να εξαρτώνται από συσκευές που χρησιμοποιούν διεπαφές εγκεφάλου-υπολογιστή ή κινήσεις του κεφαλιού και των ματιών, προκειμένου να ελέγχουν έναν κέρσορα και να επιλέγουν γράμματα σε μια οθόνη, με ρυθμό -στην καλύτερη περίπτωση- έως δέκα λέξεις το λεπτό. Όμως η διαδικασία της επικοινωνίας είναι δύσκολη, επιρρεπής σε λάθη και πολύ πιο αργή από τον φυσιολογικό ρυθμό της ανθρώπινης ομιλίας (κατά μέσο όρο 100 ως 150 λέξεις το λεπτό).

Οι ερευνητές, με επικεφαλής τον καθηγητή νευροχειρουργικής Έντουαρντ Τσανγκ του Πανεπιστημίου της Καλιφόρνια στο Σαν Φρανσίσκο, οι οποίοι έκαναν τη σχετική δημοσίευση στο περιοδικό “Nature”, ανέπτυξαν μια νέα μέθοδο που -με τη βοήθεια της τεχνικής της βαθιάς μηχανικής μάθησης και των τεχνητών νευρωνικών δικτύων- συνθέτει την ομιλία χρησιμοποιώντας εγκεφαλικά σήματα, τα οποία σχετίζονται με τις κινήσεις των σιαγόνων, του λάρυγγα, των χειλιών και της γλώσσας.

Αρχικά οι επιστήμονες κατέγραψαν με τη βοήθεια ηλεκτροδίων -στο πλαίσιο θεραπείας για επιληψία- τη δραστηριότητα του φλοιού του εγκεφάλου πέντε εθελοντών, καθώς αυτοί μιλούσαν. Με βάση αυτήν την καταγραφή, σχεδίασαν ένα σύστημα, το οποίο σε πρώτη φάση είναι σε θέση να αποκωδικοποιεί μόνο του τα νευρωνικά σήματα που ευθύνονται για τις επιμέρους κινήσεις της φωνητικής οδού. Σε δεύτερο στάδιο, ένας άλλος αλγόριθμος αναλαμβάνει να συνθέσει την ομιλία από αυτές τις αποκωδικοποιημένες κινήσεις.

Οι δοκιμές του αποκωδικοποιητή έδειξαν ότι οι ακροατές μπορούσαν εύκολα να καταλάβουν τη συνθετική ομιλία, παρόλο που αυτή είναι κατώτερη από τη φυσική ομιλία. Αρκετές έρευνες μέχρι σήμερα είχαν χρησιμοποιήσει μεθόδους τεχνητής νοημοσύνης για να «μεταφράσουν» τα εγκεφαλικά σήματα σε ακουστικά, ώστε να συνθέσουν ομιλία. Η νέα έρευνα, που δεν βασίζεται στα «μεταφρασμένα» ακουστικά σήματα, αλλά στη νευρωνική αποκωδικοποίηση των κινήσεων της φωνητικής οδού, φαίνεται να είναι πιο αποτελεσματική.

«Για πρώτη φορά δείξαμε ότι μπορούμε να αναδημιουργήσουμε ολόκληρες προτάσεις ομιλίας με βάση την εγκεφαλική δραστηριότητα ενός ατόμου. Έχουμε πια την τεχνολογία για να φτιάξουμε μια συσκευή που θα αξιοποιηθεί κλινικά για ασθενείς με απώλεια της ομιλίας τους», δήλωσε ο Τσανγκ.

Πάντως η συσκευή χρειάζεται ακόμη βελτίωση, προτού καταστεί δυνατό να αξιοποιηθεί κλινικά. Το μέλλον θα δείξει κατά πόσο είναι εφικτή αυτή η βελτίωση, ώστε η συνθετική ομιλία να πλησιάσει σε απόδοση τη φυσική. Επίσης μια μελλοντική πρόκληση αφορά εκείνους τους ανθρώπους που δεν έχουν χάσει μόνο τη φωνή τους, αλλά και την ικανότητα να παράγουν στη φωνητική οδό τους τις κινήσεις που σχετίζονται με την ομιλία τους.

fbq('init', '1706173679639449'); fbq('track', "PageView");

var options = { type: "scroll", scripts: [ "//connect.facebook.net/en_US/sdk.js#xfbml=1&appId=219378041527087" ], success: function () {

FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); } }; if ($(window).scrollTop() > 0) { window.fbAsyncInit = function () { FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); //jQuery('#fb-root').trigger('facebook:init'); document.body.className += " fbinit"; };

(function (d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) { return; } js = d.createElement(s); js.id = id; js.src = "http://connect.facebook.net/en_US/sdk.js"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk')); } else { $.lazyscript(options); } });

$.getScript("http://connect.facebook.net/en_US/sdk.js", function(){ FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); facebookAPILoaded = true; }); }



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Σοκ στη βιομηχανία του gaming: Η Microsoft κλείνει εταιρεία που έφτιαξε ένα από τα καλύτερα παιχνίδια του Xbox

Άσχημα νέα περίμεναν τους φίλους του Xbox σήμερα, Τρίτη 7 Μαΐου, αλλά και τους εργαζομένους…

7 ώρες ago

Πρώτη επίσημη επιβεβαίωση από την εταιρεία!

Η Nintendo αποκάλυψε ότι το Switch ξεπέρασε τα 140 εκατομμύρια πωλήσεις, εδραιώνοντας ακόμη περισσότερο τη…

10 ώρες ago

Πόσα πλήρωσε η Google στην Apple για να φέρει το Google Search στον Safari browser

Χάρη στα δικαστικά έγγραφα που σχετίζονται με την αντιμονοπωλιακή αγωγή του Υπουργείου Δικαιοσύνης των ΗΠΑ…

18 ώρες ago

Περιλήψεις ειδήσεων μέσω του Grok AI στο X (πρώην Twitter)

Το X (πρώην Twitter) ανακοίνωσε επίσημα ένα νέο χαρακτηριστικό που ονομάζεται "Stories on X" και…

18 ώρες ago

Ώρα για games και στο…LinkedIn!

Σειρά και του LinkedIn να μπει στον χώρο του gaming. Σε ολοένα και περισσότερους χρήστες…

18 ώρες ago

Το Google Photos θα βελτιώνει την ποιότητα των videos με το πάτημα ενός κουμπιού

Η υπηρεσία Google Photos εισήγαγε το 2023 το AI εργαλείο επεξεργασίας φωτογραφιών με Magic Editor,…

18 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.