
Image by Freepik
Zihinden-Konuşmaya Yapay Zeka, Beyin Dalgalarını Konuşmaya Çeviriyor
Bilim insanları, felçli kişilerin doğal konuşmalarını geri kazanmak için önemli bir ilerleme kaydetti. Yapay zeka destekli beyin implantları kullanarak, beyin dalgalarını gerçek zamanlı olarak konuşulan kelimelere dönüştürdüler.
Acelesi olanlar için hızlı bilgiler:
- Sistem, beyin dalgalarını çözümler ve bunları neredeyse anında, doğal sesli konuşmaya dönüştürür.
- Sistem, hastanın yaralanma öncesi sesini kullanarak kişiye özgü bir konuşma sentezi oluşturur ve bu, otantik iletişimi mümkün kılar.
- Yapay zeka modeli, konuşma sinyallerini 80 milisaniyede çözer, önceki gecikmeleri önemli ölçüde azaltır.
Radboud Üniversitesi’ndeki bilim insanları, UMC Utrecht ile birlikte, beyin sinyallerini %92-100 arasında bir doğruluk oranıyla konuşulan kelimelere çeviren yapay zeka ile donatılmış beyin implantı teknolojisi geliştirdi, bu Nörobilim Haberleri tarafından bildirildi. Bu hafta Nature Neuroscience dergisinde yayınlanan araştırma, felçli insanlar için iletişim araçları geliştirmeyi hedefliyor.
Araştırma, nöral sinyaller ile sözlü ifadeler arasında ilişkiler oluşturmak için kısa süreli beyin implantlarına sahip epilepsi hastalarını kullandı. Bu gelişme, konuşma yetisi bozuk olan kişilerin iletişimini zorlaştıran önceki gecikmeyi azaltıyor.
“Akış yöntemimiz, Alexa ve Siri gibi cihazların hızlı konuşma çözme kapasitesini nöroprotezlere getiriyor,” diye açıkladı çalışmanın eş baş araştırmacısı Gopala Anumanchipalli, New Atlas‘ta bildirildiği gibi. “Benzer türde bir algoritma kullanarak, nöral verileri çözebildiğimizi ve ilk kez neredeyse eşzamanlı ses akışını sağlayabildiğimizi bulduk,” diye ekledi.
Sistem, beyin aktivitesini beyin yüzeyine yerleştirilen yüksek yoğunluklu elektrodlar aracılığıyla yakalayarak çalışır. Ardından AI, bu sinyalleri çözerek kelimeleri ve cümleleri olağanüstü bir doğrulukla yeniden oluşturur.
Ek olarak, hastanın yaralanma öncesi sesine dayalı olarak eğitilmiş bir metinden-konuşmaya modeli, oluşturulan konuşmanın doğal sesli olmasını ve orijinal seslerine yakından benzemesini sağlar.
Çalışmanın yazarlarından biri olan Cheol Jun Cho, sistemin düşünceleri nasıl konuşmaya dönüştürdüğünü açıkladı: “Şifrelediğimiz şey, bir düşünce oluştuğunda, ne söyleyeceğimize karar verdikten sonra, hangi kelimeleri kullanacağımıza ve vokal-tract kaslarımızı nasıl hareket ettireceğimize karar verdikten sonradır,” diye New Atlas’ta bildirildi.
Bu ilerleme, geçmiş teknolojilere göre önemli ölçüde iyileşme sağlar. Ayrıca bu AI destekli sistem artık kesintisiz akıcı konuşmaları sağlayan bir saniyelik konuşma başlatmayı sağlar. Bu teknoloji, şiddetli felç, locked-in sendromu veya ALS gibi durumları olan kişiler için hayatı değiştirici olabilir, başkalarıyla doğal olarak iletişim kurma yeteneklerini geliştirir.
Ancak, bu ilerlemelere rağmen, teknoloji hala zorluklarla karşı karşıya. Neuroscience News’ta açıklandığı gibi, bu AI’nin bir kişinin nöral verileri üzerinde geniş çaplı bir eğitime ihtiyacı vardır ve önceden konuşma kayıtları olmayanlar için etkili bir şekilde çalışmayabilir.
Sistem sözcükleri çözebilirken, tamamen doğal bir hız ve ifadeyi yakalamak hala zor oluyor. Ayrıca, mevcut modeller tam cümleleri ve paragrafları tahmin etmekte zorlanıyor, çoğunlukla tekil sözcüklere odaklanıyorlar.
Ek olarak, EEG kaskları kullanılarak yapılan non-invaziv versiyonlar, New Scientist‘ta belirtildiği gibi, implant edilen elektrotlara kıyasla yaklaşık %60 daha düşük bir doğruluk oranına sahip.
İlerleyen süreçte, araştırmacılar sistemin konuşma hızını ve anlatım gücünü artırmayı hedefliyorlar, böylece konuşmalar daha da gerçekçi hissettiriyor.
Yorum bırakın
Vazgeç