- Kaliforniya Üniversitesi, San Francisco’daki sinirbilimciler, beyin dalgalarını mevcut teknolojilerden daha hızlı yazılı metne dönüştürebilen AI tabanlı bir sistem geliştirdiler.
- Yeni teknoloji şu anda sözlü konuşmayı tanımakla sınırlı olsa da, gelecekte konuşma engelli olanlara yardım etme potansiyeline sahiptir.
- Araştırmacılar sonuçlarını Mart ayı sonunda Nature Neuroscience bilimsel dergisinde yayınladılar .
2008’de teorik fizikçi Stephen Hawking, Apple II bilgisayarında “konuşmak” için bir konuşma sentezleyici programı kullandı. Lou Gehrig hastalığı ilerledikçe sorunlu hale gelen sistemi çalışmak için el kontrollerini kullanmak zorunda kaldı. “Yanak anahtarı” adı verilen yeni bir cihaza geçtiğinde, Hawking yanağındaki kasları gerdiğinde, konuşmasına, e-posta yazmasına veya Web’de gezinmesine yardımcı olduğunda tespit etti.
Şimdi, Kaliforniya Üniversitesi, San Francisco’daki sinirbilimciler çok daha ileri bir teknoloji geliştirdiler – düşünceleri metne dönüştürebilen yapay bir zeka programı. Zamanla, konuşma engelli milyonlarca insana kolaylıkla iletişim kurma potansiyeline sahiptir.
Bilim adamları, Nature dergisinde yayınlanan yeni bir makalede , “Konuşmayı sinirsel aktiviteden makine çevirisi görevine dekoding görevinin kavramsal benzerliğinden, yani metnin bir dilden diğerine algoritmik çevirisinden yararlanıyoruz,” diye yazdılar. Nörobilim.
Farklı dillerde metin çevirmeye benzeyen bir AI yaklaşımı benimsediler. Temel teori her iki durumda da aynıdır – amaç, keyfi uzunluktaki bir diziyi diğerine dönüştürmektir – ancak girdiler beyindeki metne karşı farklı, sinirsel sinyallerdir.
Hipotezlerini test etmek için araştırmacılar insan denemelerini kullandılar. Bilim adamları, konuşmalarını izlemek için epilepsili dört katılımcının beynine elektrotlar yerleştirdiler. Daha sonra her kişi, iki veri kümesinden birinden yüksek sesle cümleler okur: 30 cümle ve 125 cümle kelimesinden oluşan ve 460 cümle ve yaklaşık 1.800 benzersiz kelime içeren bir dizi resim açıklaması.
Her katılımcı, “Tina Turner bir pop şarkıcısı” ve “mutfakta kaos var” gibi satırlar da dahil olmak üzere, 50 defa birden fazla cümleyi sesli olarak okudu. Her insanın konuştuğu gibi, araştırmacılar beyin aktivitelerini izlediler. Daha sonra verileri , beyin dalgalarını cümleleri kodlayan bir dizi sayıya dönüştürebilecek bir makine öğrenme algoritmasına girerler. Sistemin başka bir bölümünde, sayılar tekrar bir kelime dizisine dönüştürüldü.
Başlangıçta, sistem “ıspanak ünlü bir şarkıcıydı” gibi saçma sapan ifadelerle geldi. uygunsuz dilbilgisi olan satırlar, “birkaç yetişkin tarafından yenildi;” ve sonuçta “vaha bir seraptı.” Zaman içinde, araştırmacılar sisteme katılımcıların yüksek sesle okuduğu ilk cümleleri karşılaştırmak için besledikçe iyileşti.
Bir durumda, sistem, ortalama insan kopyalayıcıdan daha az hatayı temsil eden cümlelerin yüzde 97’sini doğru olarak aldı. Yine de, algoritma, bir kullanıcının nihayetinde arzu edeceğine kıyasla sadece az sayıda cümle ve kelime işlemektedir.
Yine de, sistem şu anda sadece sözlü konuşma üzerinde çalışmaktadır – yani kas felci nedeniyle konuşma bozukluklarından muzdarip olanlar henüz faydalanmayacaktır.
GIPHY App Key not set. Please check settings