ChatGPT'yi tahtından indirmeyi hayal eden Fransız sesli yapay zekası Moshi'yi test ettik

acidizing · 27 Tem 2024

Fransız araştırma laboratuvarı Kyutai tarafından geliştirilen yapay zeka Moshi'yi birkaç gün boyunca test ettik. Sunucuların gecikmesi nedeniyle yavaşlayan, ChatGPT'yi geride bırakmayı hayal eden sesli asistan vaatlerini yerine getiremedi.

Temmuz ayının başı, KyutaiXavier Niel tarafından kurulan bir Fransız araştırma laboratuvarı, Moshi'nin üzerindeki perdeyi kaldırdı. Altı aydan kısa bir sürede laboratuvar, sesli bir yapay zeka geliştirmeyi başardı. Siri, Google Asistan veya Alexa'yı yansıtan Moshi, muhataplarıyla sesle etkileşime girebiliyor. Kyutai, asistanının doğal bir konuşma kullanıcılarıyla. Bu, bazen Fransa'da yapılan OpenAI olarak sunulan, kar amacı gütmeyen laboratuvarın yaptığı büyük vaattir.

Kesin olarak öğrenmek için Kyutai'nin sunduğu demo web sitesi üzerinden Moshi ile uzun bir sohbet gerçekleştirdik. Duyurunun üzerinden birkaç saat geçtikten sonra Moshi'nin deneysel bir versiyonu gerçekten de kullanıma sunuldu. Site herhangi bir kayıt gerektirmiyor ve basit bir arayüz üzerinden AI ile sohbet etmenize olanak sağlıyor. Tüm görüşmeler beş dakikayla sınırlı. Tek yapmanız gereken sıraya girmek ve Moshi ile konuşmak için bir e-posta adresi girmek.

Ayrıca okuyun: OpenAI'nin küçük GPT-4o mini modeli için büyük hedefleri var

Gecikme sorunu

Kağıt üzerinde, Alice adlı bir sanatçının sesiyle iletişim kuran sesli asistan, şunları vaat ediyor: anında cevaplariki insan arasındaki normal bir sohbete yakın. Kyutai'ye göre gecikme süresi 160 milisaniyeyi geçmiyor. Bu bir sektör rekoru. Yapay zekanın bize yanıt vermesini bekleyerek ekranımızın önünde beklememeliyiz. Pratikte Moshi, “merhaba” veya “nasılsınız?” gibi çok temel sorulara veya günlük aramalara bile yanıt vermek için her zaman anormal derecede uzun zaman aldı. Neredeyse her zaman Moshi'nin sesinin akıllı telefonumuzdan veya bilgisayarımızdan çıkmasını bekleyerek ekrana bakarken buluyoruz kendimizi.

Aslında ChatGPT'nin sesli versiyonuyla konuştuğumuzda daha hızlı, daha eksiksiz ve daha alakalı cevaplar aldık. OpenAI'nin AI'sı bize her zaman nispeten kısa sürede cevaplar sağlamayı başardı. Bu, biraz araştırma veya düşünme gerektiren oldukça karmaşık sorular sorduğumuzda da geçerliydi.

Kötü performans durumunda, Kyutai kullanıcıların deneysel Amerikan versiyonunu denemelerini öneriyor. Biz de bunu yaptık ve bazen ufak bir gelişme oldu. Birkaç saniyeliğine, asistanla nispeten akıcı bir sohbet edebildik.

Gecikmenin AI'nın deneysel yönünden kaynaklanması oldukça olası. Gerçekten de, sesli asistanın kesin bir sürümüyle karşı karşıya değiliz. Laboratuvar tarafından kullanılan sunucuların aşırı yüklenmiş olması da mümkün. Kyutai'nin yakın gelecekte durumu düzeltmeyi başaracağına bahse girelim. Ayrıca yerel sürümün bu sorundan arınmış olmasını umalım. Gerçekten de, sıkıştırma yöntemleri sayesinde AI, İnternet'e bağlı olmayan bir bilgisayara veya akıllı telefona yerel olarak kurulabilir. Bu arada, AI'nın vaatlerinden biri, en azından şimdilik, tutulmuyor.

Bizi rahatsız eden yapay zeka

Bazı alışverişler sırasında, AI'nın talihsiz bir eğilimi bile vardı bizi rahatsız etmek. Kyutai'nin gösterileri sırasında olduğu gibi, robot cümlemizi bitirmeden önce yanıt veriyor. Aslında, isteğimizin sonu çok sık çatlaklardan düşüyor. Moshi de konuşmalar sırasında ona ne söylediğimizi kaçırarak tartışmanın akışını kaybediyor. Aslında, robot cümlemizin başındaki bir unsurdan türetilen başka bir düşünceye yanıt veriyor ve isteğimizin geri kalanına tepki vermiyor. Bu durumlarda, yapay zeka bir monologa girdiğinde onu durdurmak çok karmaşıktır. Durumu düzeltmek istiyorsanız, Moshi'yi başka bilgiler sağlamak için sözünü keserek, yanıtının sonunu beklemeniz gerekecektir. Kısacası, biraz sinir bozucu.

Bazen AI, biz hala konuşurken, neye cevap verebileceğini düşünüyormuş gibi oluyor. Kyutai'nin kurucu bilim insanlarından biri olan Alexandre Défossez'in de belirttiği gibi, AI “düşündüğü anda konuşur”Bu, Moshi'yi nihayetinde bir insan muhatabına en yakın kılan şeydir.

Fransızca biliyor musunuz ?

Kyutai'nin de belirttiği gibi, Moshi henüz İngilizce dışında bir dil konuşamıyor. Kökenine rağmen, AI Fransızca iletişim kuramıyor. Ancak, sorulduğunda, AI kendinden emin bir şekilde Fransızca konuşabildiğini söylüyor.

© 01Net

Bu yüzden Moshi'den bize Fransızca cevap vermesini birkaç kez istedik. Nafile. Sesli asistan Fransızca konuştuğuna dair bizi temin etmekte ısrar ediyor, ancak bunu bize İngilizce söylüyor. Molière'in dilinde tek bir cevap bile alamadık. Fransa'da geliştirilen bir sesli asistanın Fransızca konuşamaması oldukça talihsiz bir durum. Burada da Kyutai'nin yakın gelecekte bunu düzeltmeyi planladığını umuyoruz.

Algılanabilir duygular

Teoride Moshi, duyguları ifade etme ve tanıma biçimiyle de öne çıkıyor. Kyutai'ye göre, AI, şu kadarını taklit edebiliyor: 70 insan duygusuTartışmalarımız sırasında Moshi'nin tonlamasının sıklıkla insan sesine çok yakın Alexa, Siri veya ChatGPT gibi mevcut ses yinelemesi çok robotik olan diğer sesli asistanlardan daha iyi. Robotun kelimelerinin tonu konuşmaya bağlı olarak değişir. Bir tarif veya bir restoranın adresini sorarsanız, AI cevabını neşeli bir sesle söyler. Suşiyi sevip sevmediğini sorarsanız, yapay zeka hızı değiştirerek ve belirli sesleri vurgulayarak hevesle yanıt verir.

Ancak, Moshi'nin bu noktada sunduğu olasılıkların tam kapsamını keşfedemedik. Konuşmalar her zaman kısa kesildi gecikme nedeniyle. Bu koşullar altında, Moshi'nin ifade ettiğimiz duyguları tanımlayıp tanımlayamadığını doğrulamak zordu. Ancak yorgun olduğumuzu söylediğimizde, AI oldukça şefkatli bir tonla yanıt verdi. Bu tarafta, laboratuvarın hedeflerine ulaşılabileceğini kendimize söylüyoruz.

Yapay zekanın sıklıkla başladığını unutmayın bir şey söyle. Bazı durumlarda, ses botu temel sorulara muhtemelen yanlış anlaşılan saçma cevaplar uydurdu. Diğer senaryolarda, yapay zeka “Donut istiyorum” gibi beklenmedik ifadelerle konuşmayı böldü.

Üretken AI'ların doğası halüsinasyon görmektir, yani belirli durumlarda her şeyi ustalıkla yapmaktır, ancak Moshi yine de bizi şaşırttı. Bazen robot, bize sebepsiz yere Amerikan ordusundan bahsederek veya bizden bir jambon sandviç isteyerek konuşmayı tamamen beklenmedik bir yöne yönlendiriyor… Bu şaşırtıcı ifadelerle, Kyutai'nin AI'yı mümkün olduğunca insan yapmak istediğini hissediyoruz.

İlk sonuçlar kesin değil

Sonuç olarak, Moshi ile iletişim kurarken daha fazlasını istemek zorunda kaldık. Deneysel versiyonunda, açık kaynaklı sesli asistan Kyutai'nin iddialı vaatlerinin çok gerisinde kalıyor. Teoride, Moshi, Siri veya Google Assistant gibi popüler akıllı asistanlardan çok daha üstün bir konuşma deneyimi sunuyor. Ayrıca ChatGPT'nin sesli versiyonundan da daha iyi performans göstermesi gerekiyor.

Uygulamada, AI hala piyasadaki mevcut çözümlerle rekabet edebileceğini iddia etmekten çok uzak. Projenin evrilmesini ve laboratuvarın verimsiz sunucularından kurtulmasını beklememiz gerekecek, böylece Moshi kalkış yapabileceğini kanıtlayabilir…

01net'ten hiçbir haberi kaçırmamak için bizi Google Haberler ve WhatsApp'tan takip edin.

ChatGPT'yi tahtından indirmeyi hayal eden Fransız sesli yapay zekası Moshi'yi test ettik

acidizing

New member