İnsan verilerinin büyük bir şekilde sömürülmesine dayanarak, üretken yapay zeka yakında sınırlarına ulaşabilir. Bununla birlikte, ilerlemeye devam etmek için yeni bir yol var: Eşiksiz yapay zeka için AI ile deneyim yoluyla öğrenme.
. üretken yapay zeka Bugün Bulunan Chatgpt veya The_CHAT yazın, her yerde dağların dağlarını analiz etmeye ve sömürmeye dayanmaktadır. veri mevcut. Bu strateji, bilimsel problemlerin çözümünden şiirlerin çizilmesine kadar, görüntülerin ve fotoğrafların oluşturulması veya belgelerin sentezi yoluyla şiirlerin hazırlanmasına kadar çok çeşitli insan kapasitelerinden – veya daha doğrusu gerçekçi olarak taklit etmeyi mümkün kılar. AI, bu tür egzersizlerde başarılı olmak için şu anda planlayamayan veya akıl yürütemeyen bu modellerin gerçek kapasitesinde olduğu gibi, bazı tartışmalar kalsa bile, Turing testi gibi referans testlerini başarıyla geçmiştir.
Bununla birlikte, insan verilerine bu bağımlılık sınırlarını göstermektedir: İlerleme şimdiye kadar çok önemli olsaydı, bilimsel alanlarda tatmin edici bir şekilde AI modellerine neden olmaya izin veren yüksek kaliteli insan kaynakları zaten tüketilmiş veya olmak üzeredir. İlerleme sadeceDenetimli öğrenme Bu tür kaynaklardan ve bu nedenle bilgi yavaşlama eğilimindedir. Üretken yapay zekaların ilerlemeye devam etmesi için, özellikle özgünlük ve yeniliğin bir parçası bekliyorsak, başka bir deyişle bu yapay zekanın gerçek bir “zeka” olmasını bekliyorsak, yeni bir veri kaynağı esastır.
Deneyim çağındaki insan verileri döneminin
Araştırmacılar David Silver ve Richard Sutton, yapay zeka alanındaki iki efsanevi figür (David Silver, Richard Sutton, takviye öğreniminin kurucularından biri olarak kabul edilirken, AlphaGo ve Alphazero'nun arkasındaki araştırmalara öncülük ediyor), şimdi gerçek dünyaya etkileşimlere sahip olmaya yetkili olması gerektiğini öne sürüyor. Bu, sundukları yeni adımın özüdür: deneyim dönemi. Onlara göre, deneyim yoluyla öğrenme potansiyeli kullanıldıktan sonra yeni kapasiteler ortaya çıkmalıdır.
© David Silver, Richard S. Sutton
“İnsan verilerinin dönemi” ve “deneyim dönemi” arasındaki bu geçişin başlangıcı mevcut modellerde bile zaten görülebilir. Geçen yıl, alfaproof ve alfageometri 2 – DeepMind tarafından bir kez daha geliştirilen iki AI – lise ve kolej öğrencileri için küresel bir matematik rekabeti olan Uluslararası Matematik Olimpiyatı sırasında ortaya çıkan sorunlara saldırdı. Algoritmaları sayesinde altı üzerinden çözülen dört problemleTakviye öğrenimiBu iki yapay zeka, bu etkinliğe gerçekten katılmış olsaydı gümüş madalya kazanırdı.
IMO 2024'teki Alphaproof skoru © Google
Araştırmacıların savundukları yaklaşım, “Deneyim akışı”öğrenmeyi güçlendirmeye dayanır; AI'ya kendi bilgilerini kendi kendini keşfetme yeteneği sunarak, esas olarak bireysel insan sorularına painkal olarak yanıt vermek için tasarlanan mevcut dilin (veya LLM) ana modellerinin boşluklarını düzeltmeyi amaçlamaktadır. Başka bir deyişle, üretken yapay zeka artık basit bir soru ve cevap alışverişi yoluyla kısa etkileşimlerden memnun olmamalı, daha ziyade insanlar gibi uzun bir ölçekte ilerleyen kendi deneyim akışına sahip olmalıdır. Burada, temel yeni veri kaynağı.
Artı otonom AI'ler, insanlık için faydalar veya riskler mi?
Bu yeni dönemde, ajanların gerçek dünyayla çok daha fazla etkileşim kurmaları gerekecek. özerk. Mutlaka kısıtlayıcı olan insanların tercih ettiği eylemlere ve gözlemlere odaklanmak yerine, AI gelecekteki hedeflere ulaşmak ve sürekli olarak yeni davranışsal kalıplara uyum sağlamak için çevresi ile tek başına alışveriş yapmak zorunda kalacaktır. Nihayetinde, bu yeni yapay zeka, hiç akla gelmeyen yeni stratejileri keşfetmek için dünyayı aktif olarak keşfetmek zorunda kalacak.
Kendi deneyimlerinin sonuçlarından sürekli olarak öğrenerek, bu yapay zekalar hızla yeni bilgi alabilirler. Kendi testlerini ve önlemlerini özerk bir şekilde yürütmek, yeni malzemelerin, ilaçların ve teknolojilerin benzeri görülmemiş bir oranda geliştirilmesine yol açacaktır. Hatta daha önce insanlığın münhasır alanı olarak kabul edilen kapasiteleri gösterebildiklerini bile kanıtlayabilirler: uzun vadeli problem çözme, yenilik veya hatta gerçek dünyadaki sonuçları derin bir anlayış.
Ancak uzun vadeli hedeflere ulaşmak için geniş dönemlerde dünyayla bağımsız olarak etkileşim kurma, insanlara müdahale etme karşılığında sunacak ve bu nedenle bir seviyeyi gerektirecektir. güven öğrenci. Tamamen insan verilerinden ve düşünme biçimlerinden uzaklaşmak, gelecekteki yapay zekaları yorumlamayı ve anlamayı zorlaştırabilir. Bu nedenle, deneyim dönemine güvenli bir geçiş sağlamak için ek araştırmalar gereklidir; Bu arada, her ihtimale karşı AI'ya teşekkür etmeye devam edin.
Deneyim dönemine hoş geldiniz (David Silver, Richard S. Sutton)
. üretken yapay zeka Bugün Bulunan Chatgpt veya The_CHAT yazın, her yerde dağların dağlarını analiz etmeye ve sömürmeye dayanmaktadır. veri mevcut. Bu strateji, bilimsel problemlerin çözümünden şiirlerin çizilmesine kadar, görüntülerin ve fotoğrafların oluşturulması veya belgelerin sentezi yoluyla şiirlerin hazırlanmasına kadar çok çeşitli insan kapasitelerinden – veya daha doğrusu gerçekçi olarak taklit etmeyi mümkün kılar. AI, bu tür egzersizlerde başarılı olmak için şu anda planlayamayan veya akıl yürütemeyen bu modellerin gerçek kapasitesinde olduğu gibi, bazı tartışmalar kalsa bile, Turing testi gibi referans testlerini başarıyla geçmiştir.
Bununla birlikte, insan verilerine bu bağımlılık sınırlarını göstermektedir: İlerleme şimdiye kadar çok önemli olsaydı, bilimsel alanlarda tatmin edici bir şekilde AI modellerine neden olmaya izin veren yüksek kaliteli insan kaynakları zaten tüketilmiş veya olmak üzeredir. İlerleme sadeceDenetimli öğrenme Bu tür kaynaklardan ve bu nedenle bilgi yavaşlama eğilimindedir. Üretken yapay zekaların ilerlemeye devam etmesi için, özellikle özgünlük ve yeniliğin bir parçası bekliyorsak, başka bir deyişle bu yapay zekanın gerçek bir “zeka” olmasını bekliyorsak, yeni bir veri kaynağı esastır.
Deneyim çağındaki insan verileri döneminin
Araştırmacılar David Silver ve Richard Sutton, yapay zeka alanındaki iki efsanevi figür (David Silver, Richard Sutton, takviye öğreniminin kurucularından biri olarak kabul edilirken, AlphaGo ve Alphazero'nun arkasındaki araştırmalara öncülük ediyor), şimdi gerçek dünyaya etkileşimlere sahip olmaya yetkili olması gerektiğini öne sürüyor. Bu, sundukları yeni adımın özüdür: deneyim dönemi. Onlara göre, deneyim yoluyla öğrenme potansiyeli kullanıldıktan sonra yeni kapasiteler ortaya çıkmalıdır.

© David Silver, Richard S. Sutton
“İnsan verilerinin dönemi” ve “deneyim dönemi” arasındaki bu geçişin başlangıcı mevcut modellerde bile zaten görülebilir. Geçen yıl, alfaproof ve alfageometri 2 – DeepMind tarafından bir kez daha geliştirilen iki AI – lise ve kolej öğrencileri için küresel bir matematik rekabeti olan Uluslararası Matematik Olimpiyatı sırasında ortaya çıkan sorunlara saldırdı. Algoritmaları sayesinde altı üzerinden çözülen dört problemleTakviye öğrenimiBu iki yapay zeka, bu etkinliğe gerçekten katılmış olsaydı gümüş madalya kazanırdı.

IMO 2024'teki Alphaproof skoru © Google
Araştırmacıların savundukları yaklaşım, “Deneyim akışı”öğrenmeyi güçlendirmeye dayanır; AI'ya kendi bilgilerini kendi kendini keşfetme yeteneği sunarak, esas olarak bireysel insan sorularına painkal olarak yanıt vermek için tasarlanan mevcut dilin (veya LLM) ana modellerinin boşluklarını düzeltmeyi amaçlamaktadır. Başka bir deyişle, üretken yapay zeka artık basit bir soru ve cevap alışverişi yoluyla kısa etkileşimlerden memnun olmamalı, daha ziyade insanlar gibi uzun bir ölçekte ilerleyen kendi deneyim akışına sahip olmalıdır. Burada, temel yeni veri kaynağı.
Artı otonom AI'ler, insanlık için faydalar veya riskler mi?
Bu yeni dönemde, ajanların gerçek dünyayla çok daha fazla etkileşim kurmaları gerekecek. özerk. Mutlaka kısıtlayıcı olan insanların tercih ettiği eylemlere ve gözlemlere odaklanmak yerine, AI gelecekteki hedeflere ulaşmak ve sürekli olarak yeni davranışsal kalıplara uyum sağlamak için çevresi ile tek başına alışveriş yapmak zorunda kalacaktır. Nihayetinde, bu yeni yapay zeka, hiç akla gelmeyen yeni stratejileri keşfetmek için dünyayı aktif olarak keşfetmek zorunda kalacak.
Kendi deneyimlerinin sonuçlarından sürekli olarak öğrenerek, bu yapay zekalar hızla yeni bilgi alabilirler. Kendi testlerini ve önlemlerini özerk bir şekilde yürütmek, yeni malzemelerin, ilaçların ve teknolojilerin benzeri görülmemiş bir oranda geliştirilmesine yol açacaktır. Hatta daha önce insanlığın münhasır alanı olarak kabul edilen kapasiteleri gösterebildiklerini bile kanıtlayabilirler: uzun vadeli problem çözme, yenilik veya hatta gerçek dünyadaki sonuçları derin bir anlayış.
Ancak uzun vadeli hedeflere ulaşmak için geniş dönemlerde dünyayla bağımsız olarak etkileşim kurma, insanlara müdahale etme karşılığında sunacak ve bu nedenle bir seviyeyi gerektirecektir. güven öğrenci. Tamamen insan verilerinden ve düşünme biçimlerinden uzaklaşmak, gelecekteki yapay zekaları yorumlamayı ve anlamayı zorlaştırabilir. Bu nedenle, deneyim dönemine güvenli bir geçiş sağlamak için ek araştırmalar gereklidir; Bu arada, her ihtimale karşı AI'ya teşekkür etmeye devam edin.
Ayrıca: “Bizi düzenleyin!” “,” AI insanlığı yok edecek “… AI Giants'ın bu” stratejilerine “dikkat edin, uzmanlar uyarın
Kaynak :Herhangi bir 01net haberini kaçırmamak için bizi Google News ve WhatsApp'ta takip edin.![]()
Deneyim dönemine hoş geldiniz (David Silver, Richard S. Sutton)