Anthropic'in Claude AI'sı Twitch'te Pokémon oynuyor - yavaşça

Salı öğleden sonra Anthropic, Twitch'te Claude Plays Pokémon'u başlattı, Anthropic'in en yeni AI modeli Claude 3.7 Sonnet'in Pokémon Red oyununu oynadığı canlı bir yayın. Günümüzün AI teknolojisinin yeteneklerini ve insanların bunlara tepkilerini sergileyen bir tür büyüleyici deney haline geldi.
Yapay zeka araştırmacıları, yeni modelleri test etmek için Street Fighter'dan Pictionary'ye kadar her türlü video oyununu kullandılar - genellikle faydadan çok eğlence amaçlı. Ancak Anthropic, Pokémon'un oyunun içerdiği bulmaca türlerini etkili bir şekilde "düşünebilen" Claude 3.7 Sonnet için yararlı bir ölçüt olduğunu söyledi.
OpenAI'nin o3-mini ve DeepSeek'in R1'i gibi Claude 3.7 Sonnet de çocuklara yönelik bir video oyunu oynamak gibi zorlu zorlukların üstesinden "mantıklı" bir şekilde gelebilir. Modelin mantıksız öncülü Claude 3.5 Sonnet , Pokémon Red'in en başında başarısızlığa uğrarken - oyuncunun Pallet Kasabası'ndaki evinden çıkmak - Claude 3.7 Sonnet üç spor salonu lideri rozeti kazanmayı başardı.

Ancak en yeni Claude bile hala sorun yaşıyor. Twitch yayınında saatler geçtikten sonra, model ne kadar uğraşırsa uğraşsın içinden geçemediği bir kaya duvarı tarafından engellendi.
Bir Twitch kullanıcısı durumu şu şekilde özetledi: "Binlerce saat programlanmış bir bilgisayar yapay zekası mı, yoksa 1 kaya duvarı mı kazanır?"
Sonunda Claude, onun duvarın etrafından dolaşabileceğini fark etti.
Bir yandan, Claude'un Pokémon Red'i bir Slowpoke'un hızıyla geçmesini, her bir adımı dayanılmaz bir tefekkürle akıl yürütmesini izlemek sinir bozucu. Ancak aynı zamanda tuhaf bir şekilde ilgi çekici. Akışın solunda Claude'un "düşünce süreci" gösterilirken sağda gerçek zamanlı oyun gösteriliyor.
Bir noktada Claude, Profesör Oak'ı laboratuvarında bulmaya çalıştı ancak sahnede başka NPC'ler de olduğu için kafası karıştı.
Claude, "Altımda yeni bir karakterin belirdiğini fark ettim - siyah saçlı ve (2, 10) koordinatlarında beyaz bir ceketi olan bir karakter," diye yazdı. "Bu Profesör Oak olabilir! Aşağı inip onunla konuşayım."
Claude daha sonra yanlışlıkla İşlemci dışındaki bir NPC ile konuşmaya başladı — modelin daha önce birkaç kez konuştuğu bir NPC. Twitch sohbetindeki bin küsur kişiden bazıları huzursuzlanmaya başladı. Diğerleri, özellikle yayını birkaç dakikadan fazla süredir izleyenler, daha az endişeliydi.
"Çocuklar sakin olun," diye yazdı bir kişi sohbette. "Oak'ın laboratuvarına nasıl devam edeceğimizi anlamadan önce 10 kere girip çıktık."

Uzun süredir Twitch kullananlar için Anthropic'in yayın formatı nostaljik gelebilir. On yıldan uzun bir süre önce, milyonlarca kişi Twitch Plays Pokémon adlı türünün ilk örneği olan bir çevrimiçi sosyal deneyde aynı anda Pokémon Red oynamaya çalıştı. Her kullanıcı Twitch sohbeti aracılığıyla oyuncu karakterini kontrol edebiliyordu ve bu da tahmin edilebileceği gibi kaotik bir oyun deneyimiyle sonuçlanıyordu.
Bazı AI araştırmacıları, çalışmaları için ilham kaynağı olarak Twitch Plays Pokémon'u gösterdiler. Ekim 2023'te Seattle merkezli yazılım mühendisi Peter Whidden, bir takviyeli öğrenme algoritmasını Pokémon oynaması için nasıl eğittiğini ayrıntılı olarak açıklayan bir YouTube videosu yayınladı. AI'sı, başarılı bir şekilde gezinmeyi öğrenmeden önce oyunu oynayarak 50.000 saatten fazla zaman geçirdi. Karşılaşılan zorluklardan biri, AI'nın oyunu gerçekten oynamak yerine pikselli manzaraya hayran kalmayı tercih etmesiydi.
Yapay zeka destekli Twitch Plays "yeniden canlandırma"ları Whidden'ın ve Anthropic'in Pokémon'ları eğlenceli ama aynı zamanda biraz da buruk. Orijinal yayın, Twitch tarihinde çok önemli bir andı çünkü insanları beklenmedik bir şekilde bir araya getirdi. Herkes aynı takımdaydı ve oyuncu karakterinin daireler çizerek koşmayı bırakıp oyunda ilerlemesini sağlama hedefi doğrultusunda çalışıyordu.
2025'te artık takım arkadaşı değil, seyirci gibiyiz, bir AI modelinin beş yaşındayken çoğumuzun alıştığı bir oyunu oynamaya çalışmasını izliyoruz. Bu, daha büyük bir eğilimin AI tarafından motive edilmiş bir mikrokozmosu: çevrimiçi deneyimlerimiz paylaşılan, toplumsal aktivitelerden daha yalnız olanlara doğru ilerliyor.
techcrunch