Anthropics Claude-KI spielt Pokémon auf Twitch – langsam

Am Dienstagnachmittag startete Anthropic „Claude Plays Pokémon“ auf Twitch, einen Livestream von Anthropics neuestem KI-Modell, Claude 3.7 Sonnet , beim Spielen einer Partie Pokémon Red. Es ist eine Art faszinierendes Experiment geworden, das die Fähigkeiten der heutigen KI-Technologie und die Reaktionen der Menschen darauf demonstriert.

KI-Forscher haben alle möglichen Videospiele , von Street Fighter bis Pictionary , verwendet, um neue Modelle zu testen – oft mehr zum Vergnügen als zum praktischen Nutzen. Aber laut Anthropic hat sich Pokémon als nützlicher Benchmark für Claude 3.7 Sonnet erwiesen, das die Arten von Rätseln, die das Spiel enthält, effektiv „durchdenken“ kann.

Wie OpenAIs o3-mini und DeepSeeks R1 kann Claude 3.7 Sonnet sich durch schwierige Herausforderungen „durch Verstand“ kämpfen, wie zum Beispiel ein Videospiel für Kinder. Während der nicht-vernünftige Vorgänger des Modells, Claude 3.5 Sonnet , gleich zu Beginn von Pokémon Red scheiterte – als er das Zuhause des Spielers in Alabastia verließ – gelang es Claude 3.7 Sonnet, drei Orden als Arenaleiter zu gewinnen.

Claude versucht in Pokémon Red, ein Gebäude zu verlassen. **Bildnachweis:** Claude spielt Pokémon auf Twitch

Der neueste Claude gerät jedoch immer noch in Schwierigkeiten. Stunden nach Beginn des Twitch-Streams wurde das Modell von einer Felswand abgeschreckt, die es nicht durchqueren konnte, egal wie sehr es sich auch bemühte.

Ein Twitch-Benutzer fasste die Situation folgendermaßen zusammen: „Wer würde gewinnen, eine Computer-KI, in deren Programmierung Tausende von Stunden investiert wurden, oder eine Felswand?“

Schließlich erkannte Claude, dass es um die Wand herum navigieren konnte.

Einerseits ist es frustrierend, Claude dabei zuzusehen, wie er Pokémon Red mit der Geschwindigkeit eines Flegmons durchquert und jeden einzelnen Schritt mit quälender Grübelei durchdenkt. Andererseits ist es auch seltsam fesselnd. Die linke Seite des Streams zeigt Claudes „Gedankenprozess“, während die rechte Seite das Gameplay in Echtzeit zeigt.

Einmal versuchte Claude, Professor Oak in seinem Labor ausfindig zu machen, wurde jedoch verwirrt, weil sich noch andere NPCs in der Szene befanden.

„Mir fällt auf, dass unter mir eine neue Figur aufgetaucht ist – eine Figur mit schwarzem Haar und einem scheinbar weißen Kittel bei den Koordinaten (2, 10)“, schrieb Claude. „Das könnte Professor Oak sein! Lass mich nach unten gehen und mit ihm reden.“

Claude sprach dann fälschlicherweise mit einem anderen NPC als dem Prozessor – einem NPC, mit dem das Modell schon mehrere Male zuvor gesprochen hatte. Einige der über tausend Leute im Twitch-Chat wurden langsam nervös. Andere, insbesondere diejenigen, die den Stream schon länger als ein paar Minuten verfolgt hatten, waren weniger beunruhigt.

„Leute, bleibt cool“, schrieb jemand im Chat. „Zuvor haben wir Oaks Labor ungefähr zehnmal verlassen und betreten, bevor wir verstanden haben, wie es weitergeht.“

Anthropisches Pokemon Rot — **Bildnachweis:** Anthropisch

Für langjährige Twitch-Nutzer könnte das Format des Anthropic-Streams nostalgische Gefühle hervorrufen. Vor über einem Jahrzehnt versuchten Millionen von Menschen gleichzeitig, Pokémon Red zu spielen, in einem einzigartigen sozialen Online-Experiment namens Twitch Plays Pokémon . Jeder Benutzer konnte die Spielfigur über den Twitch-Chat steuern, was zu einem vorhersehbar chaotischen Spielverlauf führte.

Einige KI-Forscher haben Twitch Plays Pokémon als Inspiration für ihre Arbeit genannt. Im Oktober 2023 veröffentlichte der in Seattle ansässige Softwareentwickler Peter Whidden ein YouTube-Video, in dem er detailliert beschreibt, wie er einen Reinforcement-Learning-Algorithmus trainierte, um Pokémon zu spielen. Seine KI verbrachte über 50.000 Stunden mit dem Spiel, bevor sie lernte, sich erfolgreich darin zurechtzufinden. Eine Herausforderung bestand darin, dass die KI es vorzog, die verpixelte Landschaft zu bewundern, anstatt das Spiel tatsächlich zu spielen.

KI-gestützte „Nachstellungen“ von Twitch Plays Pokémon wie die von Whidden und Anthropic sind unterhaltsam, aber gleichzeitig auch ein wenig bittersüß. Der ursprüngliche Stream war ein so entscheidender Moment in der Geschichte von Twitch, weil er die Leute auf unerwartete Weise zusammenbrachte. Alle waren im selben Team und arbeiteten auf das Ziel hin, dass die Spielfigur nicht mehr im Kreis läuft und tatsächlich im Spiel vorankommt.

Im Jahr 2025 sind wir anscheinend keine Teamkollegen mehr, sondern Zuschauer, die einem KI-Modell dabei zusehen, wie es versucht, ein Spiel zu spielen, das viele von uns schon im Alter von fünf Jahren verstanden haben. Es ist ein KI-motivierter Mikrokosmos eines größeren Trends: Unsere Online-Erfahrungen bewegen sich von gemeinsamen, gemeinschaftlichen Aktivitäten hin zu eher einsamen.

techcrunch

Anthropics Claude-KI spielt Pokémon auf Twitch – langsam

Ein Twitch-Benutzer fasste die Situation folgendermaßen zusammen: „Wer würde gewinnen, eine Computer-KI, in deren Programmierung Tausende von Stunden investiert wurden, oder eine Felswand?“

Schließlich erkannte Claude, dass es um die Wand herum navigieren konnte.

Einmal versuchte Claude, Professor Oak in seinem Labor ausfindig zu machen, wurde jedoch verwirrt, weil sich noch andere NPCs in der Szene befanden.

„Leute, bleibt cool“, schrieb jemand im Chat. „Zuvor haben wir Oaks Labor ungefähr zehnmal verlassen und betreten, bevor wir verstanden haben, wie es weitergeht.“

techcrunch

Anthropics Claude-KI spielt Pokémon auf Twitch – langsam

Ähnliche Nachrichten

Anthropics Claude-KI spielt Pokémon auf Twitch – langsam

Ähnliche Nachrichten

Drei tropische Wirbelstürme wirbeln im Südpazifik

Microsoft ermöglicht Benutzern der kostenlosen Copilot-KI die Nutzung von Sprachkonversationen und komplexen Abfragetools

Clicks erweitert sein Angebot an Smartphone-Tastaturhüllen auf die Android-Modelle Pixel und Galaxy

Microsoft Copilot bietet Voice und o1-gestütztes Think Deeper kostenlos an

Wie viel kostet ChatGPT? Alles, was Sie über die Preispläne von OpenAI wissen müssen