الدورات

title


Google DeepMind stellt Genie 2 vor: KI, die spielbare 3D-Welten erstellen kann

Google DeepMind stellt Genie 2 vor: KI, die spielbare 3D-Welten erstellen kann

Google DeepMind hat Genie 2 vorgestellt, ein bahnbrechendes KI-Modell, das in der Lage ist, aus einem einzigen Bild spielbare 3D-Umgebungen zu generieren. Dies folgt auf seinen Vorgänger Genie, der nur 2D-Spielwelten erstellen konnte.


Was macht Genie 2 besonders?


Erstellung von 3D-Umgebungen: Im Gegensatz zu den 2D-Welten von Genie kann Genie 2 immersive, steuerbare 3D-Welten mit konsistenten Objekten erstellen. Diese Umgebungen ermöglichen es Benutzern (oder KI-Agenten), zu gehen, zu schwimmen, zu klettern und zu interagieren.

Konsistenz: Die Umgebungen bleiben stabil und konsistent, sodass die Welt unverändert bleibt, wenn ein Benutzer einen Ort verlässt und dorthin zurückkehrt.

Interaktion und Physik: Benutzer können mit Objekten interagieren (z.B. Türen öffnen, Leitern hochklettern) und realistische Effekte wie Schwerkraft, Wasserwellen, Rauch und Beleuchtung erleben.

Vielseitige Ansichten: Unterstützt Egoperspektive, isometrische und Third-Person-Perspektiven, die verschiedenen Anwendungen gerecht werden.


Technische Details


Latentes Diffusionsmodell: Genie 2 verwendet ein autoregressives latentes Diffusionsframework, das auf umfangreichen Videodatensätzen trainiert wurde.

Autoencoder-Integration: Ermöglicht die Erstellung von Welten Bild für Bild.

Skalierbares Agententraining: Ergänzt das frühere SIMA-Modell (Scalable Instructable Multiworld Agent) von DeepMind, indem es dynamische Umgebungen für das KI-Training bereitstellt.

Anwendungen und Potenzial

Spieleentwicklung: Vereinfacht die Erstellung dynamischer Spielwelten für den menschlichen Spielspaß oder das Testen von KI-Agenten.

KI-Training: Bietet simulierte Umgebungen für das Training von Agenten in realen Szenarien wie Navigation, Problemlösung oder Umweltinteraktionen.

Unterhaltung und Simulation: Ebnet den Weg für Fortschritte im Gaming, in der virtuellen Realität und auf anderen interaktiven Plattformen.

Die Zukunft der KI-gesteuerten Weltmodellierung

Mit Genie 2 setzt Google DeepMind neue Maßstäbe für die Fähigkeiten generativer KI. Seine Fähigkeit, reiche, interaktive 3D-Umgebungen zu erzeugen, könnte nicht nur das Gaming, sondern auch die KI-Forschung, das Training und die auf Simulationen basierenden Branchen transformieren. Da der Wettbewerb im KI-Bereich zunimmt, zeigen Innovationen wie Genie 2, wie fortschrittliche generative Modelle technologische Grenzen verschieben.