Google auf neuem Allzeithoch! Veröffentlichung seiner neuen Gemini 2.0 KI-Modelle und Details zu Projekten treiben an!
Aufklärung über Eigenpositionen: Diese Aktien aus dem Artikel halten TraderFox-Redakteure aktuell
Google, das Tochterunternehmen von Alphabet (GOOG/GOOGL), stellte am Mittwoch, den 11. Dezember 2024, sein neuestes KI-Modell Gemini 2.0 vor. Das neue leistungsfähigste Modell wird als experimentelle Variante Gemini 2.0 Flash zur Verfügung zu stehen und bringt einige Fortschritte im Bereich der Multimodalität mit sich. Neben genauen Benchmark Messungen veröffentlichte Google weitere Details zu Prototypen Projekten und konnte die Anleger damit in seinen Bann reißen. Die Aktie stieg im Verlauf des Handels um über 5 %.
Gemini 2.0 bringt Verbesserungen im Bereich Bild und Audio-Output mit sich
Seitdem Google im Dezember 2023 mit Gemini 1.0 seine ersten KI-Modelle veröffentlichte, um Informationen in Texten, Videos, Bildern, Audio und Code zu verstehen und zu verarbeiten, haben Mio. von Entwicklern und Mrd. von Nutzern dabei geholfen, die bisherigen Errungenschaften weiterzuentwickeln und neu zu konzipieren. Der Softwareriese hat in KI-Agenten investiert, um den Menschen den Zugang zu Informationen zu vereinfachen und in einem mehrstufigen Prozess komplexe Aufgaben zu übernehmen. Die nun veröffentlichte Version Gemini 2.0 soll wesentliche Fortschritte in der Multimodalität im Bereich Bild- und Audio-Output besitzen, welche die Grundlage für einen universellen Assistenten sind.
"Wenn es bei Gemini 1.0 darum ging, Informationen zu systematisieren und zu verstehen, geht es bei Gemini 2.0 darum, sie viel hilfreicher zu machen. Ich kann es kaum erwarten zu sehen, was diese nächste Ära mit sich bringt.", kommentierte Sundar Pichai, CEO von Google und Alphabet, die neuen Gemini Modelle.
Deep Research ermöglicht verbesserte logische Schlussfolgerungen
Der US-Technologieriese führt eine neue Funktion namens Deep Research ein, die fortgeschrittene Argumentations- und Kontextfähigkeiten nutzt, um als Forschungsassistent zu fungieren, komplexe Themen zu untersuchen und Berichte im Namen der Benutzer zu erstellen. Sie ist ab heute für Abonnenten von Gemini Advanced verfügbar. Google wird die fortschrittlichen Fähigkeiten im logischen Schlussfolgern von Gemini 2.0 zu seinen Übersichten mit KI hinzufügen, damit Nutzer in der Lage sind, komplexere Themen anzugehen. Mathematische Gleichungen, multimodale Abfragen und das Schreiben von Code sollen dann kein Problem mehr sein. Tests in diesem Bereich haben bereits gestartet und werden im nächsten Jahr in mehr Ländern und Sprachen auf breiterer Ebene eingeführt.
Gemini 2.0 wurde zu 100 % mit seinem KI-Chip Trillium trainiert
Google betonte in seiner Mitteilung, dass Gemini 2.0 auf die jahrzehntelangen Investitionen für KI-Innovationen mit seiner maßgeschneiderten Hardware Trillium basiert, seiner Tensor Processing Unit TPU der sechsten Generation. Das Training wurde zu 100 % mit diesen KI-Chips erstellt, welche ab sofort auch für Kunden erhältlich sind. Die neue experimentelle Version von Gemini 2.0 Flash baut auf dem Erfolg von 1.5 Flash auf, dem beliebtesten Modell des Unternehmens für Entwickler. Diese soll über eine geringere Latenz bei verbesserter Leistung verfügen. Neben einer multimodalen Eingabemöglichkeit durch Bilder, Video und Audio ist Gemini 2.0 Flash in der Lage auch multimodale Ausgaben wie generierte Bilder mit Text und Sprachausgabe zu erzeugen. Die neue Version kann auch Tools wie Google Search, Codeausführung und benutzerdefinierte Funktionen von Drittanbietern aufrufen. Erste Benchmark Tests zeigen, dass Gemini 2.0 Flash in einigen wichtigen Tests fast doppelt so schnell ist wie seine Vorgängerversionen Gemini 1.5 Flash oder Gemini 1.5 Pro. Lediglich beim Verständnis von langen Kontexten hat man schlechter abgeschnitten.
Gemini 2.0 Flash wurde bereits im letzten Monat mit ersten Entwicklern geteilt und hat bereits viel Feedback gesammelt. Ab sofort ist die Technologie über die Gemini-API in Google AI Studio und Vertex AI zugänglich. Einige Funktionen wie die native Bilderzeugung wird vorerst ausgewählten Testern zur Verfügung stehen, ehe im Januar die allgemeine Verfügbarkeit und weitere Modellgrößen folgen werden. Außerdem wurde eine Multimodal Live API veröffentlicht mit Echtzeit-Audio und Video-Streaming-Eingabe, sowie eine für Chats optimierte Version von 2.0 Flash. Anfang nächsten Jahres wird das Unternehmen Gemini 2.0 auf weitere Google-Produkte ausweiten.
Forschungsprototypen Project Astra, Project Mariner und Jules vorgestellt
Auf dem Gebiet der praktischen Anwendung von KI-Agenten, stellte Google zwei Prototypen vor. Der Forschungsprototyp Project Astra erforscht die zukünftigen Fähigkeiten eines universellen KI-Assistenten einschließlich den Themen Sicherheit und Ethik. Die Verbesserungen mit Gemini 2.0 beinhalten verbesserte Dialoge durch gemischte Sprachen und Akzente, Verwendung neuer Tools wie Google Search, Google Lens und Google Maps, einem besseren Gedächtnis von bis zu 10 Minuten eines Gespräches und verbesserten Latenzzeiten, die einer menschlichen Konversation entsprechen. Das Projekt soll in Brillen integriert werden.
Project Mariner möchte die Interaktion zwischen Menschen und KI-Agenten beginnend im Browser vorantreiben. Es kann Informationen im Browserfenster wie Text, Code, Bilder und Formulare verstehen und über eine Chrome-Erweiterung Aufgaben erledigen. Man wird weiter an der Genauigkeit und Geschwindigkeit bei der Aufgabenerledigung arbeiten und versuchen Risiken zu minimieren. Benutzer werden vor Aktionen um eine endgültige Bestätigung gebeten, damit ungewollte Käufe verhindert werden können.
Jules ist ein KI-gestützter Code-Agent, der direkt in einen GitHub-Workflow integriert wird und Entwickler dabei unterstützt, schnell und effizient programmiertechnische Aufgaben zu erledigen.
Gemini 2.0 war nicht die einzige Ankündigung, die Alphabet diese Woche machte. Das Unternehmen stellte am Montag seinen Willow-Chip für Quantencomputer vor und sagte, der Chip habe in fünf Minuten eine Benchmark-Berechnung durchgeführt, für die einer der schnellsten Supercomputer von heute 10 Quadrillionen Jahre benötigt hätte. Alphabet ist auf bestem Wege seine Erfolgsbilanz bei der Entwicklung von Technologien der nächsten Generation weiter zu manifestieren.
Der Autor Andreas Wimbauer ist in folgende Werte investiert: Alphabet