Neues Open-Source-KI-Modell von Alibaba! Qwen2.5-Omni-7B ermöglicht als multimodales Modell kostengünstige KI-Agenten!
Aufklärung über Eigenpositionen: Diese Aktien aus dem Artikel halten TraderFox-Redakteure aktuell
Alibaba Cloud hat am Donnerstag, den 27. März 2025, auf seiner Mitteilungsplattform alizila sein neuestes KI-Modell der Qwen-Reihe vorgestellt. Im Zuge der durch DeepSeek R1 ausgelösten KI-Begeisterung in China beschleunigen die großen Technologiegiganten wie Alibaba (BABA) ihre Entwicklungsbemühungen im Bereich der generativen KI und bringen in kürzester Zeit und mit beispiellosem Tempo neue, kostengünstige Modelle und Produkte auf den Markt.
Qwen2.5-Omni-7B ist das neue kompakte multimodale KI-Modell
Das neueste Modell von Alibaba heißt Qwen2.5-Omni-7B und ist ein einheitliches durchgängig multimodales KI-Modell seiner Qwen-Reihe. Das Modell ist damit in der Lage, Eingaben wie Texte, Bilder, Audio und Videoinhalte in kürzester Zeit zu verarbeiten und gleichzeitig Text- und natürliche Sprachantworten in Echtzeit zu generieren. Damit eignet es sich besonders gut für Edge-Geräte wie Mobiltelefone und Laptops und bietet dabei durch sein kompaktes Design von 7B-Parametern eine hohe Effizienz ohne große Leistungseinbußen. Alibaba ist sich sicher, dass die Kombination aus kompakter Struktur und Multimodalität das Modell zu einer perfekten Grundlage für die Entwicklung von agilen, preiswerten KI-Agenten macht, insbesondere für intelligente Sprachanwendungen. Als Beispiel nennt das Unternehmen einen Mehrwert für sehbehinderte Menschen, die durch Echtzeit-Audiobeschreibungen besser in ihrer Umgebung navigieren können oder sich Schritt für Schritt Anleitungen aus Kochvideos extrahieren lassen können. Das Modell verbessert Kundenservicegespräche, da es die Kundenbedürfnisse klarer und genauer im Dialog verstehen kann.
Hohe Leistung durch innovative Architektur
Das Modell setzt neue Maßstäbe in den Bereichen Echtzeit-Sprachinteraktion, natürliche und robuste Sprachgenerierung und durchgängige Sprachanweisungsverfolgung. Seine Effizienz und hohe Leistung verdankt es seiner innovativen Architektur. Dazu gehören die Thinker-Talker-Architektur, die Textgenerierung (durch Thinker) und Sprachsynthese (durch Talker) trennt, um Interferenzen zwischen verschiedenen Modalitäten zu minimieren und so eine hochwertige Ausgabe zu gewährleisten. Seine Positionseinbettungstechnik TMRoPE (Time-aligned Multimodal RoPE) verbessert die Synchronisierung der Videoeingänge mit Audio für eine kohärente Inhaltsgenerierung und die blockweise Verarbeitung von Streaminginhalten ermöglicht Audioantworten mit geringer Latenz für nahtlose Sprachinteraktionen. Qwen2.5-Omni-7B wurde bereits mit einem umfangreichen, vielfältigen Datensatz vortrainiert. Das Modell erreicht in OmniBench Spitzenwerte, einem Benchmarktest der die Integration mehrerer Modalitäten erfordert.
Trend der KI-Modelle geht in Richtung Open Source
Das neue Modell ist Open Source auf den Plattformen Hugging Face und Github verfügbar und kann ebenso über Qwen Chat und der Open-Source-Community ModelScope von Alibaba Cloud zugegriffen werden. Alibaba Cloud hat in den vergangenen Jahren bereits über 200 generativer KI-Modelle als Open Source veröffentlicht und folgt damit einem wachsenden Trend in China, nachdem DeepSeek sein bahnbrechendes R1-Modell ebenfalls als Open Source veröffentlicht hatte. Mit Open Source bezeichnet man eine Herangehensweise in der Softwareentwicklung, bei der der Quellcode frei im Internet zugänglich gemacht wird, um so schnellere Verbesserungen und Weiterentwicklungen zu ermöglichen und eine größere Verbreitung zu forcieren. Dadurch wird der KI-Boom in China deutlich beschleunigt und große Wettbewerber bringen mit erstaunlichem Tempo neue, kostengünstige Modelle auf den Markt. Alibaba hatte erst Anfang des Monats eine neue Version seines KI-Assistenten Quark veröffentlicht und auch der chinesische Technologieriese Baidu hat eine neues Basismodell seiner Ernie-Reihe auf den Markt gebracht.
Alibaba wird Künstliche Intelligenz in iPhones und neuesten BMW-Modelle bringen
Alibaba wird die beeindruckende Investitionssumme von 53 Mrd. USD in die Hand nehmen, um in den nächsten drei Jahren seine KI-Infrastruktur und Cloud-Computing-Bereiche durch Rechenzentren weiter auszubauen. Alibaba kann mit der Entwicklung eigener Large Language Models LLMs und dem Aufbau von Rechenzentren für die Rechenleistungsanforderung von KI zu einem deutlichen Profiteur des KI-Booms in China werden. Alibaba konnte bereits die Zusammenarbeit mit Apple bestätigen, um gemeinsam die Integration von KI-Anwendungen in den in China verkauften iPhones einzuführen. Außerdem konnte der Konzern seine strategische Partnerschaft mit BMW vertiefen und wird die Integration seiner Künstlichen Intelligenz in die nächste Generation der intelligenten Fahrzeuge des Automobilherstellers bringen.