• KI Weekly
  • Posts
  • 🤖 OpenAI stellt neue Modelle vor

🤖 OpenAI stellt neue Modelle vor

PLUS: 4 weitere Stories, wöchentliche Tipps, Shorts & Events sowie 5 KI-Tools

Ausgabe: 15/2025

Guten Morgen, 🌞

das Team der KI Weekly wünscht dir frohe Ostern! 🐣 Eine Woche ist vergangen, und KI WEEKLY hält Dich auf dem neuesten Stand des KI-Universums.

In dieser Ausgabe

… und natürlich unser wöchentliches KI-Ranking.

KI-Tools der Woche

  1. 🎯 Gamma 2.0 - Dein KI Designpartner

  2. 📽️ Veo 2 - Googles SOTA-Videomodell

  3. 🔎 Claude Research - Anthropic's neue DeepSearch-ähnliche Funktion für Claude

  4. 👁️ Gemini Live - Visuelle KI in Echtzeit auf Android-Geräten und über Bildschirmfreigabe

  5. 🎨 Canva Visual Suite 2.0 - Mit KI über alle Designtypen hinweg gestalten

#Bonus: 📒 Notion - Jetzt mit NotionAI in der zweiten Generation. Ein Tool, das alles kann. Suchen, generieren, analysieren und chatten.*

- 01 -

🤖 OpenAIs GPT-4.1-Familie mit Fokus auf Entwickler

GPT-4.1 Family benchmarks

Bildquelle: OpenAI

OpenAI hat GPT-4.1 veröffentlicht, eine neue, reine API-Modellfamilie, die speziell für Entwickler entwickelt wurde. Sie bietet erhebliche Verbesserungen bei den Programmierfähigkeiten und der Promptfolgung sowie die Fähigkeit, bis zu 1 Mio. Token an Kontext zu verarbeiten.

Die Details:

  • Die neue API-only-Produktreihe umfasst GPT-4.1, 4.1 mini und 4.1 nano und übertrifft GPT-4o bei wichtigen Entwickleraufgaben deutlich.

  • Alle drei Modelle unterstützen 1 Mio. Token-Kontexte, genug für 8 vollständige React-Codebases, und sind bei typischen Abfragen 26 % günstiger als GPT-4o.

  • Die Modelle zeigen auch Vorteile bei realen Aufgaben wie der Frontend-Entwicklung, wobei die Bewerter die Webschnittstellen von 4.1 in 80 % der Fälle gegenüber GPT-4o bevorzugen.

  • Die Preise wurden durchweg gesenkt, wobei GPT-4.1 um 26 % günstiger ist als GPT-4o und 4.1 nano das bisher schnellste und günstigste Modell von OpenAI ist.

Warum das wichtig ist: Das einzige, was sich rückwärts bewegt, ist OpenAIs Namenskonvention - aber GPT-4.1 ist ein großer Sprung nach vorne für Entwickler. Mit einem riesigen Kontextfenster, geringeren Kosten und einem schärferen Fokus bildet es eine neue Grundlage für die agentenbasierte Programmierung und könnte ein Vorläufer des gerüchteweise angekündigten Agentic Software Engineer sein.

- 02 -

🎥 ByteDance's effizientes Seaweed Video AI

ByteDance's Video AI im Einsatz

Bildquelle: ByteDance

ByteDance führt Seaweed ein, ein hypereffizientes 7B-Parameter-Videogenerierungsmodell, das mit viel größeren Modellen wie Kling 1.6, Google Veo und Wan 2.1 konkurrieren kann, obwohl es deutlich weniger Rechenressourcen benötigt.

Die Details:

  • Seaweed verfügt über mehrere Generierungsmodi, darunter Text-zu-Video, Bild-zu-Video und audiogesteuerte Synthese, mit Ausgaben von bis zu 20 Sekunden.

  • Das Modell schneidet im Vergleich zu seinen Konkurrenten bei menschlichen Bewertungen sehr gut ab und übertrifft Modelle wie Sora und Wan 2.1 bei Bild-zu-Video-Aufgaben um ein Vielfaches.

  • Es kann auch komplexe Aufgaben wie Multi-Shot-Storytelling, kontrollierte Kamerabewegungen und sogar synchronisierte audiovisuelle Erzeugung bewältigen.

  • Laut ByteDance wurde Seaweed für Anwendungen wie die Animation von Menschen optimiert, wobei der Schwerpunkt auf realistischen menschlichen Bewegungen und Lippensynchronisation liegt.

Warum das wichtig ist: Mit Wan (Alibaba), Kling und jetzt Seaweed von ByteDance ist China dabei, die Rangliste der KI-Videos zu sprengen. Diese Veröffentlichung in Byte-Größe (Wortspiel beabsichtigt) zeigt auch, dass Größe nicht der einzige Weg zu einer erstklassigen Videoerstellung ist und eröffnet eine effiziente, grenzenlose Kreativität mit leicht verfügbaren, nahezu SOTA-Videomodellen.

- 03 -

📱OpenAI veröffentlicht o3 und o4-mini

Bildquelle: OpenAI

OpenAI hat diese Woche o3 und o4-mini veröffentlicht, seine bisher intelligentesten Denkmodelle, die jetzt mit vollem agentischen Zugriff auf alle ChatGPT-Tools und der Fähigkeit, „mit Bildern zu denken“, ausgestattet sind - zusammen mit dem Start eines neuen Open-Source-Coding-Agenten.

Die Details:

  • OpenAI o3 ist der neue Top-Tier-Reasoner, der die SOTA-Leistung in den Bereichen Kodierung, Mathematik, Wissenschaft und multimodale Benchmarks steigert.

  • o4-mini bietet schnelles, kosteneffizientes Reasoning, das die bisherigen Mini-Modelle deutlich übertrifft und sogar Benchmarks wie AIME 2025 Mathe sättigt.

  • Beide Modelle können alle Werkzeuge innerhalb von ChatGPT (Websuche, Python, Bilderzeugung, etc.) als Teil ihres Problemlösungsprozesses nutzen und kombinieren.

  • Die Modelle sind auch die ersten, die in der Lage sind, „mit Bildern zu denken“, indem sie visuelle Analyse und Manipulation direkt in ihre Denkkette integrieren.

  • Ebenfalls neu eingeführt wird Codex CLI, ein Open-Source-Coding-Agent, der auf den Terminals der Benutzer läuft und Denkmodelle mit Codierungsaufgaben verknüpft.

  • Präsident Greg Brockman sagte, die Veröffentlichung sei ein „qualitativer Schritt in die Zukunft auf GPT-4-Niveau“, wobei die Modelle in der Lage seien, neue wissenschaftliche Ideen zu entwickeln.

Warum das wichtig ist: Was auch immer die Messlatte für AGI sein mag, es scheint, als kämen die neuesten SOTA-Modelle ihr sehr nahe. Während die Reasoner bereits ein gewaltiger Sprung waren, hat die Ausstattung mit Werkzeugen und multimodalen Fähigkeiten zu einer Klasse von Modellen geführt, die neue Ideen hervorbringen - was uns anscheinend zur Stufe 4 der OpenAI-Leiter der KI-Intelligenz führt.

- 04 -

🖥️ Copilot erhält praktischen Zugang zum Computer

Copilot Dashboard mit neuen Funktionen

Bildquelle: Microsoft

Microsoft bringt eine neue Funktion für die Computernutzung in Copilot Studio auf den Markt, mit der Nutzer und Unternehmen KI-Agenten erstellen können, die Websites und Desktop-Anwendungen direkt bedienen können.

Die Details:

  • Die neue Funktion ermöglicht es Agenten, mit grafischen Benutzeroberflächen (GUIs) zu interagieren, indem sie auf Schaltflächen klicken, Menüs auswählen und Eingaben in Felder vornehmen.

  • Der Prozess ermöglicht die Automatisierung von Aufgaben auf Systemen, für die es keine speziellen APIs gibt, so dass Agenten Anwendungen wie Menschen nutzen können.

  • Computer Use passt sich außerdem in Echtzeit an Schnittstellenänderungen an und behebt automatisch Probleme, damit die Abläufe nicht unterbrochen werden.

  • Die gesamte Verarbeitung erfolgt auf einer von Microsoft gehosteten Infrastruktur, wobei Unternehmensdaten ausdrücklich vom Modelltraining ausgeschlossen sind.

Warum das wichtig ist: Copilot reiht sich in die Reihe von OpenAI und Anthropic's Computer Use Tools ein und markiert einen weiteren Schritt in der Verlagerung der KI von Chat-Fenstern in alltägliche Software. Es ist zwar nicht das einzige UI-Automatisierungstool, aber die bestehenden Geschäftsabläufe von Microsoft-Nutzern sind ein perfekter Anwendungsfall, um von dieser Art von Funktion zu profitieren.

- 05 -

🤔 Googles Gemini 2.5 Flash mit "denkendem Budget"

Gemini 2.5 Flash logo

Bildquelle: Google

Google stellte vor kurzem Gemini 2.5 Flash vor - eine hybride KI für logisches Denken, die o4-mini entspricht, Claude 3.5 Sonnet in logischen/systemischen Benchmarks übertrifft und ein neues „Denkbudget“ zur Optimierung von Kosten und Qualität einführt.

Die Details:

  • 2.5 Flash zeigt signifikante Leistungssteigerungen im Vergleich zu seinem Vorgänger (2.0 Flash) und bietet einen steuerbaren Denkprozess, um die Funktion ein- oder auszuschalten.

  • Das Modell zeigt eine starke Leistung bei den Benchmarks für logisches Denken, MINT und visuelles Denken, obwohl es nur einen Bruchteil der Kosten der Mitbewerber verursacht.

  • Entwickler können auch ein „Denkbudget“ (bis zu 24.000 Token) festlegen, mit dem das Gleichgewicht zwischen Antwortqualität, Kosten und Geschwindigkeit fein abgestimmt werden kann.

  • Es ist über eine API durch Google AI Studio und Vertex AI verfügbar und erscheint auch als experimentelle Option innerhalb der Gemini-App.

Warum das wichtig ist: OpenAI mag diese Woche die Diskussion dominiert haben, aber Google liefert direkt daneben. Die kontrollierbare, budgetierte Argumentation ist eine interessante Anpassung, bei der die Nutzer die Funktion nur dann nutzen können, wenn eine Aufgabe es erfordert - so werden erschwingliche, hochvolumige Anwendungsfälle erschlossen und das Denken für komplexere Aufgaben eingespart.

⭐ Wöchentliches KI-Ranking

And the Winner is...

o4-mini (high) von OpenAI - verfügbar in ChatGPT und in der ChatGPT App mit dem ChatGPT Plus Abonnement. Es gibt ein Nutzungslimit von 50 Anfragen pro Tag.

🗞️ Shorts

1️⃣ OpenAI‑Modell o3 bricht IQ‑Rekord
Das neue o3‑Modell von OpenAI erreichte 136 Punkte (116 offline) im Mensa‑IQ‑Test Norwegen und übertrifft damit Gemini 2.5 Pro – der bislang höchste gemessene Wert.

2️⃣ Claude erhält bald Sprachmodus
Anthropic bereitet die Einführung eines Sprachmodus für Claude vor. Drei KI‑Stimmen – „Airy“, „Mellow“ und „Buttery“ – sollen noch in diesem Monat verfügbar sein.

3️⃣ ChatGPT bekommt Bibliotheks‑Tab
OpenAI ergänzt ChatGPT um einen neuen „Library“-Tab. Nutzer aller Tarife können damit sämtliche von ihnen erstellten Bilder zentral verwalten.

4️⃣ NVIDIA startet KI‑Fertigung in den USA
NVIDIA kündigt erstmals eine US‑amerikanische Produktion von KI‑Chips und Supercomputern an – gemeinsam mit TSMC, Foxconn & Co. in Arizona und Texas.

5️⃣ Netflix plant KI‑gestützte Suche mit OpenAI
Netflix arbeitet laut Berichten mit OpenAI an einer überarbeiteten Suchfunktion, die Inhalte künftig auch anhand neuer Parameter wie Stimmung auffindbar macht.

Tipps und Tricks

🔢 Tabellen mit KI in Google Sheets umgestalten

In diesem Tutorial lernst du, wie du die neue KI-Formel von Google Sheets nutzen kannst, um Inhalte zu generieren, Daten zu analysieren und benutzerdefinierte Ausgaben direkt in deiner Tabellenkalkulation zu erstellen - und das alles mit einem einfachen Befehl.

Schritt-für-Schritt-Anleitung:

  1. Öffne Google Sheets über dein Google Workspace-Konto.

  2. Gib in eine beliebige Zelle =AI(„Ihre Eingabeaufforderung“, [optionaler Zellverweis]) mit spezifischen Eingabeaufforderungen wie „Fasse dieses Kundenfeedback in drei Aufzählungspunkten zusammen“ ein.

  3. Wenden Sie Ihre Formel auf mehrere Zellen an, indem Sie den Eckanfasser zur Stapelverarbeitung eine ganze Spalte hinunterziehen.

  4. Kombiniere Standardfunktionen wie IF() und CONCATENATE(), um leistungsstarke Workflows zu erstellen, und benutze „Aktualisieren und einfügen“, wann immer du aktualisierte Inhalte brauchst.

Profi-Tipp: Außerdem kannst du Formatierungsanweisungen direkt in deine Eingabeaufforderung einfügen, z. B. „im Tabellenformat“ oder „als nummerierte Liste“, um zu steuern, wie deine Ausgabe in der Zelle erscheint.

👥 Bevorstehende KI-Events

Du möchtest ein Event bewerben? Kontaktiere uns hier.

Das war’s!

👉 Vielen Dank fürs Lesen und bis nächste Woche!

Damit wir KI WEEKLY noch besser für Dich gestalten können, würden wir gerne wissen, wie Dir der heutige Newsletter gefallen hat:

Login oder Abonnieren um an umfragen teilzunehmen.

Wurde diese E-Mail Dir weitergeleitet? Jetzt anmelden!

📣 Erreiche mit Deiner Werbung tausende KI-Enthusiasten!

Unser Newsletter wird von Tausenden Tech-Enthusiasten und Top-Unternehmern in Deutschland, Österreich und der Schweiz gelesen. Antworte einfach auf diese E-Mail, um Deine Anfrage zur richtigen Zielgruppe zu bringen.

Reiche hier Dein KI-Tool ein.

Nur bei mit einem Sternchen (*) gekennzeichneten Links handelt es sich um Affiliate-Links. Wir erhalten für jeden Kauf eine Provision. Dies hat keinen Einfluss darauf, wie wir ein Tool oder einen Anbieter bewerten.

Reply

or to participate.