- ZeldoGiQ Newsletter
- Posts
- Die heißesten KI-News: Seedream 4.0, Google VEO 3 & mehr
Die heißesten KI-News: Seedream 4.0, Google VEO 3 & mehr
KI-Woche im Turbo: Neue Bildmodelle, Sprach-KI & Apples Geheimpläne
Hallo mein unabhängiger Freund,
diese Woche war im Bereich Künstliche Intelligenz wieder ein Feuerwerk an News. Ich habe dir die spannendsten Entwicklungen aus dem aktuellen YouTube-Video zusammengefasst – ohne Klickzwang, dafür mit allen wichtigen Infos auf einen Blick.
Seedream 4.0: Das neue Bildmodell von ByteDance
Seedream 4.0 erobert die Benchmarks und schlägt sogar Nano Banana in fast allen Kategorien. Besonders stark ist es bei:
Bildbearbeitung: Ob Objekte entfernen, Fotos kolorieren oder Details reparieren – Seedream liefert beeindruckende Ergebnisse.
Text-zu-Bild: Texte werden präzise in Bilder umgesetzt, inklusive sauberer Typografie.
Wissensbasierte Generierung: Matheaufgaben werden nicht nur gelöst, sondern auch visuell dargestellt.
➡️ Erste Tests zeigen, dass es Flux und Googles Modelle übertrumpft. Der Preis: ca. 3 Cent pro Bild über Plattformen wie Fal AI oder Replicate.
Google VEO 3: Hochformat kommt endlich
Große Neuigkeit für Content Creator: Google VEO 3 unterstützt jetzt Videos im 9:16 Hochformat.
Direkte Generierung aus Text oder Bildern möglich.
Wichtig: Kein automatisches Zuschneiden – man muss direkt im Hochformat arbeiten.
Potenziell spannende Integration in YouTube Reels.
Shatterbox Multilingual TTS
Ein echter Knaller im Bereich Text-to-Speech:
Nur wenige Sekunden Sprachprobe reichen zum Klonen.
Funktioniert in 23 Sprachen (Deutsch, Englisch, Russisch, Japanisch u. v. m.).
Open Source unter MIT-Lizenz von Resembly AI.
Damit könnte Sprachsynthese auf Open-Source-Basis neue Maßstäbe setzen.
Hunyuan Image 2.1
Tencent präsentiert mit Hunyuan Image 2.1 ein weiteres starkes Open-Source-Modell:
Präzise Bild- und Textgenerierung.
Noch keine Bildbearbeitung möglich.
Live-Demo auf Hugging Face verfügbar.
Einschränkung: Lizenz aktuell nicht für kommerzielle Nutzung.
Zum Video:
Apple: FastVLM & Siri
Apple zeigt mit FastVLM, dass KI auch bei ihnen ernst genommen wird:
Echtzeit-Videoerkennung beschreibt Szenen präzise.
Bloomberg-Berichte deuten auf ein KI-Update für Siri hin – inklusive webbasierter KI-Suche als Konkurrenz zu Perplexity & OpenAI.
Google Notebook LM
Neue Features:
Reports: optisch verbessert und flexibler.
Flashcards: jetzt integriert – perfekt für Lernen & Selbsttests.
Quizfunktion: generiert Fragen aus deinen Themen.
Leak: Neues OpenAI Bildmodell
Durchgesickert ist GPT Image 0721 Mini Alpha – offenbar ein neues Bildmodell von OpenAI. Ob es ein Update der Sora-Reihe wird, ist noch offen.
KI & Arbeitsmarkt
Harte Realität: Unternehmen wie Salesforce ersetzen bereits tausende Support-Jobs durch KI. Dario Amodai (Anthropic) warnt erneut: die Automatisierungswelle rollt.
Fazit der Woche:
Seedream 4.0 setzt neue Standards bei Bildgenerierung, Google VEO 3 macht Content-Creation im Hochformat möglich und Open-Source-Modelle wie Shatterbox TTS und Hunyuan Image 2.1 bringen spannende Alternativen. Gleichzeitig wird der Jobmarkt durch KI zunehmend erschüttert.
Ich hoffe wir lesen uns beim nächsten Newsletter,
bis dahin, bleib Fokussiert,
dein Zeldo ✌️