AI TRIBE NEWS

KI NEWS FÜR KREATIVE: WAR'S DAS FÜR PHOTOSHOP?

Geschrieben von Jörg Janßen | Nov 8, 2024 7:20:57 AM

War's das für Photoshop? Runway mit neuer Kameratechnik, On-Demand Spiele und Suno führt Personas ein!

 

Hallo AI TRIBE, diese Woche gibt es wieder einige Entwicklungen aus der Welt der Künstlichen Intelligenz. Ob es um Videobearbeitung, Spieleentwicklung oder Bildgenerierung geht, hier ist ein Überblick über die aktuellen Themen.

Runway Gen-3 Alpha Turbo: Neue Kamerakontrollfunktion 🎥

Runway hat sein Gen-3 Alpha Turbo Modell mit einer neuen Kamerasteuerungsfunktion erweitert, die die Arbeit mit KI-generierten Videos präziser machen soll.

Funktionen im Überblick:

  • Bewegungssteuerung: Es ist möglich, die Richtung und Intensität der Kamerabewegung zu steuern, darunter horizontale, vertikale und diagonale Bewegungen.
  • Zoomen & Schwenken: Die Funktion ermöglicht das Heran- und Wegzoomen sowie Schwenkaufnahmen, um den Bildausschnitt zu erweitern.
  • Eingabemöglichkeiten: Text-, Bild- und Videoeingaben werden unterstützt. Ein Ausgangsbild ist vorab hochzuladen.
  • Verfügbarkeit: Die Funktion steht sowohl für kostenlose Nutzer (mit begrenzten Tokens) als auch für zahlende Abonnenten (ab 12 Dollar pro Monat) zur Verfügung.

 

Hintergrund: Eine präzise Kamerasteuerung war in der KI-Videobearbeitung bislang eher schwierig zu realisieren. Die neue Funktion bietet erweiterte Möglichkeiten, bleibt jedoch abzuwarten, wie gut sie in der Praxis eingesetzt werden kann.

Oasis von Decart AI: Neues KI-Modell für Open-World-Spiele 🎮

Decart AI hat mit Oasis ein Modell präsentiert, das Open-World-Gaming verändern könnte. Es generiert Frame für Frame in Echtzeit und reagiert dabei auf die Eingaben der Nutzer.

Was zeichnet Oasis aus?

  • Echtzeit-Interaktivität: Das Modell verarbeitet Eingaben von Tastatur und Maus und erstellt daraus ein dynamisches Gameplay.
  • Gelernte Fähigkeiten: Bewegungen, Sprünge und das Aufnehmen von Gegenständen sind Teil der erlernten Fähigkeiten, die Oasis durch das Beobachten von Gameplay-Szenen entwickelt hat.
  • Technische Basis: Das Modell kombiniert Diffusions-Training mit Transformer-Modellen und läuft auf leistungsstarken NVIDIA H100 GPUs.

 

Ausblick: Oasis zeigt Potenzial, interaktive KI-gesteuerte Spielelemente voranzutreiben. Allerdings bleibt offen, wie stabil die Technologie bei komplexen Spielszenarien agieren kann.

Playground AI: Tool für Bildgenerierung und Bearbeitung 🖼️

Playground AI ist ein Bildbearbeitungs- und Generierungstool, das verschiedene Funktionen für kreative Arbeiten bietet.

Funktionalitäten:

  • Bildgenerierung: Mit der DALL-E-Technologie erstellt Playground AI Bilder aus Textbeschreibungen. Bis zu 1.000 Bildgenerierungen sind pro Tag kostenlos.
  • Bearbeitungsoptionen: Nutzer können Objekte aus Bildern entfernen und Bilder hochskalieren.
  • Benutzeroberfläche: Zwei Modi stehen zur Auswahl: "Board" für Bildvariationen und "Canvas" für schnelle Bearbeitung.

 

Quelle: Playground.ai

Einschränkungen und Nutzung: Für die Nutzung wird ein Google-Account benötigt. Bilder können auch kommerziell verwendet werden, was es für Profis interessant macht. Ob die Qualität jedoch konstant überzeugt, hängt von der Eingabe und den spezifischen Anforderungen ab.

Personas von Suno: Musik neu gedacht 🎵

Suno hat "Personas" eingeführt – eine Funktion, die es ermöglicht, den Stil eines Songs zu speichern und in neuen Musikstücken zu verwenden.

Details zur Funktionsweise:

  • Persona-Erstellung: Du kannst eine Persona basierend auf einem Song erstellen, die dann als Vorlage für andere Lieder dient.
  • Verfügbarkeit: Für Pro- und Premier-Mitglieder in der Beta-Phase verfügbar, mit 200 kostenlosen Songs; danach kosten neue Songs Credits.

 

Feedback erwünscht: Suno bittet um Rückmeldungen zur neuen Funktion, um diese weiterzuentwickeln. Es bleibt zu sehen, wie hilfreich diese Funktion für verschiedene Musikprojekte tatsächlich ist.

Quelle:

OmniGen AI: Neues Modell für Bildbearbeitung und -generierung 🖌️

OmniGen AI bringt frischen Wind in die Welt der Bildbearbeitung und -generierung. Das Modell, entwickelt von Forschern der Beijing Academy of Artificial Intelligence, vereint verschiedene Ansätze in einer Plattform und ist als Open Source verfügbar.

Hauptmerkmale:

  • Unified Image Generation: OmniGen AI ermöglicht die Erstellung und Bearbeitung von Bildern mit multimodalen Prompts (Text und Referenzbilder) ohne zusätzliche Plugins oder Vorverarbeitungsschritte.
  • Vielseitige Anwendungen: Dazu gehören Funktionen wie selektive Charakterbearbeitung, virtuelle Anproben, das Kombinieren mehrerer Charaktere und die identitätserhaltende Bearbeitung. Sogar die Nutzung von bis zu drei Referenzbildern gleichzeitig ist möglich.

 

Bildbearbeitung nur durch einen Prompt, keine Bearbeitungsschritte notwendig

Technische Details:

  • Architektur: Das Modell kombiniert Microsoft's Phi 3 Large Language Models mit SDXL VAE, was den Einsatz komplexerer Setups wie ControlNet oder IP-Adapter überflüssig macht.
  • Verfügbarkeit: OmniGen AI ist unter der MIT-Lizenz Open Source und kann über Plattformen wie GitHub und Hugging Face bezogen werden. Die Implementierung ist auch in ComfyUI möglich.

 

Ziemlich beeindruckend. Quelle: Omnigen

Ausblick: Die Entwickler arbeiten kontinuierlich an der Verbesserung des Modells, mit dem Ziel, den Bildgenerierungsprozess weiter zu vereinfachen – ähnlich wie GPT in der Textgenerierung. OmniGen AI könnte somit eine Basis für zukünftige universelle Modelle im Bereich der Bildbearbeitung sein.

Das waren die aktuellen Entwicklungen der Woche. Diese Neuerungen bieten spannende Optionen, werfen aber auch Fragen zu ihrer praktischen Anwendung auf.

Bis zum nächsten Mal, Dein AI TRIBE-Team