Herzlich Willkommen zu den AI FIRST Insights!
DeepSeek hat viel Schwung in die KI-Welt gebracht, mal wieder.
Was wir gerade erleben, ist eine konsequente Beschleunigung von höherer Qualität, geringeren Kosten und neuen Fähigkeiten von Sprachmodellen.
Diese 3 Entwicklungen solltest du jetzt auf dem Schirm haben:
- Reasoning: Die Fähigkeit von Sprachmodellen, eine Aufgabe in mehrere Schritte zu zerlegen und einen Gedankenprozess zu simulieren, der zu einer höheren Ergebnisqualität führt.
- Multimodalität: Die Verarbeitung von Text, Bild, Audio, Video und Datei-Formaten. Verstärkt in Echtzeit.
- Agentische Fähigkeiten: das Planen von Aufgaben, die Bedienung des Browsers und die mehrschrittige Recherche.
Mit der Weiterentwicklung dieser Fähigkeiten werden Sprachmodelle in Bürojobs immer mehr Aufgaben unterstützen oder übernehmen und steigern zunehmend das Level an Automatisierung. Also höchste Zeit, dass wir uns damit intensiv beschäftigen!
Ein Aufgabengebiet, das kürzlich in den Fokus von Sprachmodell-Anbietern gerückt ist, ist die Recherche.
Mit den neuen Deep Research Features, bringen OpenAI & Co. 2 relevante Neuerungen zusammen: Agenten & Reasoning.
Heute lernst du, wie du diese Fähigkeiten für deine Recherchen einsetzt.
Los geht's!
Was sind die Deep Research Features?
Definition
Deep Research Features bezeichnen die Fähigkeit von KI-Chatbots, komplexe Suchanfragen zu verstehen, in mehrere Rechercheaufgaben runterzubrechen, eigenständig im Internet zu recherchieren und die Ergebnisse strukturiert zu konsolidieren. Anstatt nur Links zu Webseiten aufzulisten – wie es herkömmliche Suchmaschinen tun – analysieren die Systeme die Informationen, synthetisieren sie und liefern dem Nutzer eine umfassende Antwort in Form eines klar geschriebenen Berichts.
Anbieter
Diese KI Anbieter haben eine Deep Research Funktion integriert:
- Perplexity (Pro, 20€/Monat) -> Pro Suche mit R1 Modell starten
- ChatGPT (Pro, 200€/Monat) -> "Deep Research" Button im Chat anklicken
- Gemini (Advanced, 20€/Monat) -> "1.5 Pro with Deep Research" Modell wählen
Die Deep Research Funktion benötigt sehr viel Rechenkapazität, was Kosten bei den Anbietern verursacht. Daher ist diese Funktion aktuell nur in den Bezahl-Accounts verfügbar. In der Vergangenheit wurden solche Features mit der Zeit jedoch auch auf die günstigeren Lizenzen oder sogar kostenlosen Accounts ausgerollt.
Funktionsweise
Die Tiefenrecherche läuft immer in 4 Schritten ab, wobei sich die Anbieter leicht unterscheiden. Dazu weiter unten mehr.
- Planung: Die KI verarbeitet die Recherche-Aufgabe und plant eigenständig den Suchprozess und die Suchabfragen.
- Informationssuche: Die KI durchforstet zahlreiche Quellen wie Artikel, Berichte und Studien und filtert Unwichtiges heraus. OpenAI nutzt dabei Web-Browsing-Funktionen, Gemini greift auf Google-Dienste zurück.
- Analyse: Anschließend „liest“ die KI alle gesammelten Texte, extrahiert wichtige Fakten, vergleicht Quellen und erkennt Widersprüche.
- Strukturierung und Aufbereitung: Zum Schluss werden die Erkenntnisse in einem klar gegliederten Bericht präsentiert, meist mit Einleitung, Hauptteil und Fazit. Wichtige Punkte (z. B. Pro/Contra) werden hervorgehoben, und Quellenangaben am Ende sorgen für Transparenz.
Wichtig: Auch mit quellenbasierter Recherche können Sprachmodelle halluzinieren. Es gilt wie immer, KI als Unterstützung und nicht als blinden Ersatz zu nutzen. Insbesondere bei kritischen Fakten gilt das Prinzip der Ergebniskontrolle.
Anwendungsfälle
Überall wo viele Quellen nach Informationen durchsucht werden und die Ergebnisse in ein strukturiertes Format gebracht werden müssen, kann Deep Research helfen.
- Themenrecherche: Erstellung eines strukturierten Berichts zu einem Thema, zB "Einführung in KI Agenten"
- Technologie- und Innovationsscouting: Identifikation aufstrebender Technologien (z. B. Quantencomputing, mRNA-Technologie) durch Analyse von Nachrichten, Blogbeiträgen und Patenten, sofern letztere öffentlich zugänglich sind.
- Trendanalyse: Ermittlung neuer Ernährungs- oder Lifestyle-Trends (z. B. Veganismus, Zero-Waste).
- Produktsuche und -vergleich: Umfassende Recherche zu E-Bikes, 3D-Druckern oder neuen Smart-Home-Systemen.
- News-Übersicht: Zusammenstellung und Konsolidierung der Meldungen zu einem Thema.
- Markt- und Wettbewerbsanalysen: Marktüberblick in Branche Medizintechnik in Deutschland, Stärken und Schwächen der Hauptwettbewerber, Kennzahlen, Produktportfolio, ...
- Wissenschaftliche Untersuchung: Zusammenstellung von frei verfügbaren Studien zum Thema „Auswirkungen der Luftverschmutzung auf die Gesundheit“.
Im Folgenden zeige ich Dir die Funktionsweise an 3 Beispielen mit drei unterschiedlichen Anbietern. Ich habe in allen Beispielen einfache Prompts genutzt, um zu verstehen, wie die Reasoning-Modelle daraus den Recherche-Prozess planen.
Beispiel 1 (Perplexity): Schnelle Marktanalyse
Ziel
Einen Überblick über einen bestimmten Markt oder Anbieter erhalten.
Prompt
Erstelle eine Übersicht der größten KI Sprachmodell-Anbieter inklusive Anzahl der Nutzer, Feature-Gegenüberstellung in Tabellenform, Funding und weiteren relevanten Informationen.
Prozess
Im Bereich Forschung siehst Du die Suchabfragen, die Perplexity vornimmt, um die Informationen zu sammeln. Im Bereich Überlegungen siehst Du wie das R1 Modell die Informationen verarbeitet, um das Ergebnis zu erstellen.
Auch beeindruckend: Insgesamt wurden 86 Quellen durchsucht.

Ergebnis
Zuerst wurde eine allgemeine Übersicht der Top LLM-Anbieter erstellt. Spannend finde ich, dass sehr sinnvolle Kriterien wie "Parameter" oder "Open Source?" ergänzt wurden.

Anschließend wurde noch eine Tabelle mit der Feature-Übersicht erstellt. Diese finde ich noch recht simpel, aber könnte durch einen präziseren Prompt erweitert werden. Außerdem sind die Ergebnisse nicht konsistent oder falsch: Claude 3.5 Sonnet wird zB stark in kreativen Funktionen und Marketing eingesetzt.

Beispiel 2 (Gemini): Themenrecherche zu Deep Research
Ziel
Ein Bericht über das Deep Research Feature von Google Gemini erstellen.
Prompt
Erstelle einen Bericht zum Deep Research Feature von Gemini mit folgenden Inhalten: Definition, Funktionsweise, Potenziale & Risiken, Alternative Anbieter, Anwendungsfälle in Wissensfunktionen.
Prozess
Gemini verarbeitet zuerst meine Anfrage, erstellt den Recherche-Plan inklusive der Suchabfragen und fragt mich nach Feedback. Ich habe jetzt die Möglichkeit, den Plan anzupassen oder die Recherche zu starten.

Basierend auf dem Recherche-Plan hat Gemini 22 Webseiten durchsucht.

Im letzten Schritt konsolidiert Gemini die Informationen aus den Websites und erstellt daraus einen Bericht. Dieser Schritt hat ungefähr 5 Minuten gedauert.
Ergebnis
Ich erhalte einen vollständigen Bericht in genau der vorgegebenen Struktur.

Den Text kann ich kopieren oder direkt als Google Doc öffnen. Hier siehst Du das Ergebnis.
Auffällig war bei diesem Beispiel, dass Gemini die Google-Quellen stark bevorzugt hat. Das kann natürlich an der Aufgabenstellung liegen, aber deutet auch auf einen Bias im Modell hin.
Beispiel 3 (ChatGPT): Trendrecherche zu AI Agents
Ziel
Einen Trendbericht zur Entwicklung von AI Agents und dem Einfluss auf Unternehmen.
Dieses Mal habe ich den Prompt etwas ausführlicher gestaltet und mehr Kontext- und Formatvorgaben hinzugefügt:
Prompt
Erstelle einen Trendbericht zur Entwicklung von KI Agenten. Die Zielgruppe sind Geschäftsführer in mittelständischen Unternehmen.
Gliedere den Bericht wie folgt:
- Executive Summary
- Einführung zu KI Agenten (Definition, Funktionsweise, ...)
- Entwicklung von KI Agenten (Historie, Status Quo, Zukunftsprognosen)
- Anwendungsfelder
- Chancen, Risiken und Handlungsempfehlungen
Kläre in deinem Bericht insbesondere folgende Fragen:
- Inwiefern sind KI Agenten schon bereit für den Einsatz im Mittelstand?
- Wie wirkt sich der Einsatz von KI Agenten auf die Produktivität von Unternehmen aus?
- Welche Grundlagen müssen geschaffen werden, um KI Agenten erfolgreich zu implementieren?
Beleuchte KI Agenten kritisch und führe Studien, Statistiken und Quellen von Vordenkern und Wissenschaftlern aus der KI-Industrie heran wie zB Andrew Ng
Prozess
ChatGPT stellt zuerst Rückfragen, um die Recherche zu verfeinern:

Nachdem ich die Fragen beantwortet habe, hat ChatGPT den Rechercheprozess gestartet. Die Recherche dauerte ungefähr 5 Minuten und umfasste 14 Quellen:

Die Quellenauswahl finde ich sehr ernüchternd. Es wurden fast ausschließlich Blogs herangezogen und kaum Studien-Ergebnisse oder Statistiken.
Spannend finde ich wiederum, wie man die Arbeitsschritte von ChatGPT live beobachten kann:

Ergebnis
Auch von ChatGPT erhalte ich einen Bericht, der mit 15 Seiten nochmal umfangreicher als das Ergebnis von Gemini ist. Ich habe das o1 Pro Modell verwendet, was die Qualität und Tiefe der Ergebnisse zusätzlich steigert.

Insgesamt überzeugt mich die Qualität, wenn ich einen Überblick über das Thema und die historischen Entwicklungen erhalten möchte. Erstaunlich gut finde ich den Schreibstil.
Was mir fehlt, sind konkrete Studien-Ergebnisse und Statistiken, die über allgemeine Prognosen auf Unternehmensberater-Blogs hinausgehen.
Auffällig ist, dass der Großteil der Informationen aus ein paar wenigen referenzierten Quellen kommt, obwohl insgesamt 14 Quellen durchsucht wurden. Hier kannst du das Ergebnis sehen.
Bonus: Präsentation mit Gamma erstellen
Recherchen sind oft die Grundlage für Präsentationen. Deshalb möchte ich Dir abschließend noch zeigen, wie Du die Deep Research Ergebnisse in fertige Folien verwandeln kannst.
Dafür habe ich das Tool Gamma genutzt und die Ergebnisse aus der ChatGPT Recherche eingefügt:

Gamma erstellt dann eine Struktur der Folien, die Texte, Bilder und Grafiken basierend auf dem eingefügten Text. Ich kann ein Template hinterlegen, welches für die Folien genutzt wird.
Der Vorteil dieses Workflows ist, dass wir bereits sehr detaillierte Informationen aus der Recherche haben. Diese führen automatisch auch zu konkreteren Inhalten auf den Folien.
So sieht das Ergebnis aus:

Hier kannst Du das vollständige Ergebnis sehen.
Insgesamt ein guter Aufschlag und Struktur, allerdings wurden die Informationen aus dem Bericht schon sehr stark verdichtet. Hier würde ich definitiv nacharbeiten und weitere Folien ergänzen.
🏁 Fazit
Für diesen Newsletter habe ich 5 Stunden mit den Deep Research Features gearbeitet.
Mein Fazit: Ich bin hin- und hergerissen.
✅ Ich kann deutlich schneller Informationen aus dutzenden Quellen in ein strukturiertes Format bringen.
✅ Mein Prompt wird in viele sinnvolle Suchabfragen und Recherche-Schritte zerlegt.
✅ Die Ergebnisse werden gut strukturiert und mit ansprechendem Schreibstil aufbereitet.
Aber...
❌ Falschinformationen in den Ergebnissen entdeckt.
❌ Quellenauswahl war zum Teil ernüchternd mit hohem Anteil von Blog-Artikeln.
❌ Erkennbarer Bias in der Bevorzugung von Quellen.
Ergo: Du kommst schneller ans Ziel und bekommst einen gut strukturierten Überblick zu deinem Recherche-Thema, darfst jedoch keinen perfekten Bericht auf Journalisten-Niveau erwarten.
Key Takeaways
- Deep Research Features bezeichnen die Fähigkeit von KI-Chatbots, komplexe Suchanfragen zu verstehen, in mehrere Rechercheaufgaben runterzubrechen, eigenständig im Internet zu recherchieren und die Ergebnisse strukturiert zu konsolidieren.
- Die perfekte Erweiterung der Recherche-Agenten sind Reasoning Modelle, weil sie aus den vielen unstrukturierten Informationen schlüssige Berichte erstellen.
- Reasoning-Modelle brechen einfache Prompts bereits gut in vielschrittige Suchabfragen runter. Für noch spezifischere Ergebnisse sollte mehr Kontext (zB Zielgruppe) und Format-Anforderung (zB Aufbau des Berichts) ergänzt werden.
- Perplexity durchsucht die meisten Quellen, hat jedoch den kürzesten Output und hat Fehlinformationen in den Ergebnissen angezeigt.
- ChatGPT mit dem o1 Pro Mode hat für mich das beste Ergebnis geliefert, ist aber nicht 10x den Preis von Gemini wert.
- Die Anwendungsfälle reichen von Themenrecherchen bis zu Marktanalysen mit einer deutlichen Beschleunigung für die Erstellung eines strukturierten Überblicks und Berichts zum Thema.
- Deep Research kommt mit Risiken: Bias in den Modellen und die Verführung, nicht mehr über Themen nachzudenken.
In den letzten 2 Jahren haben sich Sprachmodelle und die Funktionen drum herum rasant verbessert. Deep Research ist ein großer Schritt nach vorne zu den bisherigen, oberflächlichen Web-Suchen.
Die Ergebnisse stimmen mich zuversichtlich, dass KI in Zukunft eine immer größere Rolle in der Sammlung und Aufbereitung von Informationen spielen wird.
Hast Du Deep Research schon getestet?
Was sind Deine Erfahrungen?
Logge Dich ein oder registriere Dich,
um am Austausch teilzunehmen.