Multi-Agents in Copilot Studio – Ein Praxisbeispiel

Um die Leistungsfähigkeit von Multi-Agenten-Systemen zu veranschaulichen, betrachten wir einen einfachen Reiseplanungs-Assistenten, der in Microsoft Copilot Studio erstellt wurde. Die Multi-Agent Steuerung spielt hierbei die entscheidende Rolle. Dieser Reiseassistent besteht aus zwei Hauptagenten und einem untergeordneten Agenten.

Ausgangslage:

1. Orchestrierungs-Agent: Der Hauptagent, der die Anfrage des Benutzers entgegennimmt und die Aufgaben an die spezialisierten Agenten delegiert.

2. Flugbuchungs-Agent: Spezialisiert auf die Suche und Buchung von Flügen. Wobei dieser Agent ein untergeordneter Agent ist, der nur innerhalb des Reiseassistent Agent ausgeführt wird, sofern er benötigt wird.

3. Hotelbuchungs-Agent: Spezialisiert auf die Suche und Buchung von Hotels.

Prämissen:

Der Agent ist darauf ausgelegt, dass er per Konversation, also Aufgabengebunden gestartet wird, sobald ein Benutzer den Chat beginnt.

Die Multiagent-Steuerung ist darauf ausgelegt, dass die Agents untereinander die Kommunikationsprozesse autonom steuern und den Benutzer bei der Reiseplanung optimal unterstützen. Der Reiseassistent beginnt die Konversation, gibt Auskunft in puncto Einhaltung der „Firmenrichtlinie“, übergibt eigenständig die weiteren Anfragen des Benutzers bezüglich der Hotelbuchung an den „Hotel suchen Agent“ weiter, und unterstützt ebenso bei der suche nach einem passenden Flug, indem diese Anfrage automatisch an den „Flugbuchung Agent“ erfolgt.

Die Agenten sind so eingerichtet, dass sie miteinander kooperieren und alle wichtigen Informationen vom Benutzer anfordern, um passende Antworten zu liefern.

Damit die Multi-Agent Erfahrung funktionieren kann, ist es erforderlich, dass die Orchestrierung eingeschaltet wird. Damit wird sichergestellt, dass der Agent die besten Tool, Kenntnisse und anderen Agents auswählen kann, um auf Benutzerabfragen oder Ereignistrigger zu reagieren. Anderenfalls reagiert der Agent nur in der klassischen Weise, d.h. er löst das Thema aus, das den Triggerphrasen am ehesten entsprechen.

Die im Agent verwendeten Komponenten sind:

Ein Bild, das Text, Screenshot, Schrift enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Reiseassistent erhält nachfolgende Anweisungen:

Ein Bild, das Text, Schrift, Screenshot, Dokument enthält.

KI-generierte Inhalte können fehlerhaft sein.

Die Anweisungen sind extrem wichtig, damit die Prozesse und Schritte funktionieren. Hier und da ist sicher noch Optimierungsbedarf. Aber die Anweisungen funktionieren im ersten Anlauf ziemlich gut.

Weitere eingebundene Wissensquellen:

Ein Bild, das Text, Schrift, Software, Screenshot enthält.

KI-generierte Inhalte können fehlerhaft sein.

Weiterhin wird dem Agent erlaubt, alle öffentlichen Websites zu durchsuchen.

Im Abschnitt Tools habe ich nicht s verwendet, das ist das besondere hierbei! In anderen Agenten wird hier bspw. Mit unterschiedlichsten Konnektoren der Agent ergänzt, um die Funktionsweise und die Arbeitsschritte konkret zu bestimmen.

Ein Bild, das Text, Screenshot, Schrift enthält.

KI-generierte Inhalte können fehlerhaft sein.

Die Auswahl der Tools ist beeindruckend vielfältig, in einem anderen Beispiel werde ich noch zukünftige Szenarien im Einsatz zeigen.

Ein Bild, das Text, Screenshot, Schrift, Zahl enthält.

KI-generierte Inhalte können fehlerhaft sein.

Unter Abschnitt „Trigger“ befindet sich in dem speziellen Fall ebenso nichts weiter.

Ein Bild, das Text, Screenshot, Schrift, Reihe enthält.

KI-generierte Inhalte können fehlerhaft sein.

Üblicherweise ist hier zu definieren, auf welche Weise der Agent reagiert, also gestartet bzw. ausgelöst wird.

Ein Bild, das Text, Screenshot, Schrift, Zahl enthält.

KI-generierte Inhalte können fehlerhaft sein.

Im Abschnitt „Agents“ befinden sich der „Flugbuchung Agent“ und der „Hotel suchen Agent“. Diese beiden unterstützen den gesamten Workflow der die Schritte und Interaktionen bestimmt.

Ein Bild, das Text, Screenshot, Schrift, Algebra enthält.

KI-generierte Inhalte können fehlerhaft sein.

Hier ist noch anzumerken, dass es zwei interessante Ansätze gibt einen oder mehrere Agents hinzuzufügen. Wahlweise einen einfachen Agent innerhalb des aktuellen Agent, damit ein komplexe Logik entstehen kann, jedoch die Aufgaben besser strukturiert und runtergebrochen werden können. Ansonsten die Variante „Einen vorhandenen Agent verbinden“ auszuwählen.

Ein Bild, das Text, Screenshot, Betriebssystem, Software enthält.

KI-generierte Inhalte können fehlerhaft sein.

Wenn ein vorhandener Agent ausgewählt wird, ist dieser somit sowohl eigenständig verfügbar in anderen Szenarien der Arbeit verfügbar, als auch in dem hier vorgestellten Workflow. Der einfache Agent dagegen kann ausschließlich im Kontext des aktuellen Agents laufen, jedoch nicht eigenständig.

Im Abschnitt Themen habe ich im vorliegenden Beispiel keine eigens vorgegebene Unterhaltungsthemen integriert, da die Absicht darin besteht, dass die Agenten KI gesteuert selbst entscheiden wie verfahren werden soll, welche Fragen in welcher Reihenfolge bspw. gestellt werden.

Ein Bild, das Text, Screenshot, Schrift, Algebra enthält.

KI-generierte Inhalte können fehlerhaft sein.

Im Abschnitt „Vorgeschlagene Eingabeaufforderungen“ sind weiterhin keine Vorschläge enthalten.

Ein Bild, das Text, Screenshot, Schrift enthält.

KI-generierte Inhalte können fehlerhaft sein.

Bevor der Agent mit den anderen Agenten erfolgreich kommunizieren kann, muss noch über die „Einstellungen“ unter dem Menüpunkt „“Generative KI“, siehe Screenshot, die Orchestrierung auf eingestellt werden, idealerweise die „Tiefergehende Begründung“ eingeschaltet sein, unter dem „Verbundene Agents“ der Schalter eingeschaltet, damit die Agents untereinander zusammenarbeiten.

Ein Bild, das Text, Screenshot, Schrift, Zahl enthält.

KI-generierte Inhalte können fehlerhaft sein.

Unter dem Reiter Wissen, ist „Informationen aus dem Web verwenden“ ebenso einzuschalten.

Ein Bild, das Text, Screenshot, Schrift, Reihe enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Ablauf der Arbeitsweise des Reiseassistent-Agent:

Ein Bild, das Text, Schrift, weiß, Screenshot enthält.

KI-generierte Inhalte können fehlerhaft sein.

Benutzeranfrage: Der Benutzer sagt:

„Firmenrichtlinie Hotel“

Agent gibt folgende Antwort zurück:

Benutzer fragt: „Ich plane eine Reise für 2 Tage nach London, kannst du mich dabei unterstützen?“

Der Agent antwortet:

Ein Bild, das Text, Schrift, Brief, Papier enthält.

KI-generierte Inhalte können fehlerhaft sein.

Nächste Frage vom Benutzer: „Ich benötige einen Flug, kannst du mir dabei helfen?“

Der Agent antwortet:

Ein Bild, das Text, Schrift, weiß, Algebra enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Benutzer gibt Daten ein:

„Abflug 26.06 bis 29.06, von Berlin/Brandenburg aus nach London“

Der Agent antwortet:

Ein Bild, das Text, Screenshot, Schrift enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Benutzer fragt: „Bitte helfe mir bei der Auswahl eines Hotels“

Der Agent antwortet:

Ein Bild, das Text, Schrift, Karte Menü, Dokument enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Benutzer fragt: „Welche Hotels stimmen mit unseren Firmenrichtlinien überein?“

Der Agent antwortet:

Ein Bild, das Text, Screenshot, Schrift, Dokument enthält.

KI-generierte Inhalte können fehlerhaft sein.

Der Benutzer gibt ein: „Vielen Dank für die Unterstützung“

Der Agent Antwortet:

Unter dem Reiter „Aktivität“ ist zu sehen, wie der Agent arbeitet und welcher weiterer Agenten er sich je Gesprächsverlauf bedient hatte.

Ein Bild, das Text, Screenshot, Schrift, Zahl enthält.

KI-generierte Inhalte können fehlerhaft sein.

Ein Bild, das Text, Screenshot, Schrift, Zahl enthält.

KI-generierte Inhalte können fehlerhaft sein.

Zusammengefasst:

Die Agenten arbeiten erfolgreich zusammen, aber auch einzeln. Das ist wirklich beeindruckend!

Der Orchestrierungs-Agent: Empfängt die Anfrage und erkennt, dass sowohl ein Flug als auch ein Hotel benötigt werden. Er delegiert die Flugsuche an den Flugbuchungs-Agenten und die Hotelsuche an den Hotelbuchungs-Agenten.

Der Flugbuchungs-Agent: Sucht nach verfügbaren Flügen von Berlin nach z.B. London und gibt die besten Optionen zurück.

Der Hotelbuchungs-Agent: Sucht nach Hotels in London für 2 Nächte und gibt passende Vorschläge zurück.

Der Orchestrierungs-Agent: Sammelt die Ergebnisse beider Agenten und präsentiert dem Benutzer eine konsolidierte Liste von Flug- und Hoteloptionen. Der Benutzer kann dann seine Auswahl treffen und die Buchung abschließen.

Dieses Beispiel zeigt, wie Multi-Agenten-Systeme komplexe Anfragen in kleinere, handhabbare Aufgaben zerlegen und spezialisierte Agenten nutzen können, um effizient und präzise Ergebnisse zu liefern.

Kommentare sind geschlossen