Prompt – Token – Antwort

Wie genau wird ein Prompt bei einem Chat AI Bot auseinander genommen und die Antwort erzeugt? Also Tokenizen der Anfrage, einen Binärbaum aufbauen mit den Wahrscheinlichkeiten für die entsprechenden Äste auf Grundlage der Daten des LLM.

Ein Prompt bei einem Chat AI Bot wird in mehreren Schritten verarbeitet, die auf den Prinzipien der natürlichen Sprachverarbeitung (NLP) und maschinellen Lernens basieren. Zunächst wird die Anfrage tokenisiert und anschließend von einem großen Sprachmodell (LLM) analysiert, das auf Wahrscheinlichkeiten für mögliche Antwort-Token basiert. Ein expliziter Binärbaum wird dabei jedoch nicht gebaut, sondern die Wahrscheinlichkeitsverteilung für die nächsten Token fortlaufend berechnet und meist als „Logits“ vorliegen.

Tokenisierung des Prompts

Nach Eingang des Prompts zerlegt das Modell den Text in sogenannte Token, was Wortteile, ganze Wörter oder auch Satzzeichen umfassen kann. Die Tokenisierung ist abhängig vom verwendeten Modell und dessen Vokabular. Moderne LLMs nutzen meist das Byte Pair Encoding (BPE) oder ähnliche Verfahren, um den Text möglichst effizient in Token abzubilden.

Wahrscheinlichkeitsberechnung der nächsten Token

Das Modell verarbeitet die Token sequenziell und berechnet für jedes mögliche nächste Token die Wahrscheinlichkeit, basierend auf den trainierten Daten und Kontextinformationen. Das Ergebnis ist eine Verteilung aller möglichen nächsten Token (die sogenannten „Logits“).

Entscheidungsprozess und Baummetapher

Statt eines ausdrücklich konstruierten Binärbaums entsteht eher ein „Pfad“ durch den Tokenraum:
– Für jeden Schritt (Token) entscheidet das Modell anhand seiner Wahrscheinlichkeitsverteilung, welches Token als nächstes gewählt wird.
– Der Prozess kann als „Baumerzeugung“ interpretiert werden, da aus jedem Zustand (Token) verschiedene mögliche Fortsetzungen („Äste“) mit jeweils einer Wahrscheinlichkeit entstehen.
– In der Praxis bleiben viele Äste unberücksichtigt, da Algorithmen wie Greedy Search oder Sampling nur die wahrscheinlichsten Varianten verfolgen.

Aufbau der Antwort

Die Antwort entsteht durch wiederholte Auswahl des wahrscheinlichsten oder eines mittels Sampling gewählten nächsten Tokens, bis ein Stoppkriterium erreicht ist (z.B. ein End-Token oder eine max. Länge).
Im Hintergrund liegt mathematisch für jeden Schritt die Berechnung:
Wahrscheinlichkeitsformel für Berechnung der Tokenwahrscheinlichkeit.
Diese Konditionalwahrscheinlichkeit wird für jedes Token berechnet und steuert die Antworterzeugung.

Fazit

Im Kern besteht der Ablauf aus:
– Tokenisierung,
– sequenzieller Wahrscheinlichkeitsberechnung,
– Auswahl des nächsten Tokens (als würde man einen Pfad im Baum entlanggehen),
– Wiederholung bis zur fertigen Antwort – aber der Baum wird nicht als vollständige Struktur aufgebaut, sondern Schritt für Schritt erzeugt.

Jeder dieser Schritte ist darauf optimiert, mit dem trainierten Modell schnelle und plausible Antworten zu generieren.

Quellen
– [Funktionsweise von ChatGPT und Tokenisierung](https://www.faz.net/aktuell/wissen/technik/die-kerntechnologie-von-chatgpt-wie-sprachmodelle-arbeiten-18594303.html)
– [Tokenisierung in modernen LLMs (BPE-Verfahren)](https://towardsdatascience.com/tokenization-in-nlp-29e410f8a502)
– [Textgenerierung und Entscheidungsprozesse in Sprachmodellen](https://ai.stackexchange.com/questions/36487/how-do-language-models-generate-text)

 

Zu beachten:

Ki ist mein Namenskurzzeichen und steht nicht für künstliche Intelligenz.

Wie immer gilt es zu beachten: KI-Systeme irren und fabulieren gerne. Einschalten des gesunden Menschenverstandes ist keine Option, sondern wird streng erwartet!

Hier wurde Perplexity genutzt.
Ukrainische Flagge

AWS Gamesday

Großdisplay mit AWS Ganedays Startfolie.
Werner Vogels, CTO Anazon: We allow teams to just do a lot of things themselves, even if that duplicates some functionality. We're willing to exchange that for moving fast.
The tipical developer spends 4h 21min coding...per week. That is 52 min per day.
A true unicorn success story - mit den fiktiven Geschäftszahlen des Unternehmens.
Das Großdisplay mit einigen Hinweisen zum Spiel.
Da hat doch meine Company einen AWS Gamesday diese Woche im KCH veranstaltet. Der mit den weißen Esquinzo-Shirt auf der Bühne, bin ich. Ich dachte mir mit „Zeit für Gefühle“ etwas Esprit in die MINTi-Riege der Anwendungsentwicklung zu bringen. 😉

Es waren zwei sehr gelungen Tage, die viel Spaß machten, wenn auch das Lernen bei mir auch anstrengend war. Das soll aber eben auch aus didaktischen Gründen so sein. Dafür hatte ich Mitstreiter, die meine Schwächen ausglichen zu vollem Teamerfolg.
Ukrainische Flagge

Das Scrum Guide Expansion Pack

Englische Webseite des Scrum Guide Expansion Pack mit den drei Autoren als Comic-Portrait.
© ScrumExpansion.org

Der aktuelle Scrum Guide kam 2020 heraus. Es lag in der Luft, dass ein neuer Scrum Guide – nach 5 Jahren – das Licht der Welt erblicken könnte.

Es kam das Expansion Pack, das durchaus realitätsnahe Erweiterungen beschreibt. Auf den 50 Seiten werden diese Modelle, Impulse und vertiefenden Gedanken dargeboten. 

Da es seit gut einem Monat durch die kleine agile Gemeinde wandert, kam es auch zu mir. Ich hörte mir dazu Marc Löfflers Einschätzung in seiner Agile Transformation Toolbox an. Angehört, das Service Pack Expansion Pack wurde abgewatscht. Fall erledigt, bedarf keiner weiteren Betrachtung. So dachte ich, ohne mir überhaupt die Mühe gemacht zu haben, das Dokument wirklich einmal anzuschauen, geschweige denn, es zu lesen. 

Logo von DasScrumTeam Cafe
© DasScrumTeam

Nachdem ich im mal wieder im DasScrumTeam Café war und das Thema auf das Expansion Pack legte mit dem Verweis auf den ordentlich Verriß von Marc Löffler, sagte Andy etwas dazu. In seiner ganz eigenen Art sprach er unaufgeregt und sachlich. Erwähnte kurz, dass er – mal wieder – zur deutschen Übersetzung beisteuerte und ging dann exemplarisch durch das Expansion Pack. Detailliert und auf den Punkt gebracht sprach der darüber und mir war es ehrlicher Weise etwas unangenehm, dass ich so in Yellow Press Manier darüber hergezogen hatte, was er mit keiner Silbe quittierte, sondern einfach nur den Inhalt besprach. Dabei erwähne er kurz das KI-Kapitel von Jeff und meinte nur trocken, dass das gerne übersprungen werden kann. Es ist eine halbe Seite und kommt direkt nach Supporter/Unterstützer. Zusammengepresst in einen Satz: Viel möglich, viele Gefahren. Meine Erfahrungen u.a. bei „The scientific background of Scrum and how to leverage AI in Scrum“ mit Jeff und seinen KI-Ideen geht auch in diese Richtung von Andy. 

Den eigentlich Schatz, den Andy ansprach, sind weniger die 50 Seiten des Dokuments. Sie teasern eher Themen an und hier ist Marc Löfflers Einwand auch korrekt, dass das mehr ein Andeuten von Themen ist ohne den Tiefgang. Allerdings beklagt er die 50 Seiten des Dokumentes. Mehr Tiefgang bedeutet dann zwangsläufig auch mehr Seiten, so dass  die Erweiterung dann schon ein volles Buch ausfüllten (was es natürlich auch gab und gibt). Ein echter Schatz des Dokumentes sind die 149 Referenzen (6 Seiten) zu weiterführenden Quellen im Anhang. Das ist ein geballter digitaler Hub ins Wissen. Solche potenten Hubs sind selten.

Ich habe nun begonnen, das Scrum Guide Expansion Pack zu lesen. Dabei nutze ich die Online-Version in der deutschen Übersetzung (noch im Preview-Statium) als auch das englische PDF und Webseite. Ganz klar machen die drei Autoren eingangs deutlich, dass dieses Erweiterungspaket den Scrum Guide mitnichten ersetzt. Keine weiteren Scrum Regeln hinzuzufügt, sondern das Ganze ein klein wenig „runder“ und vielleicht auch „geländegängiger“ machen möchte. 

Diese realitätsnahen Erweiterungen sind etwa:

  • die neuen Rollen Stakeholder und Supporter (Unterstützer).
    Hier ist beim Supporter die Abgrenzung zum Stakeholder durchaus unscharf, denn der Supporter ist eine Teilmenge des Stakeholders. Er stößt Veränderungen für das Team an, ist also quasi Change Agent. Die Frage nach der Unterscheidung von Supporten und Stakeholder stellt sich, denn gerade Scrum hat sich – was Rollenvielfalt angeht – immer sehr zurückgehalten. Der Stakeholder ist im Sinne einer Betrachtung auch außerhalb des Scrum-Teams sinnvoll, denn Stakeholdermanagement gehörte nicht wirklich zu Scrum dazu.
    „Unterstützer sind eine bestimmte Art von Stakeholdern. Unterstützer sind Stakeholder und Change Agents.“
    Scrum Guide Expansion Pack, Kapitel Unterstützer – deutsche Übersetzung • © 2025 Ralph Jocham, John Coleman, and Jeff Sutherland. • CC BY-SA 4.0
  • klar gesagt, dass das Scrum-Team für die Product Discovery verantwortlich ist
    Bei der Entdeckung geht es darum, durch Priorisierung, Umsetzung, Vermeidung oder ständige Verbesserung von Ideen, die auf Benutzerbeobachtungen, Feedback oder anderen Erkenntnissen basieren, zu einem gewünschten Ergebnis zu gelangen. Die Entdeckung betont Zusammenarbeit, Kreativität und die Bereitschaft, Fehler zu machen und es erneut zu versuchen. Die Entdeckung fasst die Arbeit als Probleme oder Chancen zusammen und hilft dem Scrum Team, Lösungsoptionen zu entwickeln, zu priorisieren und zu testen, die die Wünsche der Menschen, die technischen Möglichkeiten und die geschäftliche Sinnhaftigkeit in Einklang bringen – und das alles mit Spaß.“
    Scrum Guide Expansion Pack, Kapitel Entdeckung (Discovery) – deutsche Übersetzung • © 2025 Ralph Jocham, John Coleman, and Jeff Sutherland. • CC BY-SA 4.0
  • deutlicher Fokus auf Outcome (was kommt raus und nützt dem Business – also Qualität) anstelle nur Output (was kommt raus – also Quantität)

Mich hat das dieses Erweitungspaket neugierig gemacht. Klar, es erklärt nicht in einer epochalen Tiefgangart all das, was viele meinen, Scrum ausmachen sollte. Es wird eher im leichten Telegrammstil angerissen, aufgezeigt und immer in Hinterkopf: Der wirklich beachtliche digitale Hub mit den Absprunglinks zu viel geballtem Wissen.

Eine lohnende Betrachtung des Expansion Pack kann man bei den Produktwerkern hören.

Der Scrum Guide Expansion Pack ist unter einer CC-BY-SA 4.0 Lizenz veröffentlicht.

Ich habe meine eingangs erwähnte Einstellung deutlich geändert. Vom Spötter mit Sekundärwissen, aber ohne die Primärquelle auch nur besehen zu haben, bin hin immerhin schon zu einem Stadium gekommen, dass ich dieses Thema partiell deutlich, aber in gänze noch nicht vollständig gelesen habe. Hierzu bedurfte es nicht einer Berichtigung oder gar Belehrung durch Andreas Schliep, sondern lediglich des Einsatzes eines alten, aber sehr nützlichen Patterns. Hier zeigt sich für mich, dass ich auch nach Jahren noch sehr viele von ihm lernen kann.

„Wenn Du ein Schiff bauen willst, dann trommle nicht Männer zusammen, um Holz zu beschaffen, Aufgaben zu vergeben und die Arbeit einzuteilen. Sondern lehre sie die Sehnsucht nach dem weiten, endlosen Meer.“

– Antoine de Saint-Exupéry

Zu den Autoren:

  • Jeff Sutherland ist Mitbegründer von Scrum und arbeitet als Berater für dieses Vorgehensmodell mit seiner Firma Scrum Inc.
  • John Coleman kommt aus dem Kaban-Bereich und ist Mitgründer von Kanplexity ein innovativer Ansatz, der Elemente des Kanban-Systems mit dem Cynefin-Framework kombiniert.
  • Ralph Jocham ist einer der frühen Scrum-Trainer in Europa und Gründer von effective agile.

Ukrainische Flagge

New Dark Pattern: Dust Bin Coding with AI

Wer es vielleicht schon immer geahnt hat oder selbst erlebte:

Die Studie „Coding on Copilot“ von GitClear legt nahe, dass die Code-Qualität bei Verwendung von GitHub Copilot oder ChatGPT sinkt, da Entwicklerinnen und Entwickler mit den KI-Assistenten schnelle, aber nicht unbedingt gute und nachhaltige Lösungen beim Coden vorgeschlagen bekommen.

Schlechte Code-Qualität durch die KI-Assistenten GitHub Copilot und ChatGPT | heise online

Dass ChatGPT sich mir als Schwätzer, Lügner und Schlechtcoder vorstellte, ist hier oder hier bereits verewigt.
Ukrainische Flagge

In Gedenken an Niklaus Wirth

Portrait Niklaus Wirth (2005)Niklaus Wirth (2005), Tyomitch • Copyrighted free use

Meine Gdanken zum Tode Niklaus Wirth beim Schockellenreiter.
Wie ich eben beim geschätzten Schockwellenreiter las, ist Niklaus Wirth am 1. Januar 2024 im Alter von 89 Jahren verstorben. Meine Gedanken dort im Blog des Schockwellenreiters zu Wirth und wie er mir in Form seiner Programmiersprachen immer wieder begegnete. Es kommt eben nicht von ungefähr, dass Wirth 1984 den Turing Award verliehen bekam.

Die Tickermeldung von Heise und ein Interview von ihm mit dem MIT Technology Review von 2016.
Ukrainische Flagge

Ein wenig Qualität reinbringen

Statische Codeanalyse Tool SonarQube im Einsatz.
Der Screen zeigt eine erste demohafte HTML-Seite, die auch nix mit dem Blog zu tun hat, aber die eben auch gerne um Fehler, Smells, etc. bereingt werden möchte. SonarQube will ich dann partiell fürs Blog und andere Seiten als Quality Gate einsetzen. Da ich es nicht bei meinem Webkrauter einsetzen kann, das liegt daran, dass es eben nur Hosting und kein Blech ist und mir so Dinge wie sudo fehlen. Dafür kann ich aber lokal dann etwas machen, wenn ich mag. Der Scharm in den Jenkins-Bau das einzubinden geht natürlich nicht, da auch Jenkins nur lokal läuft.
Ukrainische Flagge