Hand aufs Herz: Wer schreibt heute noch seitenlange Anweisungen für GPT-4 oder Claude? Vor einem Jahr galt „Prompt Engineering“ noch als die entscheidende Fähigkeit im Umgang mit KI. Heute stelle ich fest: Bei den großen Modellen ist weniger oft einfach mehr.
Die Großen verstehen dich auch so
Egal ob im Browser-Chat oder in der IDE mit GitHub Copilot, die großen LLMs sind mittlerweile so gut darin, die Absichten zu erraten, dass komplexes Prompting oft Zeitverschwendung ist. Ein kurzer Satz liefert meist das gleiche Ergebnis wie ein durchoptimierter Absatz.
In vergangenen Chats mit ChatGPT, Gemini, Claude und co. viel mir auf, wer zu viel Promptet, provoziert oftmals eher unnötig lange Antworten, als das Ergebis zu verbessen. Mein Learning: Wer heute noch „Du bist ein Senior Developer...“ vor jeden Prompt klatscht, arbeitet gegen die aktuelle Effizienz der Modelle. Diese liefern auch ohne langes Prompting gute Texte und brauchbaren Code.
Der direkte Vergleich
- Kurzer Prompt: „Schreib mir eine Python-Funktion, die eine CSV einliest und Duplikate entfernt. Nur Code.“
Ergebnis: Sauberer Code mit Pandas Integration 
- Ausführlicher Prompt: „Du bist Senior Python Developer. Schreibe eine robuste Funktion, die eine CSV-Datei via Pandas einliest und Duplikate entfernt. Anforderungen: Type-Hints, Error-Handling (FileNotFound) und strikte PEP8-Konformität. Antworte nur mit dem Code-Block.“
Ergebnis: Der Code ist fast identisch. Zwar ist das Error-Handling durch die explizite Nachfrage dabei, aber das Modell fügt sogar Kommentare hinzu, nach denen gar nicht gefragt wurde.
Überraschung bei lokalen Modellen
Bisher galt allgemein, wenn man LLMs lokal auf dem eigenen Rechner nutzt (z. B. via LM Studio), muss man sehr präzise prompten. Modellen unter 10 Milliarden Parametern wurde oft nachgesagt, dass sie ohne klare Struktur schnell halluzinieren oder unbrauchbaren Output liefern.
Doch meine aktuelle Erfahrung zeigt ein anderes Bild: Selbst diese kleinen Modelle sind mittlerweile erstaunlich stabil.
Hier habe ich ein Experiment mit einen Ministral 3B (3 Milliarden Parameter) getestet. Dieses lief mit LM Studio lokal auf meinem Laptop, gepowert mit 3GB RAM.

Dass ein lokales Modell mit 'nur' 3 Milliarden Parametern eine Aufgabe wie „Extrahiere Datum, Ort und Preis als JSON“ ohne spezielles Framework oder seitenweise Instruktionen fehlerfrei löst, zeigt, wie weit die Entwicklung ist. Die „Mitdenk-Kapazität“ ist nicht mehr nur den Giganten in der Cloud vorbehalten.
Um den Unterschied der Modelle zu verduetlichen, möchte ich betonen, dass die aktuellen großen Cloud Modelle wie ChatGPT 5 oder Gemini 3 schätzungsweise 1-2 Billionen Parameter haben, im Vergleich zu dem lokalen Ministral mit 3 Milliarden.
Mein Fazit
Prompt Engineering ist nicht tot, aber es ist „nischiger“ geworden. Für den Alltag reicht meistens gesunder Menschenverstand und eine klare Ansage. Wer das Maximum aus lokaler Hardware herausholen will, sollte die Basics zwar noch beherrschen, aber die Notwendigkeit für komplexe „Befehlsketten“ wird immer weniger.
https://ppedv.de/Schulung/Kurse/PromptEngineeringAnwenderSeminarKIAusbildung