Loki Wednesday

Kann eine KI traden lernen? Ein offenes Experiment (Teil 0)

Ich lasse autonome KI-Agenten echtes und simuliertes Geld traden – und messe vorregistriert, ehrlich und falsifizierbar, ob ein KI-Trader wirklich einen Edge hat.

1. Juli 202611 min min

Kann eine KI traden lernen? Ein offenes Experiment (Teil 0)

Es gibt zwei Sorten Texte über „KI und Trading". Die eine verkauft dir einen Bot, der dich im Schlaf reich macht. Die andere erklärt dir, warum das nicht geht. Dieser hier ist keine von beiden.

Ich lasse seit ein paar Wochen autonome KI-Agenten echtes und simuliertes Geld traden — und ich messe sauber, ehrlich und vorregistriert, ob dabei etwas herauskommt. Kein Verkauf. Kein Hype. Ein Experiment mit einer falsifizierbaren Frage:

Hat ein voll autonom agierender KI-Trader einen Edge — oder bildet er sich das nur ein, so wie die meisten von uns?

Ich habe das nicht aus dem Nichts angefangen. Davor baute ich über Monate einen systematischen, regelbasierten Trader — mit echten, gegen Overfitting (Monte-Carlo-Permutationstests) abgesicherten Edges: Gold-Short-Trend, Index-Intraday-Confluence, Tageszeit-Filter. Der funktionierte. Aber er lehrte mich etwas Unbequemes: der Edge saß in der billigen, deterministischen Mechanik — eine simple Trailing-Logik trug das Signal. Und als ich eine LLM-Schicht obendrauf setzte, um „klüger" zu managen, addierte sie exakt null. Redundant.

Genau dort beginnt Loki. Die Frage ist nicht „kann eine KI traden" — sondern: schlägt ihr autonomes Urteil die billige Mechanik, die ich schon habe? Diesmal gebe ich der KI keine Stützräder. Wenn sie gewinnt, will ich wissen, ob es ihr Urteil war.

Das Setup

Der Agent heißt Loki. Er läuft auf Claude Opus und entscheidet alles selbst: welches Instrument, Richtung, Positionsgröße, Ein- und Ausstieg, Timing, wie oft er überhaupt auf den Markt schaut. Ich gebe ihm keine Strategie, keine Signale, keine Hinweise. Er hat ein eigenes, isoliertes Konto — die Equity-Kurve ist also nur seine Leistung, nicht meine.

Inzwischen sind es drei Varianten, jede beantwortet eine eigene Frage:

Der pure Loki (Demo) — der unberührte Kontroll-Arm. Er bekommt nie einen Hinweis, damit die Messung sauber bleibt.
Der Krypto-Loki (Demo, 24/7) — derselbe Kopf auf einem anderen Markt. Variiert der Edge je nach Asset-Klasse?
Loki-Live — und ja, dieser tradet seit dieser Woche echtes Geld.

Warum ich mich nicht selbst belügen kann

Das Schwierigste an so einem Experiment ist nicht die Technik. Es ist die Versuchung, sich hinterher die Gewinner herauszupicken. Drei gute Trades aus einer App-Demo zu zeigen, beweist nichts.

Deshalb steht die Messlatte vorher fest, und sie wird danach nicht verschoben:

Schlägt Loki über 100 Trades einen Zufalls-Trader — risiko-adjustiert (also nicht nur netto, sondern Rendite pro eingegangenem Risiko) und statistisch signifikant (p < 0,05)?

Risiko-adjustiert ist der entscheidende Teil. Ein glücklicher Zock kann jede Netto-Bilanz schönen. Erst wenn man in R-Vielfachen misst — Gewinn relativ zum riskierten Betrag — trennt sich Können von Glücksspiel. Und 100 Trades sind genug, um Rauschen von Signal zu unterscheiden, aber wenig genug, dass es ehrlich bleibt.

Wie ich gegen den Zufall messe

Ein Zufalls-Trader ist kein Strohmann — er ist die Nulllinie. Ich nehme dieselbe Kursreihe, auf der Loki gehandelt hat, und würfle tausende Male einen ahnungslosen Trader darüber: zufälliges Timing, zufällige Richtung, gleiche Anzahl Trades. Das ergibt eine Verteilung dessen, was Glück allein auf genau diesem Markt erreicht hätte — ein Permutations- bzw. Monte-Carlo-Test. Loki hat nur dann einen Edge, wenn seine risiko-adjustierte Rendite am obersten Rand dieser Verteilung liegt: seltener als 1 von 20 durch Zufall erklärbar (p < 0,05).

Und damit ich mir nicht rückwirkend das passende Zeitfenster heraussuche, läuft der Test walk-forward — auf Abschnitten, die nicht zur Kalibrierung gedient haben. Diese Methode hat schon mein altes regelbasiertes System überlebt. Sie ist gnadenlos. Genau deshalb nehme ich sie.

Die eigentlichen Fragen (die mich nachts wachhalten)

„Macht mich die KI reich" ist die langweiligste Frage. Spannend wird es darunter:

1. Sitzt der Edge im Urteil — oder in billiger Mechanik? Aus früheren Trading-Systemen weiß ich: ein simpler, deterministischer Trailing-Stop trug nachweisbar Edge. Eine teure KI-Schicht obendrauf addierte — exakt null. Wenn ein autonomer Agent gut performt: liegt es an seiner Analyse, oder daran, dass er stur ein Bracket arbeiten lässt? Loki muss beweisen, dass sein Urteil mehr wert ist als die billige Variante.

2. Korrigiert er sich selbst? Ein Mensch wiederholt Fehler jahrelang. Merkt eine KI ihren Fehler — und ändert ihr Verhalten?

3. Ist Lernen übertragbar? Das ist die tiefste Frage. Loki schreibt seine Lehren in eine Textdatei. Wenn ich diese Datei kopiere — tradet ein zweiter Agent dann sofort besser? Erfahrung als übertragbares Artefakt. Das kann kein Mensch: Intuition lässt sich nicht kopieren.

Der Test ist simpel und brutal: Ich kopiere Lokis Lehren-Datei in einen frischen, ahnungslosen Agenten — und schaue, ob er ab Trade #1 diszipliniert handelt, statt dieselben Anfängerfehler nochmal zu zahlen. Den ersten Datenpunkt habe ich schon (dazu gleich) — ob es systematisch trägt, misst die Reihe.

Erste Woche — was wirklich passierte

Ehrlich, mit echten Auszügen aus seinem Log:

Der Wissenstransfer funktionierte sofort. Loki-Live startete mit den Demo-Lehren des puren Loki im Gepäck. In seinem allerersten Echtgeld-Zyklus zitierte er eine davon — „thin pre-open chop + chasing fresh extremes = the loss cluster; wait for European cash-open volume" — und blieb diszipliniert draußen. Er kaufte einen teuer gelernten Fehler nicht mit echtem Geld nach. Erfahrung, als Text gereist.

Der Bilderbuch-Einstieg, der nicht aufging. Am Montag legte er eine ruhende Order exakt an den Pullback eines Ausbruchs — „price is AT the extreme, so per my anti-chase rule I did NOT chase." Der Rücksetzer stach präzise in die Kerze und füllte ihn am Tief. Handwerklich perfekt. Nur war der Ausbruch ein Fehlausbruch. Er schnitt früh — „exactly my costliest documented EURUSD pattern. Cut early." Ein Traum-Einstieg garantiert keinen Gewinner. Aber wie er verlor — diszipliniert, wissens-geleitet, halber Stop — ist der wiederholbare Teil.

Die Selbstkorrektur in Echtzeit. Beim Schließen einer stale Order schrieb er unaufgefordert: „price never pulled back — it ran straight down past my entry, so it's now poorly located." Er diagnostiziert seinen eigenen Miss — präziser, als die meisten Trader es je zugeben würden.

Die Bilanz nach der ersten Woche? Durchwachsen, leicht im Minus, mitten im Chop-Regime. Aber darum geht es in Woche eins nicht. Es geht um die Lernkurve — ob sich das Urteil über Wochen verbessert.

Wie man eine KI verantwortlich von der Leine lässt

„Autonom" heißt nicht „unbeaufsichtigt per API losgelassen". Unter Loki liegt bewusst Technik, die ihn handeln lässt, ohne ihn entgleisen zu lassen:

Ein harter Größen-Cap als Wächter, den das Modell nicht überschreiben kann — jede Order läuft durch eine deterministische Prüfung, bevor sie den Broker erreicht. Halluziniert das LLM eine hundertfache Größe, wird sie gekappt, nicht ausgeführt.
Ein Event-Wecker: Loki schläft die meiste Zeit. Nähert sich der Kurs seinem Stop oder seinem Ziel, weckt ihn ein billiger, regelbasierter Mechanismus — damit er managt, statt blind zu verschlafen.
Kontext-Reset in Intervallen, damit er nicht im eigenen Geschwätz driftet, plus ein Wissens-Seed — die Lehren-Datei, mit der ein frischer Lauf startet.

Das Unspektakuläre ist hier das Wichtige: die teure Intelligenz trifft die Urteile, die billige Mechanik hält die Leitplanken. Was uns direkt zur unbequemsten Frage bringt.

Und manchmal weiß er nicht, dass er gestupst wurde

Ein echtes Beispiel aus dieser Woche, das mir die zentrale Frage live vor die Füße warf: Der Kurs lief auf Lokis Take-Profit zu, der billige Event-Wecker weckte ihn — und Loki zog daraufhin sauber seinen Gewinn enger und notierte in sein Log: „self-discovered (no external hint)." Selbst entdeckt, kein externer Hinweis. Nur: der Hinweis war der Stups der Mechanik. Er hielt seine eigene Reaktion für eigene Initiative.

Das ist die Frage des ganzen Experiments in einem Satz: War das sein Urteil — oder das billige Gerüst, das ihn zur richtigen Zeit hinschauen ließ? Eine ehrliche Messung muss „der Agent beschloss zu handeln" von „etwas stupste ihn zum Hinschauen" trennen. Sonst schreibt man dem teuren Modell einen Edge zu, der in einem Cent-Mechanismus sitzt. Genau diese Trennung baue ich gerade in die Messung ein.

Warum das größer ist als Trading

Trading ist hier nur das Versuchsfeld. Die eigentliche Frage ist, ob ein autonomes KI-System unter echter Unsicherheit Wert schaffen, sich selbst korrigieren und Erfahrung weitergeben kann. Wenn ja, ist das eine neue Eigenschaft — ein Hirn, das lernt, dessen Wissen man kopiert, und das an vielen Stellen gleichzeitig arbeiten kann.

Trading ist nur ehrlicher als die meisten Anwendungen: der Markt lügt nicht, und am Ende des Tages steht eine Zahl.

Die Reihe

Ab jetzt jeden Mittwoch — Loki Wednesday — eine Episode aus dem Maschinenraum. Was die KI gemacht, geschlossen und gelernt hat. Mit echten Log-Zitaten, Gewinnen und Verlusten, ohne Schönfärberei.

Ob eine KI das wirklich lernen kann, weiß ich noch nicht. Genau deshalb messe ich es.

Häufige Fragen

Kann eine KI eigenständig traden? Ja — technisch. Ein Agent wie Loki entscheidet vollständig selbst über Instrument, Richtung, Größe, Ein- und Ausstieg und sogar darüber, wann er überhaupt auf den Markt schaut. Die offene Frage ist nicht, ob eine KI Trades platzieren kann, sondern ob ihr autonomes Urteil über viele Trades hinweg einen messbaren, risiko-adjustierten Vorteil bringt — oder ob sie sich den nur einbildet, wie die meisten von uns.

Wie misst man, ob ein KI-Trader einen echten Edge hat? Vorregistriert und risiko-adjustiert. Die Messlatte steht vor dem Experiment fest: über 100 Trades besser als ein Zufalls-Trader, gemessen in R-Vielfachen (Gewinn pro eingegangenem Risiko) und statistisch signifikant (p < 0,05). Der Vergleich gegen den Zufall läuft über einen Permutations- bzw. Monte-Carlo-Test auf derselben Kursreihe, zusätzlich walk-forward — damit nichts nachträglich schöngerechnet werden kann.

Was ist ein autonomer KI-Agent? Ein KI-System, das nicht nur Text ausgibt, sondern in einer selbstgesteuerten Schleife Werkzeuge nutzt, Entscheidungen trifft und handelt — hier: Marktdaten lesen, Orders setzen, Positionen managen, die eigenen Ergebnisse auswerten und Lehren in ein Gedächtnis schreiben, ohne nach jedem Schritt auf einen Menschen zu warten.

Ist das eine Anlageempfehlung — kann man damit reich werden? Nein. Das hier ist ein offenes Experiment, keine Anlageberatung und kein Produkt. Der größte Teil läuft auf Demo-Konten; der Live-Anteil ist bewusst kleines Risiko. Trading kann zum Totalverlust führen. Es geht um eine falsifizierbare Frage — nicht um eine Gewinn-Maschine.

Lernt die KI wirklich dazu? Das ist die eigentliche These. Loki schreibt seine Lehren in eine Textdatei und soll Fehler über Wochen seltener wiederholen. Der Übertragbarkeits-Test: kopiert man diese Datei in einen frischen Agenten, handelt der ab Trade #1 disziplinierter? Ob die Lernkurve real nach oben dreht, zeigt die Reihe — fälschungssicher, weil extern gemessen.

Transparenz: Die Messlatte (100 Trades, risiko-adjustiert, p < 0,05) steht vorregistriert fest und wird nicht nachträglich verschoben. Demo- und Live-Konten sind getrennt; der Live-Anteil läuft mit bewusst kleinem Risiko. Echte Log-Zitate, Gewinne und Verluste ungefiltert. Keine Anlageberatung. Stand: Juni 2026 — Zahlen vor Weiterverwendung frisch prüfen.