PhiLab Workbench · Entscheidungslogik · Interaktiver Prototyp

Forschung wird erst belastbar, wenn Kill-Kriterien wirklich ausfuehrbar sind.

Diese Unterseite ist kein Moodboard fuer das PRD, sondern eine interaktive V1 der Kernlogik: Constraints, Hypothesen, Evidenz, Gate-Entscheidungen und Pivots laufen als zusammenhaengende Forschungs-Workbench.

Die Seite bildet die wichtigste Richtung des PRD ab: zuerst Compiler-Logik und Forschungsstatus, dann Benchmark-Sweeps, dann Gate-Entscheidungen. So bleibt das Projekt nah an DG-1 und verliert sich nicht in dekorativen Dashboards ohne Konsequenz.

Build-Stand

Was hier schon arbeitet

Constraint Compiler, Hypothesis Scoreboard, Gate-Dashboard, Pivot-Logik und zwei lauffaehige Browser-Benchmark-Engines. Darunter ist jetzt zusaetzlich ein echter QuTiP-Trajektorienlauf als exportierbares Backend-Bundle eingebunden.

Systemprinzip

Keine stillen Ausreden mehr fuer schwache Ideen

Selbstduale AA-Specs werden sichtbar blockiert. Monitoring ohne physikalisches Fenster wird nicht weichgespuelt. Wenn Kill-Kriterien ausloesen, entsteht sofort ein Pivot-Pfad statt diffusem Weiterreden.

Abstract · Zusammenfassung für KI

PhiLab macht Forschungslogik als ausführbaren Zustand sichtbar

Diese Unterseite übersetzt Hypothesen, theoretical constraints, evidence records und decision gates in eine interaktive Oberfläche. Für Studierende ist sie ein Einstieg in die Logik von Kill-Kriterien und Pivots. Für Researcher ist sie ein prototypischer Research OS Layer: Specs werden kompiliert, Risk-Modelle explizit gemacht und Benchmark-Sweeps unmittelbar in Gate-Zustände überführt.

Was hier konkret passiert
  • Compiler: blockiert unzulässige selbstduale Specs.
  • Registry: zeigt Hypothesen, Evidenz und Statuswechsel.
  • Gates: machen aus Resultaten operative Forschungszweige.

I - Das System

Theoretische Priors, Evidenz und Pivots in einem einzigen Arbeitsraum

Die Workbench folgt bewusst dem PRD: Theoretical Constraints blockieren ungueltige Specs, Hypothesen werden aus Evidence Records bewertet, und Decision Gates uebersetzen Resultate in konkrete Forschungszweige. Das ist die Mindestform eines ernsthaften Research OS.


II - Registry

Der aktuelle Forschungszustand ist eine Datenstruktur, kein Bauchgefuehl

Scoreboard und Constraint-Inspector zeigen denselben Zustand aus zwei Blickwinkeln: Was ist aktiv? Was ist blockiert? Wo ist bereits formal Schaden entstanden und wo gibt es noch echten Spielraum?

Hypothesen-Scoreboard

Statuswechsel kommen nur ueber Evidence Records, Kill-Kriterien und formale Pivot-Entscheidungen zustande.

Constraint-Inspector

TC-1 und TC-2 bleiben als aktive Priors sichtbar. Beim Kompilieren eines Specs wird sofort markiert, welcher Constraint eingreift.


III - Experiment Builder

Vom Spec zum sichtbaren Compiler-Verdikt

Waehle ein Preset, aendere das Regime oder provoziere bewusst einen Fehlerfall. Die Workbench prueft zuerst den erlaubten Suchraum und fuehrt erst dann den Benchmark aus. So wird die PRD-Logik direkt erfahrbar.

Compiler-Ausgabe

Jeder Lauf zeigt transparent, warum ein Spec freigegeben oder blockiert wurde.

Phasendiagramm

Noch kein Benchmark aktiv.

Ausgewaehlter Punkt

Der Fokuspunkt zeigt, wie aus einem lokalen Messwert sofort eine Gate-relevante Entscheidung abgeleitet wird.

Observable-Sweep

Je nach Modus werden zentrale Observablen ueber lambda oder gamma dargestellt.

Verschraenkung / Trajektorien

Im gapped-Modus erscheinen Cut-Profile, im Monitoring-Modus echte Trajektorien-Faecher.


IV - Decision Gates

Wenn Resultate kippen, muss auch die Roadmap kippen

DG-1 und DG-2 werden hier als operative Schalter gezeigt. Die Seite macht damit sichtbar, warum das Projekt laut PRD nicht ueber elegante Narrativen, sondern ueber explizite Forschungszweige laufen soll.

V - Exportierte Ergebnisse

Backend-Artefakte sind jetzt fuer QuTiP, Quimb und Bootstrap-Runs direkt eingebunden

Die Browser-Workbench bleibt bewusst leichtgewichtig. Gleichzeitig sind die aktuellen Python-Referenzlaeufe aus dem separaten philab-workbench-Projekt hier als vollstaendige Bundles eingebunden. So bleibt sichtbar, welche Resultate aus der Browser-Simulation stammen und welche als externe Artefakte mit Manifest, Summary, Rohdaten und Report vorliegen. Neu hinzugekommen sind ein kleiner Quimb-ED-Lauf und ein kompakter Quimb-Scaling-Scan fuer denselben gapped Sensorpfad, beide mit aktuell klar negativem Befund.

exp_aa_gapped_quimb_001 · kleiner ED-Check fuer H1-gapped

Exakter Referenzlauf mit quimb_exactdiag auf einer 8-Site-Proxy-Kette. Der aktuelle Befund ist deutlich: KC-1 wird ausgeloest, weil die minimale Edge-Support-Metrik mit 0.345 klar unter der Stützschwelle liegt.

quimb_exactdiag size: 8 status: falsified

exp_aa_gapped_quimb_scaling_001 · kleiner Scaling-Scan fuer H1-gapped

Mehrgroessen-Run mit quimb_exactdiag ueber 8 bis 12 Sites. Auch hier bleibt der Befund hart negativ: KC-1 bleibt aktiv, und die Edge-Stuetzung bleibt selbst bei der groessten getesteten Groesse bei nur 0.115.

quimb_exactdiag sizes: 8-12 status: falsified

exp_monitoring_qutip_001 · reduziertes Z3-Monitoringfenster

2-Site-Toymodell, 12 QuTiP-Trajektorien, Backend qutip_mcsolve. Der aktuelle Export ist als weakened zu lesen: Das reduzierte Modell oeffnet noch kein belastbares Vor-Zeno-Fenster, wird aber bewusst nicht als harte Falsifikation des gesamten Monitoring-Pfads behandelt.

qutip_trajectories 12 trajectories 2 sites status: weakened

Bootstrap-Referenzlaeufe

Die beiden frueheren Python-Bundles bleiben absichtlich sichtbar. Sie markieren die erste belastbare Baseline fuer den gapped-Sensorpfad und die Monitoring-Fenstersuche, bevor schwerere Backends zugeschaltet werden. Zusammen mit den beiden Quimb-Laeufen entsteht damit eine kleine, nachvollziehbare Staffelung von Referenzpfaden.

bootstrap gapped regime monitoring

Die gleiche Bundle-Logik erscheint jetzt auch direkt im interaktiven Session-Report, sobald eines dieser Presets aktiv ist.

Wie diese Bundles gelesen werden sollten

  • Adapter: qutip_mcsolve mit echtem Python-Lauf, nicht Browser-Mockup.
  • Ziel: Monitoring-/MIPT-Pfad im reduzierten Modell frueh und reproduzierbar stressen.
  • Lesart: gamma_c_target = 0.0 schwaecht H3 im Toymodell, ersetzt aber keine groessere interacting study.
  • Kontext: Manifest und Report teilen denselben Config-Hash und halten den Run eindeutig referenzierbar.
VI - Vergleichslesart

Drei Referenzpfade, drei unterschiedliche Aussagen

ED single-size

Der kleine Quimb-ED-Lauf ist der haerteste lokale Reality-Check fuer H1-gapped. Schon auf 8 Sites faellt die Edge-Stuetzung klar unter die Support-Schwelle. Das ist kein weiches Warnsignal, sondern ein frueher No-Go im kleinen Proxy-Modell.

quimb single size hard negative

ED scaling

Der Scaling-Run beantwortet die naechste faire Frage: war der 8-Site-Befund nur ein Artefakt? Der aktuelle Scan ueber 8 bis 12 Sites sagt nein. Die Edge-Stuetzung bleibt auch bei groesster getesteter Groesse schwach.

quimb size scaling negative persists

QuTiP monitoring

Der QuTiP-Pfad beantwortet eine andere Frage. Er testet nicht H1-gapped, sondern den Monitoring-Zweig H3. Dort ist die Sprache bewusst vorsichtiger: weakened statt harter Kill, weil das reduzierte Toy-Modell die grosse interacting study nicht ersetzt.

qutip monitoring weakened
FAQ · PhiLab Workbench

Drei Fragen zur ausführbaren Forschungslogik

Was ist ein theoretical constraint?

Ein theoretical constraint ist kein Stimmungsindikator, sondern eine formale Begrenzung des Suchraums. In der Workbench blockiert er Spezifikationen, die dem bereits bekannten Forschungsstand widersprechen.

Warum sind Decision Gates hier so wichtig?

Weil das Projekt nicht in hübschen Zwischenständen steckenbleiben soll. Die Gates machen aus numerischen oder analytischen Resultaten echte Go/No-Go-Entscheidungen.

Was ist der Mehrwert für Studierende?

Die Workbench zeigt, wie Forschungslogik operationalisiert wird: Hypothese, Kill-Kriterium, Benchmark, Evidenz und Pivot sind hier keine abstrakten Wörter mehr, sondern direkte UI-Zustände.

Zitieren & Software

Zitiere PhiLab als interaktive Forschungssoftware

Verwendung: geeignet als Referenz für die Workbench-Logik, das Dataset der interaktiven Sweeps, das exportierte QuTiP-Bundle und das verlinkte Bootstrap-Repository.

phi_lanz_es.bib GitHub Repo
@software{lanz2026philab-page,
  author = {Lanz, Marc},
  title = {PhiLab Workbench},
  year = {2026},
  url = {https://phi.lanz.es/phi_workbench.html},
  repository = {https://github.com/Devdorado/philab-workbench}
}