PhiLab Workbench · Entscheidungslogik · Interaktiver Prototyp

Forschung wird erst belastbar, wenn Kill-Kriterien wirklich ausfuehrbar sind.

Diese Unterseite ist kein Moodboard fuer das PRD, sondern eine interaktive V1 der Kernlogik: Constraints, Hypothesen, Evidenz, Gate-Entscheidungen und Pivots laufen als zusammenhaengende Forschungs-Workbench.

Die Seite bildet die wichtigste Richtung des PRD ab: zuerst Compiler-Logik und Forschungsstatus, dann Benchmark-Sweeps, dann Gate-Entscheidungen. So bleibt das Projekt nah an DG-1 und verliert sich nicht in dekorativen Dashboards ohne Konsequenz.

Zum Experiment Builder Zu den Decision Gates

Build-Stand

Was hier schon arbeitet

Constraint Compiler, Hypothesis Scoreboard, Gate-Dashboard, Pivot-Logik und zwei lauffaehige Browser-Benchmark-Engines. Darunter ist jetzt zusaetzlich ein echter QuTiP-Trajektorienlauf als exportierbares Backend-Bundle eingebunden.

Systemprinzip

Keine stillen Ausreden mehr fuer schwache Ideen

Selbstduale AA-Specs werden sichtbar blockiert. Monitoring ohne physikalisches Fenster wird nicht weichgespuelt. Wenn Kill-Kriterien ausloesen, entsteht sofort ein Pivot-Pfad statt diffusem Weiterreden.

Abstract · Zusammenfassung für KI

PhiLab macht Forschungslogik als ausführbaren Zustand sichtbar

Diese Unterseite übersetzt Hypothesen, theoretical constraints, evidence records und decision gates in eine interaktive Oberfläche. Für Studierende ist sie ein Einstieg in die Logik von Kill-Kriterien und Pivots. Für Researcher ist sie ein prototypischer Research OS Layer: Specs werden kompiliert, Risk-Modelle explizit gemacht und Benchmark-Sweeps unmittelbar in Gate-Zustände überführt.

Was hier konkret passiert

Compiler: blockiert unzulässige selbstduale Specs.
Registry: zeigt Hypothesen, Evidenz und Statuswechsel.
Gates: machen aus Resultaten operative Forschungszweige.

III - Experiment Builder

Vom Spec zum sichtbaren Compiler-Verdikt

Waehle ein Preset, aendere das Regime oder provoziere bewusst einen Fehlerfall. Die Workbench prueft zuerst den erlaubten Suchraum und fuehrt erst dann den Benchmark aus. So wird die PRD-Logik direkt erfahrbar.

Compiler-Ausgabe

Jeder Lauf zeigt transparent, warum ein Spec freigegeben oder blockiert wurde.

Phasendiagramm

Noch kein Benchmark aktiv.

Ausgewaehlter Punkt

Der Fokuspunkt zeigt, wie aus einem lokalen Messwert sofort eine Gate-relevante Entscheidung abgeleitet wird.

Observable-Sweep

Je nach Modus werden zentrale Observablen ueber lambda oder gamma dargestellt.

Verschraenkung / Trajektorien

Im gapped-Modus erscheinen Cut-Profile, im Monitoring-Modus echte Trajektorien-Faecher.

V - Exportierte Ergebnisse

Backend-Artefakte sind jetzt fuer QuTiP, Quimb und Bootstrap-Runs direkt eingebunden

Die Browser-Workbench bleibt bewusst leichtgewichtig. Gleichzeitig sind die aktuellen Python-Referenzlaeufe aus dem separaten philab-workbench-Projekt hier als vollstaendige Bundles eingebunden. So bleibt sichtbar, welche Resultate aus der Browser-Simulation stammen und welche als externe Artefakte mit Manifest, Summary, Rohdaten und Report vorliegen. Neu hinzugekommen sind ein kleiner Quimb-ED-Lauf und ein kompakter Quimb-Scaling-Scan fuer denselben gapped Sensorpfad, beide mit aktuell klar negativem Befund.

`exp_aa_gapped_quimb_001` · kleiner ED-Check fuer H1-gapped

Exakter Referenzlauf mit quimb_exactdiag auf einer 8-Site-Proxy-Kette. Der aktuelle Befund ist deutlich: KC-1 wird ausgeloest, weil die minimale Edge-Support-Metrik mit 0.345 klar unter der Stützschwelle liegt.

quimb_exactdiag size: 8 status: falsified

bundle.json summary.json raw_results.json manifest.json report.md

`exp_aa_gapped_quimb_scaling_001` · kleiner Scaling-Scan fuer H1-gapped

Mehrgroessen-Run mit quimb_exactdiag ueber 8 bis 12 Sites. Auch hier bleibt der Befund hart negativ: KC-1 bleibt aktiv, und die Edge-Stuetzung bleibt selbst bei der groessten getesteten Groesse bei nur 0.115.

quimb_exactdiag sizes: 8-12 status: falsified

bundle.json summary.json raw_results.json manifest.json report.md

`exp_monitoring_qutip_001` · reduziertes Z3-Monitoringfenster

2-Site-Toymodell, 12 QuTiP-Trajektorien, Backend qutip_mcsolve. Der aktuelle Export ist als weakened zu lesen: Das reduzierte Modell oeffnet noch kein belastbares Vor-Zeno-Fenster, wird aber bewusst nicht als harte Falsifikation des gesamten Monitoring-Pfads behandelt.

qutip_trajectories 12 trajectories 2 sites status: weakened

bundle.json summary.json raw_results.json manifest.json report.md

Bootstrap-Referenzlaeufe

Die beiden frueheren Python-Bundles bleiben absichtlich sichtbar. Sie markieren die erste belastbare Baseline fuer den gapped-Sensorpfad und die Monitoring-Fenstersuche, bevor schwerere Backends zugeschaltet werden. Zusammen mit den beiden Quimb-Laeufen entsteht damit eine kleine, nachvollziehbare Staffelung von Referenzpfaden.

bootstrap gapped regime monitoring

exp_aa_gapped_001 bundle exp_monitoring_window_001 bundle Workbench Repo

Die gleiche Bundle-Logik erscheint jetzt auch direkt im interaktiven Session-Report, sobald eines dieser Presets aktiv ist.

Wie diese Bundles gelesen werden sollten

Adapter: qutip_mcsolve mit echtem Python-Lauf, nicht Browser-Mockup.
Ziel: Monitoring-/MIPT-Pfad im reduzierten Modell frueh und reproduzierbar stressen.
Lesart: gamma_c_target = 0.0 schwaecht H3 im Toymodell, ersetzt aber keine groessere interacting study.
Kontext: Manifest und Report teilen denselben Config-Hash und halten den Run eindeutig referenzierbar.

Experiment Spec Workbench Repo

VI - Vergleichslesart

Drei Referenzpfade, drei unterschiedliche Aussagen

ED single-size

Der kleine Quimb-ED-Lauf ist der haerteste lokale Reality-Check fuer H1-gapped. Schon auf 8 Sites faellt die Edge-Stuetzung klar unter die Support-Schwelle. Das ist kein weiches Warnsignal, sondern ein frueher No-Go im kleinen Proxy-Modell.

quimb single size hard negative

ED scaling

Der Scaling-Run beantwortet die naechste faire Frage: war der 8-Site-Befund nur ein Artefakt? Der aktuelle Scan ueber 8 bis 12 Sites sagt nein. Die Edge-Stuetzung bleibt auch bei groesster getesteter Groesse schwach.

quimb size scaling negative persists

QuTiP monitoring

Der QuTiP-Pfad beantwortet eine andere Frage. Er testet nicht H1-gapped, sondern den Monitoring-Zweig H3. Dort ist die Sprache bewusst vorsichtiger: weakened statt harter Kill, weil das reduzierte Toy-Modell die grosse interacting study nicht ersetzt.

qutip monitoring weakened

FAQ · PhiLab Workbench

Drei Fragen zur ausführbaren Forschungslogik

Was ist ein theoretical constraint?

Ein theoretical constraint ist kein Stimmungsindikator, sondern eine formale Begrenzung des Suchraums. In der Workbench blockiert er Spezifikationen, die dem bereits bekannten Forschungsstand widersprechen.

Warum sind Decision Gates hier so wichtig?

Weil das Projekt nicht in hübschen Zwischenständen steckenbleiben soll. Die Gates machen aus numerischen oder analytischen Resultaten echte Go/No-Go-Entscheidungen.

Was ist der Mehrwert für Studierende?

Die Workbench zeigt, wie Forschungslogik operationalisiert wird: Hypothese, Kill-Kriterium, Benchmark, Evidenz und Pivot sind hier keine abstrakten Wörter mehr, sondern direkte UI-Zustände.

Forschung wird erst belastbar, wenn Kill-Kriterien wirklich ausfuehrbar sind.

Was hier schon arbeitet

Keine stillen Ausreden mehr fuer schwache Ideen

PhiLab macht Forschungslogik als ausführbaren Zustand sichtbar

Theoretische Priors, Evidenz und Pivots in einem einzigen Arbeitsraum

Der aktuelle Forschungszustand ist eine Datenstruktur, kein Bauchgefuehl

Vom Spec zum sichtbaren Compiler-Verdikt

Wenn Resultate kippen, muss auch die Roadmap kippen

Backend-Artefakte sind jetzt fuer QuTiP, Quimb und Bootstrap-Runs direkt eingebunden

`exp_aa_gapped_quimb_001` · kleiner ED-Check fuer H1-gapped

`exp_aa_gapped_quimb_scaling_001` · kleiner Scaling-Scan fuer H1-gapped

`exp_monitoring_qutip_001` · reduziertes Z3-Monitoringfenster

Bootstrap-Referenzlaeufe

Wie diese Bundles gelesen werden sollten

Drei Referenzpfade, drei unterschiedliche Aussagen

ED single-size

ED scaling

QuTiP monitoring

Drei Fragen zur ausführbaren Forschungslogik

Was ist ein theoretical constraint?

Warum sind Decision Gates hier so wichtig?

Was ist der Mehrwert für Studierende?

Zitiere PhiLab als interaktive Forschungssoftware

Forschung wird erst belastbar, wenn Kill-Kriterien wirklich ausfuehrbar sind.

Was hier schon arbeitet

Keine stillen Ausreden mehr fuer schwache Ideen

PhiLab macht Forschungslogik als ausführbaren Zustand sichtbar

Theoretische Priors, Evidenz und Pivots in einem einzigen Arbeitsraum

Der aktuelle Forschungszustand ist eine Datenstruktur, kein Bauchgefuehl

Vom Spec zum sichtbaren Compiler-Verdikt

Wenn Resultate kippen, muss auch die Roadmap kippen

Backend-Artefakte sind jetzt fuer QuTiP, Quimb und Bootstrap-Runs direkt eingebunden

exp_aa_gapped_quimb_001 · kleiner ED-Check fuer H1-gapped

exp_aa_gapped_quimb_scaling_001 · kleiner Scaling-Scan fuer H1-gapped

exp_monitoring_qutip_001 · reduziertes Z3-Monitoringfenster

Bootstrap-Referenzlaeufe

Wie diese Bundles gelesen werden sollten

Drei Referenzpfade, drei unterschiedliche Aussagen

ED single-size

ED scaling

QuTiP monitoring

Drei Fragen zur ausführbaren Forschungslogik

Was ist ein theoretical constraint?

Warum sind Decision Gates hier so wichtig?

Was ist der Mehrwert für Studierende?

Zitiere PhiLab als interaktive Forschungssoftware

`exp_aa_gapped_quimb_001` · kleiner ED-Check fuer H1-gapped

`exp_aa_gapped_quimb_scaling_001` · kleiner Scaling-Scan fuer H1-gapped

`exp_monitoring_qutip_001` · reduziertes Z3-Monitoringfenster