Tension Index

Der Tension Index (TX) misst, ob Forschungsaktivität oder Kapitalallokation ungewöhnlich schnell relativ zur anderen Achse über ein 12-Monats-Fenster beschleunigt. Es handelt sich um ein standardisiertes, begrenztes Signal im Bereich -100 bis +100, abgeleitet aus OLS-Momentumsteigungen, z-Score-Normalisierung und einer tanh-Kompression.

Was er misst

TX quantifiziert die Divergenz zwischen zwei Momentumsteigungen: Forschungsproduktion (arXiv-Publikationen) und eingesetztes Kapital (ein Komposit aus fünf Finanzierungsquellen). Jede Steigung wird über OLS auf einem rollierenden 12-Monats-Fenster geschätzt, z-normalisiert gegen historische Baselines, und die Differenz wird durch tanh(roh / 4) in den Bereich -100 bis +100 komprimiert. Das Ergebnis ist ein dimensionsloser Score, der anzeigt, welche Achse schneller als ihre eigene historische Norm beschleunigt.

Drei Beobachtungsachsen

Das Dashboard verfolgt drei unabhängige Achsen: Forschungsmomentum (monatliche arXiv-Einreichungen pro Sektor), Kapitalmomentum (das unten beschriebene dollargewichtete Komposit) und Öffentliches Interesse (Google-Trends-Index, gemittelt über fünf Sektor-Suchbegriffe). Der Tension Index wird aus den ersten beiden berechnet; die dritte liefert nur kontextuelles Signal.

Das Kapitalkomposit

Das eingesetzte Kapital wird monatlich aus fünf institutionellen Quellen aggregiert: NSF Awards, NIH RePORTER, USASpending-Grants, SEC EDGAR Form D und CORDIS Horizon Europe Grants. Jede Quelle wird auf konstante USD 2025 mittels CPI-U deflationiert und dann dollargenau zum monatlichen Kompositwert summiert. Die z-Normalisierung wird erst danach angewendet — auf die Komposit-Steigung selbst, nicht auf die einzelnen Quellen. Hinweis: Die EDGAR-Pipeline liefert derzeit null wegen einer Änderung im SEC-Dokument-URL-Format; NSF, NIH, USASpending und CORDIS tragen aktuell das gesamte Signal.

Momentum-Berechnung

Für jede Achse (Forschung und Kapital) wird die rohe Monatsreihe zunächst mit einer gleitenden 3-Monats-Summe geglättet, um Reporting-Rauschen zu reduzieren, und anschließend per log(1+x) transformiert, damit proportionale — nicht absolute — Veränderungen das Signal treiben. Eine OLS-Regression wird an die letzten 12 geglätteten log-Werte angepasst, wobei die Zeit als unabhängige Variable dient. Der Steigungskoeffizient repräsentiert das Momentum dieser Achse. Jede Steigung wird gegen Baseline-Statistiken (aus der vollständigen Historie 2015–2024) z-normalisiert: z = (Steigung - Baseline-Mittel) / Baseline-Std. Diese Normalisierung macht Steigungen zwischen Sektoren mit unterschiedlichen absoluten Skalen vergleichbar. Da der aktuelle Kalendermonat noch unvollständig gemeldet ist, wird die Reihe vor der Berechnung stets auf den letzten abgeschlossenen Monat gekürzt.

Tension-Formel

Der Roh-Tension-Wert ist die Differenz der beiden z-Scores: roh = z_Forschung − z_Kapital. Diese Differenz wird durch eine Tangens-hyperbolicus-Funktion komprimiert: TX = 100 × tanh(roh / 4). Die tanh-Funktion bildet jede reelle Divergenz glatt in den begrenzten Bereich -100 bis +100 ab, durchläuft die Null mit Steigung 1 und flacht an den Rändern ab, sodass extreme Werte die visuelle Darstellung nicht dominieren. Der Divisor 4 hält typische Signale im aussagekräftigen Teil der Kurve — Werte bis etwa ±2σ ergeben Display-Werte in [-46, +46], während größere Divergenzen graduell zu den Limits komprimiert werden. Das Ergebnis wird auf die nächste ganze Zahl gerundet.

Konfidenz und Signifikanz

Jeder TX-Wert trägt ein 95%-Konfidenzintervall aus den Standardfehlern der beiden OLS-Steigungsschätzungen. Der Standardfehler der Roh-Tension ist SE = sqrt((SE_Forschung / σ_Forschung)² + (SE_Kapital / σ_Kapital)²), und die CI-Grenzen werden exakt durch tanh transformiert — das angezeigte Band ist nahe den Rändern asymmetrisch um die Punktschätzung. Ein Punkt gilt als statistisch signifikant, wenn sein Roh-CI die Null nicht kreuzt. Nicht-signifikante Punkte werden im Diagramm als gestrichelte Linie dargestellt, signifikante als durchgezogene Linie; das graue Band hinter der Linie ist das CI selbst. Also: durchgezogene Linie = die Richtung der Divergenz ist verlässlich; gestrichelt = die Divergenz ist auf dem 95%-Niveau nicht vom Rauschen zu trennen, und der numerische TX-Wert ist als „nahe null, egal was die gerundete Zahl sagt" zu lesen.

Interpretation

  • TX > 0 (signifikant): Die Forschung beschleunigt schneller als ihre historische Norm relativ zum Kapital. Dies kann auf eine aufkommende wissenschaftliche Front hindeuten, bei der die Finanzierung noch nicht aufgeholt hat.
  • TX < 0 (signifikant): Das Kapital beschleunigt schneller als seine historische Norm relativ zur Forschung. Dies kann auf Überbesetzung oder spekulative Allokation vor der wissenschaftlichen Produktion hindeuten.
  • TX nahe null oder nicht signifikant: Entweder bewegen sich beide Achsen im Gleichschritt, oder das Konfidenzintervall umfasst die Null, sodass die beobachtete Divergenz auf dem 95%-Niveau nicht von Rauschen unterschieden werden kann.

Statistische Eigenschaften

Der Index ist konstruktionsbedingt begrenzt (-100 bis +100), symmetrisch um null und im Vor-tanh-Raum annähernd standardnormalverteilt. Das 12-Monats-OLS-Fenster bietet Robustheit gegen Einzelmonat-Ausreißer, und die 3-Monats-Glättung (gleitende Summe) absorbiert Reporting-Jitter. Die z-Normalisierung gegen die Baseline 2015–2024 gewährleistet sektorübergreifende Vergleichbarkeit. Die tanh-Kompression erhält die Rangordnung und hält extreme Werte lesbar.

Wissenschaftliche Einschränkungen

OLS-Steigungen nehmen lokal lineare Trends innerhalb des 12-Monats-Fensters an; Strukturbrüche oder Regimewechsel können transiente Artefakte erzeugen. Das Kapitalkomposit summiert Dollarbeträge über die Quellen hinweg — eine dollarstarke Quelle (USASpending) wiegt absolut mehr als eine dollarschwache (CORDIS). Wir halten das für ein wünschenswertes Flow-of-Funds-Signal, es ist aber eine Modellentscheidung. Die CPI-U-Deflation ist ein breites Maß und erfasst sektorspezifische Kostendynamik möglicherweise nicht. Google-Trends-Daten (Achse Öffentliches Interesse) werden nicht in der TX-Formel verwendet, sondern nur daneben angezeigt; ihre Erhebungsmethodik ist intransparent. Jeder Sektor wird unabhängig behandelt; sektorübergreifende Ansteckungseffekte werden nicht modelliert. Baseline-Statistiken werden vierteljährlich aktualisiert. Die EDGAR-Quelle ist derzeit offline wegen eines SEC-URL-Formatwechsels, was die Venture-Capital-Abdeckung bis zur Behebung reduziert.

Zurück zu Forms