Q2 — Cas quadratique : preuve de la stabilité par convolution gaussienne

Tâche task-20260416-8329, molécule parente delib-20260416-102e (synthèse : §5.1 « marchepied »). Références internes : docs/problem.md (énoncé Etienne), .cosmon/state/fleets/default/molecules/delib-20260416-102e/responses/feynman.md (preuve Fourier + Woodbury), .cosmon/state/fleets/default/molecules/delib-20260416-102e/responses/von-neumann.md (dérivation Riccati).


0. Objectif et énoncé

On fixe la statistique quadratique complète

\[ \varphi : \mathbb{R}^d \longrightarrow \mathbb{R}^{d^2+d}, \qquad \varphi(x) \;=\; \bigl(\mathrm{vec}(xx^\top),\; x\bigr). \tag{Q2.1} \]

On veut montrer :

Théorème (Q2). Pour tout \(\theta \in \Theta^\star := \{\theta\ :\ M(\theta) \succ 0\}\) et tout \(\sigma > 0\), il existe \(\tilde\theta \in \Theta^\star\) tel que \[ p_\theta \ast \gamma_\sigma \;\propto\; e^{-\tilde\theta^\top \varphi(\cdot)}. \] La reparamétrisation \(\theta \mapsto \tilde\theta\) est explicitée en coordonnées \((M, b)\) par la formule fermée \[ \boxed{\;\tilde M \;=\; M\,(I + \sigma^2 M)^{-1}, \qquad \tilde b \;=\; (I + \sigma^2 M)^{-1}\, b.\;} \tag{Q2.⋆} \] Elle est bien définie sur \(\Theta^\star\) et respecte le cône SPD : \(\tilde M \succ 0\). Le flot associé \(\sigma^2 = s\) satisfait l'EDO de Riccati \(\dot M_s = -M_s^2\), \(\dot b_s = -M_s\, b_s\).

La preuve procède en six étapes : §1 paramétrisation propre et symétrisation ; §2 domaine \(\Theta^\star\) ; §3 convolution par Fourier ; §4 identification via Woodbury ; §5 stabilité du cône SPD ; §6 flot Riccati ; §7 cohérence avec la condition de fermeture \((\dagger)\) du panel.


1. Paramétrisation et symétrisation de la redondance

1.1. Notation

Écrivons \(\theta = (\mathrm{vec}(T),\, \beta) \in \mathbb{R}^{d^2+d}\) avec \(T \in \mathbb{R}^{d \times d}\) (pas a priori symétrique) et \(\beta \in \mathbb{R}^d\). Alors

\[ \theta^\top \varphi(x) \;=\; \mathrm{vec}(T)^\top \mathrm{vec}(xx^\top) \;+\; \beta^\top x \;=\; \operatorname{tr}(T\, xx^\top) \;+\; \beta^\top x \;=\; x^\top T x \;+\; \beta^\top x. \tag{1.1} \]

1.2. Redondance de \(\mathrm{vec}(xx^\top)\)

La forme quadratique \(x \mapsto x^\top T x\) ne voit que la partie symétrique de \(T\) puisque \(x^\top T x = x^\top T^\top x = \tfrac{1}{2} x^\top (T+T^\top) x\). Posons donc une fois pour toutes

\[ M(\theta) \;:=\; T + T^\top \;\in\; \mathrm{Sym}_d(\mathbb{R}), \qquad b(\theta) \;:=\; \beta \;\in\; \mathbb{R}^d. \tag{1.2} \]

Avec cette définition,

\[ \theta^\top \varphi(x) \;=\; \tfrac{1}{2}\, x^\top M x \;+\; b^\top x. \tag{1.3} \]

Le facteur \(\tfrac{1}{2}\) est essentiel : il normalise la convention pour que \(M\) coïncide avec la précision de la gaussienne associée (cf. §2), et élimine les facteurs parasites lors des dérivations suivantes.

Remarque 1.1 (redondance à noter explicitement). L'application \(T \mapsto M = T + T^\top\) a pour noyau le sous-espace \(\mathrm{Asym}_d\) des matrices antisymétriques, de dimension \(d(d-1)/2\). La statistique \(\mathrm{vec}(xx^\top) \in \mathbb{R}^{d^2}\) est donc redondante : sa dimension canonique (pour repérer les quadratiques) est \(d(d+1)/2\). La famille exponentielle paramétrée par \(\theta \in \mathbb{R}^{d^2+d}\) n'est pas minimale ; elle le devient si l'on se restreint à \(T \in \mathrm{Sym}_d\), i.e. si l'on symétrise au préalable. Dans la suite on travaille avec \((M, b) \in \mathrm{Sym}_d \times \mathbb{R}^d\) comme variables canoniques, et l'on réinjecte via \(\tilde\theta := (\mathrm{vec}(\tilde T), \tilde\beta)\) avec \(\tilde T = \tfrac{1}{2}\tilde M\), \(\tilde\beta = \tilde b\).


2. Domaine \(\Theta^\star\) et identification gaussienne

Pour que

\[ Z_\theta \;=\; \int_{\mathbb{R}^d} e^{-\tfrac{1}{2} x^\top M x - b^\top x}\, dx \;<\; \infty, \tag{2.1} \]

il est nécessaire et suffisant que \(M \succ 0\) (sinon l'intégrale diverge dans la direction propre associée à une valeur propre \(\le 0\)). On pose

\[ \Theta^\star \;:=\; \bigl\{(M, b)\ :\ M \in \mathrm{Sym}_d,\ M \succ 0,\ b \in \mathbb{R}^d\bigr\}. \tag{2.2} \]

Lemme 2.1 (identification gaussienne). Sur \(\Theta^\star\), \[ p_\theta(x) \;=\; \mathcal{N}\!\bigl(x;\, \mu,\, \Sigma\bigr) \quad\text{avec}\quad \Sigma = M^{-1},\quad \mu = -M^{-1} b. \]

Preuve. Complétion de carré : \(\tfrac{1}{2}x^\top M x + b^\top x = \tfrac{1}{2}(x + M^{-1}b)^\top M (x + M^{-1}b) - \tfrac{1}{2} b^\top M^{-1} b\). Comme \(b^\top M^{-1} b\) ne dépend pas de \(x\), il passe dans \(Z_\theta\), ce qui donne la densité gaussienne annoncée de précision \(M\). \(\blacksquare\)


3. Convolution via la transformée de Fourier

3.1. Transformée de \(p_\theta\)

On utilise la convention \(\hat f(\xi) = \int_{\mathbb{R}^d} e^{-i\xi^\top x} f(x)\, dx\). Pour \(\theta \in \Theta^\star\),

\[ \hat p_\theta(\xi) \;\propto\; \int_{\mathbb{R}^d} \exp\!\Bigl(-\tfrac{1}{2}x^\top M x - b^\top x - i\xi^\top x\Bigr)\, dx. \tag{3.1} \]

Posons \(c := b + i\xi \in \mathbb{C}^d\). Le changement \(u = x + M^{-1} c\) donne

\[ -\tfrac{1}{2} x^\top M x - c^\top x \;=\; -\tfrac{1}{2} u^\top M u \;+\; \tfrac{1}{2} c^\top M^{-1} c. \]

En substituant et en absorbant l'intégrale gaussienne \(\int e^{-\tfrac{1}{2} u^\top M u}\,du\) dans le préfacteur, on obtient

\[ \hat p_\theta(\xi) \;\propto\; \exp\!\Bigl(\tfrac{1}{2}(b + i\xi)^\top M^{-1} (b + i\xi)\Bigr). \tag{3.2} \]

Développé en parties réelles / imaginaires :

\[ \hat p_\theta(\xi) \;\propto\; \exp\!\Bigl(\tfrac{1}{2} b^\top M^{-1} b \;+\; i\, b^\top M^{-1} \xi \;-\; \tfrac{1}{2} \xi^\top M^{-1} \xi\Bigr). \tag{3.3} \]

Le terme \(\tfrac{1}{2} b^\top M^{-1} b\) est une constante (indépendante de \(\xi\)), absorbée dans la proportionnalité.

Remarque 3.1 (rigueur du changement complexe). Le changement \(u = x + M^{-1}c\) avec \(c \in \mathbb{C}^d\) se justifie par analyticité : pour \(\xi \in \mathbb{R}^d\) fixé, l'intégrale en \(x\) sur \(\mathbb{R}^d\) est absolument convergente (car \(M \succ 0\)), et le résultat est une fonction entière de \(c \in \mathbb{C}^d\). Le prolongement analytique de l'identité réelle (\(b \in \mathbb{R}^d\)) à \(c = b + i\xi\) est licite par le théorème d'identité, le domaine contenant un ouvert réel.

3.2. Transformée du noyau gaussien

Directement (ou comme cas particulier de (3.3) avec \(M = \sigma^{-2} I\), \(b = 0\)) :

\[ \hat\gamma_\sigma(\xi) \;=\; \exp\!\bigl(-\tfrac{1}{2} \sigma^2 \|\xi\|^2\bigr). \tag{3.4} \]

3.3. Produit dans Fourier

Par le théorème de convolution \(\widehat{f \ast g} = \hat f \cdot \hat g\), en combinant (3.3) et (3.4) :

\[ \widehat{p_\theta \ast \gamma_\sigma}(\xi) \;\propto\; \exp\!\Bigl(i\, b^\top M^{-1} \xi \;-\; \tfrac{1}{2} \xi^\top \bigl(M^{-1} + \sigma^2 I\bigr) \xi\Bigr). \tag{3.5} \]


4. Complétion de carré inverse et identification \((\tilde M, \tilde b)\)

4.1. Lecture de (3.5) comme Fourier d'une gaussienne

L'expression (3.5) est la transformée de Fourier (à normalisation près) d'une gaussienne de moyenne \(\mu\) et covariance \(\Sigma\), où \[ \Sigma \;=\; M^{-1} + \sigma^2 I, \qquad \mu \;=\; -M^{-1} b. \tag{4.1} \] (On vérifie via (3.3) avec \(M \to \Sigma^{-1}\), \(b \to -\Sigma^{-1}\mu\).)

4.2. Application de la formule de Woodbury

Pour repasser en coordonnées \((\tilde M, \tilde b)\) avec \(\tilde M\) précision et \(\tilde b\) tel que \(p_\theta \ast \gamma_\sigma \propto e^{-\tfrac{1}{2} x^\top \tilde M x - \tilde b^\top x}\), on identifie \(\tilde M = \Sigma^{-1}\) et \(\tilde b = -\tilde M \mu\).

Lemme 4.1 (Woodbury dans le cas commutatif). Pour \(M \succ 0\) et \(\sigma^2 > 0\), \[ (M^{-1} + \sigma^2 I)^{-1} \;=\; M\,(I + \sigma^2 M)^{-1} \;=\; (I + \sigma^2 M)^{-1}\, M. \tag{4.2} \]

Preuve. \((M^{-1} + \sigma^2 I) \cdot M(I+\sigma^2 M)^{-1} = (I + \sigma^2 M)(I+\sigma^2 M)^{-1} = I\), où l'on a utilisé la distributivité et le fait que \(M\) commute avec \((I+\sigma^2 M)^{-1}\) (les deux sont des polynômes/fractions rationnelles en \(M\)). La deuxième égalité s'obtient en multipliant à gauche par \((I+\sigma^2 M)^{-1}\) au lieu de à droite — les deux facteurs commutent. \(\blacksquare\)

Donc

\[ \tilde M \;=\; (M^{-1} + \sigma^2 I)^{-1} \;=\; M(I + \sigma^2 M)^{-1}. \tag{4.3} \]

4.3. Calcul de \(\tilde b\)

\(\tilde b = -\tilde M \mu = -\tilde M \cdot (-M^{-1} b) = \tilde M M^{-1} b\). Or \(\tilde M M^{-1} = M(I+\sigma^2 M)^{-1} M^{-1} = (I+\sigma^2 M)^{-1}\) (commutativité). D'où

\[ \tilde b \;=\; (I + \sigma^2 M)^{-1}\, b. \tag{4.4} \]

4.4. Formule centrale (Q2.⋆)

Les équations (4.3) et (4.4) établissent

\[ \boxed{\;\tilde M = M\,(I + \sigma^2 M)^{-1}, \qquad \tilde b = (I + \sigma^2 M)^{-1}\, b.\;} \tag{Q2.⋆} \]

Remarque 4.2 (symétrie de \(\tilde M\)). \(\tilde M\) est symétrique car produit de \(M \succ 0\) et \((I+\sigma^2 M)^{-1} \succ 0\) qui commutent ; le produit de deux matrices symétriques qui commutent est symétrique (cf. Lemme 5.1).

Remarque 4.3 (réinjection dans \(\theta\)). La reparamétrisation canonique s'achève par \(\tilde T := \tfrac{1}{2}\tilde M\), \(\tilde\beta := \tilde b\), et \(\tilde\theta := (\mathrm{vec}(\tilde T), \tilde\beta)\). L'application est bien définie sur \(\Theta^\star\). Sur le plan redondant \(\mathbb{R}^{d^2+d}\) elle est non unique au sens où \(\tilde\theta + (\mathrm{vec}(A), 0)\) avec \(A \in \mathrm{Asym}_d\) donne la même densité ; après symétrisation (\(T \in \mathrm{Sym}_d\)), elle est unique.


5. Stabilité du cône SPD et injectivité non-surjective

5.1. \(\tilde M\) reste dans le cône SPD

Lemme 5.1. Soient \(A, B \in \mathrm{Sym}_d\) tels que \(AB = BA\). Si \(A \succ 0\) et \(B \succ 0\), alors \(AB \succ 0\) et \(AB\) est symétrique.

Preuve. La commutativité entraîne \((AB)^\top = B^\top A^\top = BA = AB\), donc symétrie. Elle permet aussi la diagonalisation simultanée : il existe une base orthonormée \((e_i)\) et des scalaires \(\lambda_i, \mu_i > 0\) tels que \(A e_i = \lambda_i e_i\) et \(B e_i = \mu_i e_i\). Alors \(AB e_i = \lambda_i \mu_i e_i\) avec \(\lambda_i \mu_i > 0\), donc \(AB \succ 0\). \(\blacksquare\)

Proposition 5.2 (stabilité du cône). \(\tilde M \succ 0\) dès que \(M \succ 0\).

Preuve. \(M \succ 0 \Rightarrow I + \sigma^2 M \succ I \succ 0 \Rightarrow (I+\sigma^2 M)^{-1} \succ 0\). \(M\) et \((I+\sigma^2 M)^{-1}\) commutent (fractions rationnelles en \(M\)) ; par le Lemme 5.1, \(\tilde M = M(I+\sigma^2 M)^{-1} \succ 0\) et symétrique. \(\blacksquare\)

5.2. Injectivité de \(\theta \mapsto \tilde\theta\)

Proposition 5.3 (injectivité). La flèche \((M, b) \mapsto (\tilde M, \tilde b)\) est injective sur \(\Theta^\star\).

Preuve. Supposons \(\tilde M_1 = \tilde M_2\). Alors \(M_1(I+\sigma^2 M_1)^{-1} = M_2(I+\sigma^2 M_2)^{-1}\). Multiplions à droite par \((I+\sigma^2 M_1)\), puis par \((I+\sigma^2 M_2)\) : \(M_1(I+\sigma^2 M_2) = M_2(I+\sigma^2 M_1)\), i.e. \(M_1 + \sigma^2 M_1 M_2 = M_2 + \sigma^2 M_2 M_1\), i.e. \(M_1 - M_2 = \sigma^2 (M_2 M_1 - M_1 M_2)\). Mais le membre gauche est symétrique et le membre droit est antisymétrique (commutateur de deux matrices symétriques), donc les deux sont nuls : \(M_1 = M_2\). Puis \(\tilde b_1 = \tilde b_2 \Rightarrow (I+\sigma^2 M)^{-1}(b_1 - b_2) = 0 \Rightarrow b_1 = b_2\) puisque \((I+\sigma^2 M)^{-1}\) est inversible. \(\blacksquare\)

5.3. Non-surjectivité : l'irréversibilité du lissage

Proposition 5.4 (image stricte). L'image de l'application \((M, b) \mapsto (\tilde M, \tilde b)\) sur \(\Theta^\star\) est strictement contenue dans \(\Theta^\star\).

Preuve. Inverser (Q2.⋆) : si \(\tilde M = M(I+\sigma^2 M)^{-1}\), alors \(\tilde M (I+\sigma^2 M) = M\), i.e. \(\tilde M + \sigma^2 \tilde M M = M\), i.e. \(M = \tilde M (I - \sigma^2 \tilde M)^{-1}\) (quand \(I - \sigma^2 \tilde M\) est inversible). Pour que \(M \succ 0\) existe, il faut que toutes les valeurs propres de \(\tilde M\) soient \(< 1/\sigma^2\) (sinon \(I - \sigma^2 \tilde M\) n'est pas définie positive, et \(M\) ne serait pas SPD). Donc l'image de la flèche dans \(\Theta^\star\) est le sous-cône strict \(\{\tilde M \succ 0 : \tilde M \prec \sigma^{-2} I\}\). En d'autres termes : le lissage est irréversible — aucune densité de précision \(\ge \sigma^{-2} I\) dans au moins une direction ne peut être atteinte par convolution d'une gaussienne par \(\gamma_\sigma\). \(\blacksquare\)

Remarque 5.5 (interprétation). \(\tilde M \prec \sigma^{-2} I\) traduit le fait que la covariance \(\tilde\Sigma = \tilde M^{-1}\) satisfait \(\tilde\Sigma \succ \sigma^2 I\) : la convolution ajoute au moins \(\sigma^2\) de variance dans chaque direction (cf. Lemme 2.1 : \(\Sigma + \sigma^2 I\)).


6. Flot Riccati

On laisse \(\sigma\) (ou \(\sigma^2\)) varier et l'on étudie la dépendance temporelle de \((\tilde M, \tilde b)\).

6.1. Paramétrisation par \(s := \sigma^2\)

Pour éviter l'ambiguïté de convention (voir Remarque 6.3), on prend directement \(s = \sigma^2\) comme variable de temps. Définissons, pour \(s \ge 0\), \[ M_s \;:=\; M_0 (I + s M_0)^{-1}, \qquad b_s \;:=\; (I + s M_0)^{-1} b_0, \tag{6.1} \] avec \((M_0, b_0)\) condition initiale dans \(\Theta^\star\).

Proposition 6.1 (EDO de Riccati). Pour tout \(s \ge 0\), \[ \boxed{\;\dot M_s \;=\; -\, M_s^2, \qquad \dot b_s \;=\; -\, M_s\, b_s.\;} \tag{6.2} \]

Preuve de l'équation matricielle. Posons \(A(s) := I + s M_0\). Alors \(\dot A = M_0\) et \(\frac{d}{ds} A^{-1} = -A^{-1} \dot A A^{-1} = -A^{-1} M_0 A^{-1}\). Donc

\[ \dot M_s \;=\; \frac{d}{ds}\bigl(M_0 A^{-1}\bigr) \;=\; M_0 \cdot (-A^{-1} M_0 A^{-1}) \;=\; -\, M_0 A^{-1} M_0 A^{-1}. \]

Par commutativité (\(M_0\) et \(A^{-1}\) sont des polynômes/fractions rationnelles en \(M_0\)) : \(M_0 A^{-1} = A^{-1} M_0 = M_s\). D'où \(\dot M_s = -M_s \cdot M_s = -M_s^2\). \(\blacksquare\)

Preuve de l'équation vectorielle. \(\dot b_s = \frac{d}{ds}(A^{-1} b_0) = -A^{-1} M_0 A^{-1} b_0 = -M_s \cdot A^{-1} b_0 = -M_s b_s\). \(\blacksquare\)

Corollaire 6.2 (consistance). La donnée initiale \(M_0 \in \mathrm{Sym}_d^{++}\) engendre une trajectoire \(s \mapsto M_s\) entièrement contenue dans \(\mathrm{Sym}_d^{++}\) (par Proposition 5.2 à \(\sigma^2 = s\)), strictement décroissante au sens de Loewner (\(M_s \prec M_0\) pour \(s > 0\), car \(M_0 - M_s = s M_0 M_s \succ 0\)).

Remarque 6.3 (conventions de temps). Le problème (cf. docs/problem.md) paramètre \(p_{\theta_t} = p_\theta \ast \gamma_{\sqrt{2t}}\), i.e. \(\sigma^2 = 2t\). Avec cette convention, on a \(\dot M_t = -2 M_t^2\) et \(\dot b_t = -2 M_t b_t\) (facteur 2 par la règle de chaîne \(d/dt = 2\, d/ds\)). Le facteur \(2\) correspond à l'équation de la chaleur \(\partial_t u = \Delta u\) (Laplacien complet) ; si l'on souhaite l'équation \(\partial_t u = \tfrac{1}{2}\Delta u\) (convention du §3 de problem.md), il faut prendre \(\sigma^2 = t\) (i.e. \(s = t\)), auquel cas (6.2) s'applique tel quel. Nous choisissons \(s = \sigma^2\) comme variable naturelle pour que la Riccati ait la forme la plus simple.

6.2. Vérification directe (alternative)

Un calcul direct confirme (6.1). Supposons \(\dot M_s = -M_s^2\) avec \(M_0\) donné, et cherchons la solution explicite. La Riccati matricielle scalaire \(\dot m = -m^2\) admet pour solution \(m(s) = m_0 / (1 + s m_0)\) (séparation des variables). La version matricielle est le pendant direct (valide car \(M_s\) et \(M_0\) commutent tout au long de la trajectoire, ce qui réduit le problème aux valeurs propres) : \(M_s = M_0(I + sM_0)^{-1}\). CQFD.

6.3. Flot de l'EDO sur \(b\)

L'EDO \(\dot b_s = -M_s b_s\) est un système linéaire non autonome. Comme \(M_s\) et \(M_0\) commutent, la solution fondamentale est \(U(s) := (I + s M_0)^{-1}\) : \(\dot U = -(I+sM_0)^{-1} M_0 (I+sM_0)^{-1} = -M_s (I+sM_0)^{-1} = -M_s U\), avec \(U(0) = I\). Donc \(b_s = U(s) b_0 = (I+sM_0)^{-1} b_0\), conforme à (6.1).


7. Cohérence avec la Proposition \((\dagger)\) du panel

La synthèse delib-20260416-102e établit (Proposition \((\dagger)\), von-Neumann) la condition de fermeture générale : la famille \(\{p_\theta\}\) est stable ssi \(G_{ij}(x) := \langle\nabla\varphi_i,\nabla\varphi_j\rangle\) et \(H_i(x) := \Delta\varphi_i\) appartiennent à l'espace affine \(\mathcal{A} = \mathrm{Span}\{\varphi_1,\ldots,\varphi_r, 1\}\), uniformément en \(\theta\). On vérifie cette condition pour la statistique quadratique.

7.1. Calcul de \(\mathcal{L}(\theta^\top\varphi)\)

Rappel : \(\mathcal{L} f = \tfrac{1}{2} \|\nabla f\|^2 - \tfrac{1}{2} \Delta f\). Pour \(f(x) = \tfrac{1}{2} x^\top M x + b^\top x\) (équation (1.3)) :

Donc

\[ \mathcal{L}(f)(x) \;=\; \tfrac{1}{2}\,(M x + b)^\top (M x + b) \;-\; \tfrac{1}{2}\,\operatorname{tr}(M). \tag{7.1} \]

7.2. Développement

En développant (7.1) :

\[ \mathcal{L}(f)(x) \;=\; \tfrac{1}{2} x^\top M^2 x \;+\; b^\top M\, x \;+\; \tfrac{1}{2} \|b\|^2 \;-\; \tfrac{1}{2} \operatorname{tr}(M). \tag{7.2} \]

Le premier terme \(\tfrac{1}{2} x^\top M^2 x\) est une forme quadratique — il s'écrit \(\theta'^\top \mathrm{vec}(xx^\top)\) avec \(\theta' = \mathrm{vec}(\tfrac{1}{2}M^2)\). Le deuxième terme \(b^\top M x\) est linéaire — il s'écrit \(\beta'^\top x\) avec \(\beta' = M^\top b = M b\). Les deux derniers termes sont constants. Donc

\[ \mathcal{L}(f) \;\in\; \mathrm{Span}\{\varphi_1, \ldots, \varphi_{d^2+d},\, 1\} \;=\; \mathcal{A}. \tag{7.3} \]

Corollaire 7.1 (fermeture quadratique). La statistique \(\varphi(x) = (\mathrm{vec}(xx^\top), x)\) satisfait \((\dagger)\) : l'opérateur \(\mathcal{L}\) envoie \(\mathrm{Span}\{\varphi_i\}\) dans \(\mathcal{A}\). La stabilité Q1 pour cette \(\varphi\) est donc impliquée par la preuve analytique ci-dessus (§3–4) et par la fermeture algébrique \((\dagger)\) — les deux points de vue concordent.

7.3. Identification des coefficients \(\alpha, \beta, \gamma, \delta\)

En reprenant la notation de von-Neumann (Proposition \((\dagger)\)) avec \(G_{ij} \in \mathcal{A}\) et \(H_i \in \mathcal{A}\), le calcul (7.2) fournit :

Terme Expression Coefficients dans \(\mathcal{A}\)
\(G(\theta, \theta)(x) = |\nabla f|^2 = |Mx+b|^2\) \(x^\top M^2 x + 2 b^\top M x + |b|^2\) \(\mathrm{vec}(M^2) \cdot \mathrm{vec}(xx^\top) + 2 (Mb)^\top x + |b|^2\)
\(H(\theta)(x) = \theta^\top \Delta\varphi = \operatorname{tr}(M)\) \(\operatorname{tr}(M)\) coefficient sur \(1\) : \(\operatorname{tr}(M)\)

Chaque terme est bien dans \(\mathcal{A}\) avec coefficients polynomiaux en \(\theta\) (quadratiques pour \(G\), linéaires pour \(H\)). La fermeture bilinéaire-en-\(\theta\) de \((\dagger)\) est donc effectivement réalisée.

7.4. Dérivation de la Riccati depuis \((\dagger)\)

L'équation (6) du problème impose, pour tout \(x\), \[ \dot\theta_t^\top \varphi(x) + \tfrac{d}{dt}\log Z_{\theta_t} \;=\; -\mathcal{L}(\theta_t^\top \varphi)(x) + \text{(correction de normalisation)}. \] En substituant (7.2) et en identifiant composante par composante sur la base \(\{\mathrm{vec}(xx^\top), x, 1\}\) (prise au sens symétrisé pour la première, cf. Remarque 1.1) :

Remarque 7.2 (vérification directe de \(\frac{d}{ds}\log Z\)). Sur \(\Theta^\star\), \[ \log Z_{\theta} \;=\; \tfrac{d}{2}\log(2\pi) \;-\; \tfrac{1}{2}\log\det(M) \;+\; \tfrac{1}{2} b^\top M^{-1} b. \] Dérivation le long du flot (6.2) avec \(s = \sigma^2\) :

  1. Terme \(\log\det\). \(\frac{d}{ds}\log\det(M_s) = \operatorname{tr}(M_s^{-1}\dot M_s) = \operatorname{tr}(M_s^{-1}(-M_s^2)) = -\operatorname{tr}(M_s)\). Donc \(\frac{d}{ds}[-\tfrac{1}{2}\log\det M_s] = \tfrac{1}{2}\operatorname{tr}(M_s)\).

  2. Terme \(\tfrac{1}{2} b^\top M^{-1} b\). \(\frac{d}{ds}M_s^{-1} = -M_s^{-1}\dot M_s M_s^{-1} = M_s^{-1}M_s^2 M_s^{-1} = I\). Donc \(\frac{d}{ds}(b_s^\top M_s^{-1}b_s) = 2\dot b_s^\top M_s^{-1} b_s + b_s^\top I b_s = -2\|b_s\|^2 + \|b_s\|^2 = -\|b_s\|^2\) (via \(\dot b_s = -M_s b_s\)). D'où \(\frac{d}{ds}[\tfrac{1}{2} b_s^\top M_s^{-1} b_s] = -\tfrac{1}{2}\|b_s\|^2\).

En sommant : \(\frac{d}{ds}\log Z_s = \tfrac{1}{2}\operatorname{tr}(M_s) - \tfrac{1}{2}\|b_s\|^2\). Cohérent avec l'identification par (6). \(\blacksquare\)

Ceci confirme l'équivalence :

\[ \text{Flot Riccati (6.2)} \;\Longleftrightarrow\; \text{Condition de fermeture $(\dagger)$} \;\Longleftrightarrow\; \text{Stabilité (Q2.⋆)}. \]


8. Synthèse

La statistique quadratique \(\varphi(x) = (\mathrm{vec}(xx^\top), x)\) donne lieu à une famille exponentielle \(\{p_\theta : M(\theta) \succ 0\}\) qui est :

  1. Stable par convolution gaussienne — la reparamétrisation est la formule fermée \(\tilde M = M(I+\sigma^2 M)^{-1}\), \(\tilde b = (I+\sigma^2 M)^{-1} b\) (§4, équation Q2.⋆), obtenue par Fourier + Woodbury.

  2. Préservant le cône SPD\(M \succ 0 \Rightarrow \tilde M \succ 0\) (Proposition 5.2).

  3. Injective mais non surjective — l'image stricte \(\{\tilde M \prec \sigma^{-2} I\}\) (Proposition 5.4) exprime l'irréversibilité du lissage : un bruit gaussien ajouté ne se retire pas.

  4. Riccati matricielle — le flot \(s \mapsto (M_s, b_s)\) obéit \(\dot M_s = -M_s^2\), \(\dot b_s = -M_s b_s\) (Proposition 6.1), avec solution explicite \(M_s = M_0(I+sM_0)^{-1}\), \(b_s = (I+sM_0)^{-1}b_0\).

  5. Cohérente avec la fermeture algébrique \((\dagger)\) — l'opérateur \(\mathcal{L}(f) = \tfrac{1}{2}\|\nabla f\|^2 - \tfrac{1}{2}\Delta f\) appliqué à \(f = \tfrac{1}{2}x^\top M x + b^\top x\) reste dans \(\mathrm{Span}\{\varphi_i, 1\}\) (équation 7.3), conformément à la Proposition \((\dagger)\) du panel.

Redondance non résolue (à verrouiller dans Q1a). La statistique \(\mathrm{vec}(xx^\top)\) est de dimension \(d^2\) au lieu de la dimension canonique \(d(d+1)/2\). L'application \(\theta \mapsto \tilde\theta\) est donc bien définie sur les variables canoniques \((M, b)\) (Remarque 1.1) ; sa levée à \(\mathbb{R}^{d^2+d}\) passe par un choix (symétrisation \(T \mapsto (T+T^\top)/2\)). Pour obtenir une famille exponentielle minimale (et donc une reparamétrisation unique), il faut restreindre à \(\theta \in \mathrm{Sym}_d \times \mathbb{R}^d\) ou paramétriser \(\varphi\) via la base canonique des symétriques (coefficients \((x_i^2)_i\) et \((x_i x_j)_{i < j}\)). Cette question d'identifiabilité est du ressort de Q1c (cf. synthèse §3, D2).

Scope atteint. La Q2 est close : tous les pas sont justifiés, la symétrisation est explicite, la Riccati est vérifiée par calcul direct, la cohérence avec \((\dagger)\) est établie. Pas de raisonnement circulaire détecté dans la chaîne §1–§7 (le calcul Fourier est autonome ; la vérification \((\dagger)\) est découplée).


Annexe A. Rappel de la formule de Woodbury générale

Pour référence, le Lemme 4.1 est un cas particulier de l'identité matricielle de Woodbury :

\[ (A + UCV^\top)^{-1} \;=\; A^{-1} \;-\; A^{-1} U (C^{-1} + V^\top A^{-1} U)^{-1} V^\top A^{-1}, \tag{A.1} \]

valide lorsque \(A, C, A + UCV^\top\) sont inversibles. Avec \(A = M^{-1}\), \(U = V = I\), \(C = \sigma^2 I\) : \((M^{-1} + \sigma^2 I)^{-1} = M - M(\sigma^{-2} I + M)^{-1} M = M(I + \sigma^2 M)^{-1}\) après simplification. La forme « commutative » du Lemme 4.1 évite de passer par (A.1) générale, plus lourde.

Annexe B. Cas scalaire \(d = 1\)

Pour \(d = 1\), \(M = m > 0\), \(b = \beta \in \mathbb{R}\) :

\[ \tilde m \;=\; \frac{m}{1 + \sigma^2 m}, \qquad \tilde \beta \;=\; \frac{\beta}{1 + \sigma^2 m}. \tag{B.1} \]

Riccati scalaire : \(\dot m_s = -m_s^2\), solution \(m_s = m_0/(1 + s m_0)\). Cette formule est la projection unidimensionnelle de (Q2.⋆) et se vérifie à la main par convolution de deux gaussiennes \(\mathcal{N}(\mu, 1/m) \ast \mathcal{N}(0, \sigma^2) = \mathcal{N}(\mu, 1/m + \sigma^2)\) — précision de la somme \(\tilde m = (1/m + \sigma^2)^{-1} = m/(1+\sigma^2 m)\). Sanity check complet.