📝 Notes de Présentation — Contrôleur Neuro-FOPID

Rayane Akkouche | UMMTO 2025–2026

Ces notes contiennent ce que tu dois expliquer à l’oral et qui ne figure pas dans les slides : le “pourquoi” derrière chaque choix, les intuitions physiques, les détails mathématiques développés, et les réponses aux questions probables du jury.

Diapo 1 — Page de titre

À dire : Présente-toi brièvement (nom, spécialité, encadrante). Annonce l’enjeu en une phrase avant même de commencer :

“L’idée centrale de ce travail est simple : les contrôleurs PID fractionnaires sont meilleurs que les PID classiques, mais difficiles à régler. On va utiliser un réseau de neurones pour résoudre ce problème de réglage automatiquement.”

Diapo 2 — Plan

À dire : La structure est volontairement en deux temps. La première partie pose les briques théoriques — elle peut sembler dense, mais elle est nécessaire pour comprendre les choix de conception. La deuxième partie est la contribution originale. Insiste sur la contribution principale dès maintenant pour orienter l’attention du jury :

“Le fil conducteur : le FOPID a une propriété remarquable appelée iso-amortissement. Le réseau de neurones va apprendre à exploiter cette propriété automatiquement, en temps réel, pour n’importe quelle condition de fonctionnement du véhicule.”

Diapo 4 — Contexte et Motivation

Pourquoi le PID domine l’industrie (à développer à l’oral) : Le PID a survécu parce qu’il est simple, robuste, et interprétable : Kp agit sur l’amplitude de l’erreur, Ki sur son accumulation dans le temps, Kd sur sa vitesse de variation. Un technicien peut l’intuiter. Sa part de 97 % en industrie n’est pas un hasard.

Pourquoi il devient insuffisant ici (à développer) : Un véhicule hybride n’est pas un système linéaire stationnaire. Sa masse change (passagers, chargement), la pente de la route varie, la température du moteur influe sur ses performances. Le PID réglé pour une condition nominale se dégrade quand les conditions changent, car ses paramètres sont fixes.

Intuition physique sur les minima locaux : Imagine une surface de coût à 5 dimensions (une par paramètre du FOPID). SQP et Nelder-Mead partent d’un point et descendent vers la vallée la plus proche — qui n’est pas forcément la plus basse. Le multi-start atténue ça, mais ça reste coûteux à chaque changement de condition. L’idée neuronale : entraîner une fois, puis inférer instantanément.

Diapo 5 — Objectif

Le problème inverse (à expliquer clairement) : L’optimisation classique résout : “pour ces paramètres de véhicule, quels sont les meilleurs paramètres FOPID ?” C’est coûteux (~15 min par condition avec fmincon). Le réseau de neurones, une fois entraîné, résout le même problème en moins d’une milliseconde — c’est une approximation de la fonction inverse, apprise par supervision.

Pourquoi MATLAB + FOMCON : FOMCON (Fractional Order Modeling and CONtrol) est la boîte à outils MATLAB dédiée au calcul fractionnaire. Elle implémente l’approximation d’Oustaloup, les fonctions de transfert d’ordre non entier, et les outils d’optimisation FOPID. Sans elle, implémenter sα de zéro serait très complexe.

Diapo 7 — Opérateurs Différentiels Fractionnaires

L’intuition derrière le calcul fractionnaire (indispensable à l’oral) : En calcul entier, dériver deux fois une fonction donne sa dérivée seconde — un bond discret. Le calcul fractionnaire permet de “dériver 1,5 fois”, c’est-à-dire d’interpoler continûment entre la dérivée et la dérivée seconde. Ce n’est pas de la magie : c’est une généralisation mathématique rigoureuse qui passe par l’intégrale de convolution avec un noyau en loi de puissance.

Pourquoi la mémoire longue est importante : L’intégrale fractionnaire a un noyau (t−τ)^(α−1) qui décroît lentement. Ça signifie que toute l’histoire passée du signal contribue à la valeur actuelle — avec un poids qui diminue graduellement. C’est différent d’un intégrateur entier où tout le passé est pondéré uniformément. Cette “mémoire longue” est particulièrement adaptée aux systèmes avec viscoélasticité ou diffusion — et au comportement des véhicules sur route variable.

Caputo plutôt que Riemann-Liouville (à justifier) : La définition de Caputo utilise la dérivée entière à l’intérieur de l’intégrale, ce qui permet d’utiliser des conditions initiales physiques classiques (position initiale, vitesse initiale). Riemann-Liouville nécessite des conditions initiales d’ordre fractionnaire, difficiles à mesurer en pratique. C’est pourquoi Caputo est universellement préféré en automatique.

L’exemple numérique : D^(2,3) t³ ≈ 6,603 t^(0,7). Contraste avec D² t³ = 6 et D³ t³ = 6 (constant). La dérivée d’ordre 2,3 donne un résultat intermédiaire qui varie encore avec t — c’est ça l’ordre fractionnaire : ni la constante de D³, ni la droite de D².

Diapo 8 — Approximation d’Oustaloup

Pourquoi approximer sα (à expliquer) : L’opérateur sα est irrationnel — il ne peut pas s’exprimer comme un rapport de polynômes. Les systèmes de contrôle numériques (microcontrôleurs, DSP) ne peuvent implémenter que des fonctions de transfert rationnelles. Oustaloup propose une approximation par un produit de pôles et zéros réels, répartis logarithmiquement sur une bande de fréquences.

Comment lire le diagramme de Bode (à commenter) :

En gain : la droite bleue (idéal) a une pente de 20α dB/décade = 10 dB/décade pour α=0,5. L’approximation d’ordre 5 colle parfaitement sur [10⁻², 10²].
En phase : l’idéal est une ligne horizontale à 45° (pour α=0,5). C’est cette platitude de la phase qui garantit l’iso-amortissement. L’approximation l’atteint sur la bande utile mais oscille aux extrêmes.

Choix N=5 : Un ordre 5 donne (2×5+1)=11 pôles/zéros et offre un bon compromis précision/complexité. Des ordres plus élevés n’apportent pas de gain significatif sur la bande utile et alourdissent le calcul.

Diapo 9 — Iso-amortissement

L’intuition physique de l’iso-amortissement (point clé du travail) : Imagine que tu règles ton FOPID pour un véhicule à vide (m=1000 kg). Maintenant tu charges 400 kg de marchandises. Le gain de la boucle ouverte change (la dynamique est différente). Avec un PID, le dépassement changerait significativement. Avec un FOPID bien conçu, le dépassement reste le même — c’est l’iso-amortissement. La propriété tient parce que la phase de L(jω) est constante sur toute la bande.

Deux paramètres indépendants — l’avantage clé : λ et τc permettent de régler séparément l’amortissement et la rapidité, ce que le PID ne peut pas faire (ses trois paramètres sont couplés). En pratique, tu choisis d’abord le dépassement toléré (fixe λ), puis tu ajustes la rapidité voulue (fixe τc), sans que l’un interfère avec l’autre.

Formule du dépassement : Mp ≈ 0,8λ(λ+0,25). Pour λ=0,5 : Mp ≈ 30%. Pour λ=0,9 : Mp ≈ 74%… Attends — ça semble élevé ? Non, car le paramètre λ ici est celui de la boucle ouverte idéale L(s) = 1/(τc·s^(λ+1)), donc l’exposant de s est λ+1. Un λ→0 donne un intégrateur pur (beaucoup de dépassement), λ→1 donne un double intégrateur (instable). Les valeurs pratiques sont λ ∈ [0,5 ; 0,9].

Diapo 11 — Du PID Classique au FOPID

Pourquoi λ et µ changent tout : Dans CFOPID(s) = Kp + Ki/s^λ + Kd·s^µ :

λ contrôle l’intégrateur : λ=1 → intégrateur classique, λ<1 → intégrateur “plus doux” qui accumule l’erreur moins agressivement → moins de dépassement
µ contrôle le dérivateur : µ=1 → dérivateur classique (amplifie le bruit), µ<1 → dérivateur “amorti” moins sensible aux hautes fréquences → meilleure robustesse au bruit

La généralisation : Le PID classique est un cas particulier du FOPID avec λ=µ=1. L’espace (λ,µ) est un continuum — on explore une surface de solutions plutôt qu’un point.

Exemple de valeurs obtenues : Le FOPID optimal trouvé ici a λ=0,90 et µ=1,15. λ<1 donne un intégrateur plus doux (moins de dépassement), µ>1 donne un dérivateur renforcé (récupération plus rapide des perturbations).

Diapo 12 — Méthodes d’Optimisation

Détail sur la fonction de coût utilisée (slide 22) : J = ITSE + 2,0·[max(0, δOS−2%)]² + 5,0·t90 + 30·|εss|

Cette formule est délibérément asymétrique : le dépassement n’est pénalisé que s’il dépasse 2% (via max(0,·)), l’erreur statique est fortement pénalisée (×30) car l’erreur de vitesse à long terme est inacceptable en conduite. Ce n’est pas un ISE pur — c’est un critère composé aligné sur les specs réelles du cahier des charges.

Pourquoi multi-start : 5 lancements aléatoires de fmincon pour le modèle Profond, 2 pour le Simple. On garde le meilleur résultat. Ça réduit la probabilité de se bloquer sur un mauvais minimum local, au prix d’un temps de calcul multiplié.

Différence ISE vs ITAE :

ISE pénalise fortement les grandes erreurs (carré) → favorise une réponse rapide même avec un peu de dépassement
ITAE pondère par le temps → pénalise surtout les erreurs qui persistent longtemps → meilleur en régime établi Le choix de ITSE dans J combine les deux : pénalise les grandes erreurs tardives.

Diapo 14 — MLP et Fonctions d’Activation

Pourquoi ReLU et pas sigmoïde (à justifier) : La sigmoïde sature pour des entrées grandes — son gradient tend vers 0, ce qui provoque le “vanishing gradient problem” dans les réseaux profonds : les couches lointaines n’apprennent plus. ReLU n’a pas ce problème (gradient = 1 pour x>0). Pour le réseau Simple (une couche cachée), ça aurait peu d’impact, mais pour le Profond (3 couches), c’est critique.

Le théorème d’approximation universelle — ce qu’il dit vraiment : Hornik (1989) dit qu’un MLP à UNE couche cachée avec suffisamment de neurones peut approximer n’importe quelle fonction continue. Mais “suffisamment” peut vouloir dire des millions de neurones. En pratique, les réseaux profonds apprennent des représentations hiérarchiques plus efficacement avec moins de paramètres totaux — d’où les deux architectures testées.

Pourquoi 3 entrées (e, ∫e, ė) et pas juste e : Ces trois signaux correspondent exactement aux actions P, I et D du contrôleur. Le réseau reçoit ainsi toute l’information pertinente pour calculer les paramètres optimaux : la magnitude de l’erreur actuelle, son historique (intégrale), et sa tendance (dérivée). C’est une conception intentionnelle, pas arbitraire.

Diapo 15 — Rétropropagation

Adam vs descente de gradient classique (à détailler) : La descente de gradient classique utilise un taux d’apprentissage η unique pour tous les paramètres. Adam maintient une moyenne mobile du gradient (m) et de son carré (v) pour chaque paramètre. L’idée : si un paramètre a des gradients très variables, on réduit son taux d’apprentissage. Si ses gradients sont réguliers, on l’augmente. Résultat : convergence plus rapide et plus stable, surtout avec des gradients bruités.

Dropout — comment ça marche vraiment : À chaque mini-batch, on “éteint” aléatoirement 15% des neurones (taux utilisé ici). Ces neurones ne contribuent pas au forward pass et ne reçoivent pas de gradient au backward pass. L’effet : le réseau ne peut pas s’appuyer sur un sous-ensemble fixe de neurones → il doit distribuer la connaissance → généralisation meilleure. À l’inférence, tous les neurones sont actifs mais leurs sorties sont multipliées par (1−p) pour compenser.

Diapo 19 — Modèle du Véhicule

La non-linéarité √θ — pourquoi c’est un problème : La force motrice Fe1(θ) = F1 + γm·√θ contient une racine carrée. Ça signifie qu’un même incrément de papillon θ produit un effet très différent selon la position initiale. À faible ouverture (θ petit), √θ varie vite → grande sensibilité. À grande ouverture, √θ varie lentement → saturation. Un contrôleur linéaire à gains fixes ne peut pas gérer ça correctement sur toute la plage — il sera soit trop agressif à faible ouverture, soit trop lent à grande ouverture.

La force gravitationnelle Fg = mg·sin(φ) : Elle représente la résistance à la montée. Pour une pente de 5° et m=1000 kg : Fg ≈ 1000×9,81×sin(5°) ≈ 854 N. C’est une perturbation permanente qui change la valeur d’équilibre du papillon. Les tests de robustesse en pente sont directement liés à cette terme.

Pourquoi deux équations différentielles : La première (dynamique de vitesse) représente la mécanique du véhicule — Newton appliqué à la masse. La seconde (dynamique moteur) représente le délai de réponse mécanique/thermique du moteur : même si on change θ instantanément, la force effective Fe met τe=0,2 s à répondre. Ce retard est ce qui rend la commande délicate.

Spécifications difficiles à tenir simultanément : Tr < 1 s exige un système rapide → pousse vers des gains élevés → risque de dépassement. Mp < 10% exige un système amorti → pousse vers des gains modérés. Ces deux exigences sont contradictoires pour un PID classique. Le FOPID les découple via λ et µ.

Diapo 21 — Architecture Neuro-FOPID

Pourquoi la dérivée filtrée ėfilt et pas ė brute : La dérivée pure amplifie le bruit haute fréquence (c’est sa définition mathématique). En pratique, on filtre ė avec un filtre passe-bas avant de le donner au réseau. Ça évite que le réseau réagisse à des fluctuations de mesure plutôt qu’aux vraies dynamiques du système.

Choix des architectures — raisonnement :

Simple (3→10→5) : 10 neurones × 3 entrées + 10 biais (couche 1) + 5×10 + 5 biais (couche 2) = 95 paramètres. Suffisant pour une relation non-linéaire modérément complexe.
Profond (3→128→64→32→5) : 3×128 + 128×64 + 64×32 + 32×5 = 384 + 8192 + 2048 + 160 + biais ≈ 18 000 paramètres. Capacité bien supérieure, mais risque de surapprentissage → d’où le Dropout et L2.

Sortie linéaire (sans activation) : Les 5 sorties du réseau (Kp, Ki, λ, Kd, µ) sont des valeurs réelles non bornées en principe. Utiliser une activation sigmoïde ou tanh en sortie limiterait l’espace des valeurs accessibles. La couche linéaire laisse le réseau libre de prédire n’importe quelle valeur → la normalisation Z-score à l’entrée et la mise à l’échelle des cibles gèrent les plages.

Diapo 22 — Entraînement

La chaîne complète — pourquoi chaque étape est nécessaire :

Génération : on simule N conditions aléatoires tirées dans [m=600-1400 kg, α=2,4-7,2°, γ=8750-16250, r=32-55 cm]. Ça couvre l’espace des conditions opératoires réelles.
Optimisation FOPID : pour chaque condition, fmincon cherche les 5 paramètres qui minimisent J. C’est ici que la connaissance du “bon réglage” est générée — le réseau ne fait qu’apprendre à reproduire cette expertise offline.
Filtre de stabilité : une solution optimale au sens de J peut quand même être instable si fmincon a convergé vers une solution aberrante. Le filtre rejette les solutions avec pôles en demi-plan droit ou marge de phase insuffisante. Résultat : 713/1000 conditions acceptées pour le Profond — 28,7% rejetées. C’est important : ça garantit que le réseau n’apprend pas de “mauvais exemples”.
Normalisation Z-score : (x − μ)/σ pour chaque entrée/sortie. Sans ça, Kp (~1,7) et Ki (~0,01) auraient des magnitudes très différentes → le gradient serait dominé par les grandes valeurs → convergence biaisée.

Patience de 20 époques : Si la RMSE de validation ne s’améliore pas pendant 20 époques consécutives, l’entraînement s’arrête. Ça évite le surapprentissage et économise du temps. En pratique, le modèle Profond s’arrête à 49 époques et le Simple à 29 — bien avant les maxima de 300 et 150.

Diapo 23 — Résultats d’Entraînement

RMSE de 1,378 — est-ce bon ? (question probable du jury) : La RMSE est exprimée dans l’espace normalisé des sorties (Z-score). Sans connaître l’écart-type des cibles, ce chiffre seul ne dit pas grand-chose. Ce qui compte c’est la performance en boucle fermée — et les résultats de simulation (diapos 29-37) montrent que le réseau prédit des paramètres suffisamment bons pour obtenir les performances désirées. La RMSE est une métrique d’entraînement, pas de performance finale.

380 octets pour le Simple : 95 paramètres × 4 octets (float32) = 380 octets. Un STM32H7 a 1 Mo de RAM et 2 Mo de Flash — le réseau tient largement. Le temps d’inférence sur ce type de microcontrôleur est de l’ordre de quelques microsecondes pour 95 multiplications-additions.

Diapo 29 — Réponses Indicielles

Pourquoi le Neuro-FOPID est plus rapide que le FOPID classique à même dépassement : Le FOPID classique est réglé offline pour UNE condition nominale. Le Neuro-FOPID adapte ses paramètres à la condition exacte du moment. Au démarrage (erreur grande, intégrale nulle, dérivée grande), le réseau choisit des gains plus agressifs qu’en régime établi. C’est du gain scheduling implicite appris par le réseau.

La progression monotone PID → N-PID → FOPID → N-FOPID :

PID → N-PID : le réseau adapte les 3 paramètres classiques → amélioration modérée
N-PID → FOPID : la structure fractionnaire apporte l’iso-amortissement → saut qualitatif plus grand
FOPID → N-FOPID : l’adaptation neuronale sur 5 paramètres → amélioration supplémentaire Cela montre que les deux contributions (structure fractionnaire et adaptation neuronale) sont additives et indépendantes.

Diapo 30 — Gain Scheduling

Ce que les graphiques montrent vraiment :

Kp démarre haut (erreur grande → besoin de gain fort) puis descend vers la valeur de régime
Ki démarre bas (on ne veut pas accumuler d’intégrale trop vite au démarrage) puis monte
λ varie pour ajuster l’amortissement dynamiquement
Cette adaptation n’est pas programmée explicitement — elle est apprise par le réseau à partir des données d’optimisation

Comparaison Simple vs Profond : Les profils du Profond (bleu) sont plus “lisses” que ceux du Simple (orange) — le réseau plus profond fait une interpolation plus régulière dans l’espace des paramètres, ce qui explique le léger avantage en Mp (2,11% vs 2,23%).

Diapo 31 — Tableau Comparatif

Analyse des critères intégraux (à développer) :

ISE (carré de l’erreur) : pénalise les grandes erreurs transitoires. Le N-FO Simple gagne (0,2112) grâce à son transitoire plus court.
ITAE (erreur pondérée par le temps) : pénalise les erreurs tardives. N-FO Simple gagne massivement (0,2382 vs 1,0251 pour FOPID) car son ts plus court signifie que l’erreur reste non nulle moins longtemps.
ITSE : combine les deux. N-FO Simple = 0,0321, soit 4× moins que le FOPID classique.

Le chiffre le plus important du tableau : ts(N-FO Simple) = 1,185 s vs ts(PID) = 9,970 s. Le temps de régulation est 8,4× plus court. En conduite réelle, ça représente la différence entre un véhicule qui “flotte” pendant 10 secondes après chaque changement de vitesse, et un qui se stabilise en 1,2 seconde.

Diapo 35 — Robustesse à la Variation de Masse

Pourquoi le FOPID classique a une étendue PLUS grande que le PID (4,46 vs 4,04) : C’est contre-intuitif mais s’explique : le FOPID classique est réglé pour la condition nominale m=1000 kg. Sa propriété d’iso-amortissement fonctionne si les paramètres restent fixes. Mais quand la masse varie, le gain de la boucle change. Le FOPID classique maintient mieux la forme de la réponse (pas de grande oscillation), mais son dépassement absolu varie plus car ses paramètres ne s’adaptent pas. Le Neuro-FOPID, lui, recalcule les paramètres → l’étendue s’effondre à 0,72.

Étendue 0,72 vs 4,04 — signification pratique : Un véhicule peut passer de 600 kg (vide) à 1400 kg (plein chargement) — variation de ±40% par rapport à 1000 kg. Sur cette plage, le Neuro-FOPID Profond maintient le dépassement entre 1,48% et 2,20% — pratiquement constant. Le conducteur ne ressent aucune différence de comportement quelle que soit la charge.

Diapo 36 — Rejet de Perturbation

Ce que représente la perturbation +30% Fe : Une augmentation soudaine de 30% de la force motrice peut représenter : un coup de vent favorable, une descente soudaine, un changement de rapport de boîte de vitesse, ou un pic de charge de la batterie sur le moteur électrique. Ce sont des événements réels fréquents.

655 ms vs 1070 ms — signification : Le N-FO Simple récupère en 655 ms, soit 38% plus vite que le PID. En termes de sécurité active, si la perturbation provoque un dépassement de vitesse (ex. en zone limitée), le temps pour revenir à la consigne est critique. 400 ms de différence peut signifier plusieurs mètres de dépassement de vitesse.

Pourquoi le N-PID est le plus lent (1,325 s) : Paradoxalement plus lent que le PID classique en rejet de perturbation. La raison : le réseau N-PID a appris à minimiser l’ITSE sur le transitoire initial, pas spécifiquement sur le rejet de perturbation. C’est une limite de la stratégie de génération des données — les données d’entraînement ne comprenaient que des réponses à échelon, pas des tests de perturbation.

Diapo 37 — Rejet de Bruit

Pourquoi le N-FOPID est moins sensible au bruit que le PID : Le terme dérivateur du PID classique amplifie le bruit haute fréquence (c’est une propriété fondamentale de la dérivation). Avec µ < 1 dans le FOPID (ici µ ≈ 0,8–1,35 selon la condition), le dérivateur fractionnaire filtre naturellement les hautes fréquences tout en maintenant l’action dérivée utile sur les dynamiques lentes. Le réseau apprend à choisir µ de manière adaptative pour équilibrer réactivité et filtrage.

ISE bruité vs nominal : 0,2113 vs 0,2112 — à expliquer : La différence est de 0,0001 soit 0,005%. Le bruit gaussien σ=0,05 m/s représente environ 0,125% de la consigne de 40 m/s — c’est un bruit mesuré relativement faible. La quasi-identité des ISE confirme que le réseau ne surréagit pas au bruit : il ne l’amplifie pas dans son action de commande.

Diapo 39 — Contributions

Comment formuler la contribution lors de la soutenance :

“Ce travail apporte trois contributions. Premièrement, une méthodologie complète : on ne présente pas juste un réseau, mais toute la chaîne — génération de données, filtre de qualité, entraînement et validation. Deuxièmement, une étude d’ablation rigoureuse qui quantifie séparément ce que fait la structure fractionnaire et ce que fait le réseau de neurones — ça répond à la question ‘qu’est-ce qui contribue quoi ?‘. Troisièmement, une démonstration que la taille du réseau est secondaire — 95 paramètres suffisent, ce qui ouvre la voie à l’embarqué.”

Diapo 40 — Limitations et Perspectives

Sur la limitation “simulation seulement” : Le jury demandera probablement pourquoi on ne teste pas sur un banc réel. Réponse honnête : un banc d’essai pour véhicule hybride est coûteux et nécessite un partenariat industriel. La simulation avec le modèle non-linéaire complet est la meilleure alternative académique. Les tests de robustesse (±30% masse, bruit, perturbations) simulent en partie la variabilité réelle.

Sur les LSTM comme perspective : Un LSTM serait pertinent si on voulait que le réseau tienne compte de l’historique de la conduite (profil de route prédit, état de charge de la batterie). Pour la relation statique “état actuel → paramètres optimaux”, le MLP est théoriquement suffisant. Le LSTM ajouterait de la mémoire implicite — utile pour anticiper des changements (vitesse sur autoroute, approche d’une montée connue via GPS).

Sur les algorithmes génétiques : La principale limite de fmincon est la convergence locale. Les algorithmes génétiques maintiennent une population de solutions et explorent globalement l’espace → moins de risque de minimum local. Le prix : beaucoup plus lent (centaines à milliers d’évaluations). Acceptable offline pour générer les données d’entraînement.

Questions Probables du Jury

Q1 : Pourquoi ne pas utiliser directement un algorithme génétique ou par essaim de particules pour régler le FOPID en ligne ?

Ces algorithmes nécessitent des centaines à milliers d’évaluations de la fonction de coût, chacune impliquant une simulation. En temps réel (inférence en <1 ms nécessaire), c’est impossible. Le réseau de neurones déplace le coût computationnel à la phase offline d’entraînement.

Q2 : Comment garantit-on la stabilité de la boucle fermée avec le réseau ?

Le filtre de stabilité pendant la génération des données garantit que tous les paramètres FOPID appris sont associés à des systèmes stables. Si le réseau interpole correctement, les paramètres prédits restent dans la région de stabilité. Cependant, l’extrapolation hors de la plage d’entraînement n’est pas garantie — c’est une limitation réelle.

Q3 : Pourquoi le réseau Simple fait-il presque aussi bien que le Profond ?

La fonction à apprendre (3 entrées → 5 paramètres FOPID) n’est pas extraordinairement complexe. Le théorème d’approximation universelle s’applique dès une couche cachée. Avec 10 neurones et des données suffisantes (36 conditions après filtrage), le Simple peut capturer les non-linéarités essentielles. La complexité supplémentaire du Profond n’apporte que 4% de gain — son avantage se manifesterait sur des espaces de conditions plus larges ou des systèmes plus complexes.

Q4 : La normalisation Z-score des sorties — comment récupérez-vous les vrais paramètres FOPID ?

Pendant l’entraînement, les cibles (Kp, Ki, λ, Kd, µ) sont normalisées : y_norm = (y − μ_y)/σ_y. À l’inférence, on dénormalise : y = y_norm × σ_y + μ_y. Les statistiques μ_y et σ_y sont calculées sur le dataset d’entraînement et stockées avec le modèle.

Q5 : Avez-vous testé pour des consignes autres que r=40 m/s ?

Les données d’entraînement couvrent différentes conditions physiques (masse, pente, etc.) mais la consigne de référence est fixée à 40 m/s (soit ~144 km/h). L’extension à des profils de vitesse variables (cycle de conduite NEDC ou WLTC) est une perspective directe — il suffirait d’ajouter la consigne r comme quatrième entrée du réseau.

Q6 : Comment choisir λ et µ dans le FOPID optimal — y a-t-il une intuition ?

λ < 1 donne un intégrateur “doux” qui accumule moins agressivement → moins de dépassement mais erreur statique plus lente à éliminer. µ > 1 donne un dérivateur renforcé → réaction plus vive aux changements d’erreur → récupération de perturbation plus rapide. Les valeurs obtenues (λ=0,90, µ=1,15) reflètent bien le cahier des charges : Mp < 10% (λ proche de 1) et récupération rapide (µ > 1).

Bonne soutenance, Rayane ! Maîtrise bien les diapos 9 (iso-amortissement), 31 (tableau comparatif) et 35 (robustesse ×5,6) — ce sont les points que le jury interrogera le plus.

RayaneKch

Explorer

thesis defense notes