Notes de Présentation — Contrôleur Neuro-FOPID

Rayane Akkouche | UMMTO 2025–2026

Notes réécrites sur la base du fichier index.html mis à jour. Chaque section reprend le contenu exact de la diapositive, puis développe ce qu’il faut dire à l’oral et qui ne figure pas dedans : intuitions physiques, justifications des choix, chiffres à retenir, et réponses aux questions du jury.

Slide 1 — Titre

Ce qu’il faut dire : Présente-toi (nom, spécialité, encadrante), puis ancre immédiatement l’enjeu en une seule phrase avant même de commencer :

“L’idée centrale est simple : les contrôleurs PID fractionnaires sont meilleurs que les PID classiques, mais difficiles à régler. On va utiliser un réseau de neurones pour résoudre ce problème automatiquement.”

Ne pas lire la diapo — le jury la lit. Passe directement au plan.

Slide 2 — Plan de la présentation

Ce qu’il faut dire : La présentation est en deux temps volontairement. La première partie pose les briques théoriques nécessaires à la compréhension des choix. La seconde est la contribution originale.

Annonce le fil conducteur dès maintenant pour orienter le jury :

“Le FOPID a une propriété remarquable appelée iso-amortissement. Le réseau de neurones va apprendre à exploiter cette propriété automatiquement, en temps réel, pour n’importe quelle condition de fonctionnement du véhicule.”

Les trois fragments (Partie I, Partie II, Contribution principale) apparaissent progressivement — les laisser arriver, ne pas parler par-dessus.

Section I — Motivation & Problématique

Slide 4 — Contexte et Motivation

PID : pourquoi il domine (à développer à l’oral) : Le PID a survécu parce qu’il est simple, robuste et interprétable. Kp agit sur l’amplitude de l’erreur, Ki sur son accumulation, Kd sur sa vitesse. Un technicien peut l’intuiter. Sa part de 97 % en industrie n’est pas un hasard.

Pourquoi il échoue ici : Un véhicule hybride n’est pas un système linéaire stationnaire. La masse varie (passagers, chargement : 600 à 1400 kg), la pente de la route change, la température moteur influe sur les performances. Un PID réglé pour une condition nominale se dégrade dès que les conditions changent, car ses gains sont fixes.

L’intuition physique sur les minima locaux : Imagine une surface de coût à 5 dimensions, une par paramètre du FOPID. SQP et Nelder-Mead partent d’un point et descendent vers la vallée la plus proche — pas forcément la plus basse. Le multi-start atténue ça mais reste coûteux (~15 min par condition). L’idée neuronale : entraîner une fois, puis inférer en moins d’une milliseconde.

Slide 5 — Objectif du Travail

Le problème inverse (à expliquer clairement) : L’optimisation classique résout : “pour ces paramètres de véhicule, quels sont les meilleurs paramètres FOPID ?” C’est coûteux. Le réseau une fois entraîné résout le même problème instantanément — il apprend une approximation de la fonction inverse par supervision.

Pourquoi MATLAB + FOMCON : FOMCON (Fractional Order Modeling and CONtrol) est la boîte à outils MATLAB dédiée au calcul fractionnaire. Elle implémente l’approximation d’Oustaloup et les fonctions de transfert d’ordre non entier. Sans elle, implémenter sα de zéro serait très complexe.

Section II — Systèmes d’Ordre Fractionnaire

Slide 7 — Opérateurs Différentiels Fractionnaires

L’intuition du calcul fractionnaire (à dire absolument) : En calcul entier, on passe discrètement de la dérivée première à la dérivée seconde. Le calcul fractionnaire permet de “dériver 1,5 fois” — d’interpoler continûment entre les deux. Le noyau (t−τ)^(α−1) décroît lentement, ce qui donne au système une mémoire longue : toute l’histoire passée contribue à la valeur actuelle, avec un poids qui diminue graduellement.

Caputo plutôt que Riemann-Liouville : La définition de Caputo place la dérivée entière à l’intérieur de l’intégrale, ce qui permet d’utiliser des conditions initiales physiques classiques (position initiale, vitesse initiale). Riemann-Liouville nécessiterait des conditions initiales d’ordre fractionnaire, impossibles à mesurer en pratique. C’est pourquoi Caputo est universellement préféré en automatique.

L’exemple numérique : D^(2,3) t³ ≈ 6,603 t^(0,7). Contraste : D² t³ = 6t (une droite), D³ t³ = 6 (une constante). L’ordre 2,3 donne un résultat encore variable en t — ni la constante ni la droite, quelque chose d’intermédiaire. C’est ça le calcul fractionnaire.

La figure sur la droite (fig1_numberline.svg) : Elle illustre le continuum entre dérivation et intégration. Commenter visuellement que D¹ et I¹ sont les extrêmes entiers, et que tout l’espace intermédiaire est accessible.

Slide 8 — Approximation d’Oustaloup

Pourquoi approximer sα : L’opérateur sα est irrationnel — il ne s’exprime pas comme un rapport de polynômes. Les systèmes numériques ne peuvent implémenter que des fonctions rationnelles. Oustaloup approxime par un produit de (2N+1) pôles et zéros réels, répartis logarithmiquement.

Comment lire le diagramme de Bode (l’image bode_oustaloup.png) :

Gain : la droite idéale a une pente de 20α = 10 dB/décade pour α=0,5. L’approximation d’ordre 5 colle sur [10⁻², 10²].
Phase : l’idéal est une ligne horizontale à 45° pour α=0,5. C’est cette platitude de la phase qui garantit l’iso-amortissement. L’approximation l’atteint sur la bande utile mais diverge aux extrêmes.

Choix N=5 : (2×5+1) = 11 pôles/zéros. Bon compromis précision/complexité. Des ordres plus élevés n’apportent pas de gain significatif sur la bande utile.

Slide 9 — Iso-amortissement

L’intuition physique (point central du travail — à maîtriser parfaitement) : Imagine que tu règles ton FOPID pour un véhicule à vide (m=1000 kg). Tu charges 400 kg. Le gain de la boucle ouverte change. Avec un PID, le dépassement change significativement. Avec un FOPID bien conçu, le dépassement reste le même — c’est l’iso-amortissement. La raison : la phase de L(jω) est constante sur toute la bande fréquentielle, donc la marge de phase est invariante aux variations de gain.

Deux paramètres indépendants — l’avantage clé : λ et τc permettent de régler séparément l’amortissement et la rapidité. Le PID ne peut pas faire ça — ses trois gains sont couplés. En pratique : on choisit d’abord le dépassement toléré (fixe λ), puis on ajuste la rapidité (fixe τc), sans interférence.

Valeurs typiques : λ ∈ [0,5 ; 0,9] en pratique. Pour les valeurs obtenues dans ce travail : λ=0,90 → Mp ≈ 0,8×0,9×1,15 ≈ 0,83 %… À titre de référence, pas comme valeur absolue — le modèle simplifié Mp ≈ 0,8λ(λ+0,25) est une approximation.

Section III — Contrôleurs PID et FOPID

Slide 11 — Du PID Classique au FOPID

Ce que λ et µ changent vraiment :

λ < 1 : intégrateur “plus doux” qui accumule l’erreur moins agressivement → moins de dépassement. λ=0,90 dans les résultats.
µ > 1 : dérivateur renforcé qui réagit plus vite aux changements d’erreur → récupération de perturbation plus rapide. µ=1,15 dans les résultats.
µ < 1 aurait au contraire amorti l’action dérivée → moins de sensibilité au bruit.

La figure fig_lambda_mu_plane.svg : Elle montre que le plan (λ,µ) est un continuum. Le PID classique n’est qu’un point de ce plan (λ=µ=1). En explorant tout le plan, on accède à une famille de contrôleurs bien plus riche.

Slide 12 — Méthodes d’Optimisation

La fonction de coût J (à connaître par cœur) : J = ITSE + 2·[max(0, δOS−2%)]² + 5·t90 + 30·|εss|

Elle est asymétrique : le dépassement n’est pénalisé que s’il dépasse 2 % (via max(0,·)). L’erreur statique est fortement pénalisée (×30) car une erreur de vitesse permanente est inacceptable. ITSE combine pénalisation des grandes erreurs et des erreurs tardives.

Multi-start : 5 lancements aléatoires de fmincon pour le Profond, 2 pour le Simple. On garde le meilleur. Réduit la probabilité de minima locaux au coût d’un temps de calcul multiplié.

Différence ISE / ITAE / ITSE :

ISE = ∫e² : pénalise les grandes erreurs (transitoire)
ITAE = ∫t|e| : pénalise les erreurs tardives (régime établi)
ITSE = ∫te² : combine les deux → utilisé dans J

Section IV — Réseaux de Neurones Artificiels

Slide 14 — MLP et Fonctions d’Activation

Pourquoi ReLU et pas sigmoïde (à justifier si on te le demande) : La sigmoïde sature pour des entrées grandes → gradient → 0 = “vanishing gradient”. Les couches lointaines n’apprennent plus. ReLU a un gradient = 1 pour x > 0, essentiel pour le réseau Profond qui a 3 couches cachées.

Théorème d’approximation universelle — ce qu’il dit vraiment : Une couche cachée suffit théoriquement, mais “suffisamment de neurones” peut vouloir dire des millions. En pratique, les réseaux profonds apprennent des représentations hiérarchiques plus efficacement avec moins de paramètres totaux. C’est la justification des deux architectures testées.

Pourquoi 3 entrées (e, ∫e, ė) : Ce n’est pas un hasard — elles correspondent exactement aux actions P, I, D du contrôleur. Le réseau reçoit toute l’information nécessaire pour décider des paramètres optimaux : magnitude actuelle (e), historique (∫e), tendance (ė). La figure fig2_mlp.svg montre l’architecture.

Slide 15 — Rétropropagation du Gradient

Adam vs descente de gradient classique : La descente classique utilise un taux η unique pour tous les paramètres. Adam maintient une moyenne mobile du gradient (m) et de son carré (v) par paramètre. Si les gradients d’un paramètre sont très variables, son taux diminue. S’ils sont réguliers, il augmente. Résultat : convergence plus rapide et plus stable, surtout sur des gradients bruités.

Dropout — comment ça fonctionne vraiment : À chaque mini-batch, 15 % des neurones sont “éteints”. Ils ne calculent rien en forward et ne reçoivent pas de gradient en backward. Le réseau ne peut pas s’appuyer sur un sous-ensemble fixe → il distribue la connaissance → meilleure généralisation. À l’inférence, tous actifs mais leurs sorties sont multipliées par (1−p) = 0,85 pour compenser.

Slide 16 — Méthodes Neuronales de Commande

Pourquoi présenter les 4 méthodes : Pour montrer que l’auto-ajustement de PID (méthode 4) n’est pas la seule option — et justifier pourquoi c’est celle retenue. La commande directe (méthode 1) est fragile car le réseau apprend l’inverse d’un modèle jamais parfait. Les MRAC (méthodes 2 et 3) nécessitent un modèle de référence parfaitement défini et une identification en temps réel. L’auto-ajustement de contrôleur est le meilleur compromis : stabilité du PID classique + adaptation neuronale des gains.

Extension au FOPID (la contribution) : La méthode 4 classique ajuste (Kp, Ki, Kd). La contribution ici est de l’étendre à (Kp, Ki, λ, Kd, µ) — 5 paramètres dont deux sont d’ordre fractionnaire. C’est ce qui n’avait jamais été fait dans ce contexte avec l’objectif d’iso-amortissement.

Section V — Modélisation du Véhicule Électrique

Slide 18 — Architecture du Véhicule Hybride

Architecture hybride parallèle : Les deux moteurs sont couplés sur le même arbre de transmission. Le moteur thermique est la source principale, l’électrique est en assistance. Le schéma fig4_hev.svg montre la chaîne complète : batterie → onduleur → moteur électrique → boîte de vitesse → roues, avec le moteur thermique branché en parallèle via le papillon.

Ce qu’on contrôle : On ne contrôle pas directement la vitesse — on contrôle l’angle du papillon θ qui détermine la quantité d’air (et donc de carburant) admise dans le moteur thermique. La vitesse v(t) en est la conséquence indirecte à travers la dynamique mécanique du véhicule.

Slide 19 — Modèle Mathématique

La non-linéarité √θ (à expliquer) : Fe1(θ) = F1 + γm√θ. La racine carrée signifie qu’à faible ouverture du papillon, une petite variation de θ produit un grand effet sur la force. À grande ouverture, l’effet est beaucoup plus faible. Un contrôleur à gains fixes ne peut pas bien gérer ça sur toute la plage — il sera trop agressif à faible ouverture ou trop lent à grande ouverture.

Pourquoi deux équations différentielles : La première (dynamique vitesse) = Newton appliqué à la masse du véhicule. La seconde (dynamique moteur) = le retard de réponse mécanique/thermique : même si on change θ instantanément, la force effective Fe met τe = 0,2 s à suivre. Ce délai est ce qui rend la commande délicate.

Fg = mg sin(φ) : Pour une pente de 5° et m=1000 kg, Fg ≈ 854 N. C’est une perturbation permanente qui change le point d’équilibre du papillon. Les tests de robustesse en pente correspondent à cette variation.

Contradiction Tr < 1s et Mp < 10 % : Ces deux specs sont naturellement contradictoires pour un PID classique : la rapidité pousse vers des gains élevés (risque de dépassement), l’amortissement pousse vers des gains faibles. Le FOPID les découple via λ (amortissement) et τc (rapidité).

Le schéma Simulink (simulink.png) : Montrer brièvement sans s’y attarder — il confirme l’implémentation réelle du modèle non-linéaire complet avec la racine carrée, les deux intégrateurs, la traînée aérodynamique.

Section VI — Architecture du Contrôleur Neuro-FOPID

Slide 21 — Architecture Neuro-FOPID

Pourquoi ė filtrée et pas ė brute : La dérivée pure amplifie le bruit haute fréquence par définition mathématique. En pratique, on filtre ė par un passe-bas avant de l’envoyer au réseau — sinon le réseau réagirait aux fluctuations de mesure plutôt qu’aux vraies dynamiques.

Simple (3→10→5) — calcul des paramètres : Couche 1 : 3×10 + 10 = 40 poids + biais. Couche 2 : 10×5 + 5 = 55. Total = 95 paramètres. La figure fig5_nfopid_simple.svg montre l’architecture.

Profond (3→128→64→32→5) — calcul : 3×128 + 128×64 + 64×32 + 32×5 = 384 + 8192 + 2048 + 160 + biais ≈ 18 000 paramètres. La figure fig6_nfopid_deep.svg.

Sortie linéaire (sans activation) : Les 5 sorties (Kp, Ki, λ, Kd, µ) sont des valeurs réelles positives sans borne stricte. Une activation sigmoïde ou tanh en sortie limiterait l’espace accessible. La couche linéaire laisse libre. La normalisation Z-score à l’entraînement gère les plages de valeurs.

Slide 22 — Entraînement du Réseau

Étape 1 — Génération des données : On simule N conditions tirées aléatoirement dans les plages : masse [600–1400 kg], pente [2,4–7,2°], gain moteur [8750–16250], rayon de roue [32–55 m/s]. Ça couvre l’espace des conditions réelles du véhicule.

Étape 2 — Optimisation FOPID : Pour chaque condition, fmincon cherche les 5 paramètres qui minimisent J. C’est ici que la connaissance du “bon réglage” est produite. Le réseau ne fait qu’apprendre à reproduire cette expertise offline.

Étape 3 — Filtre de stabilité : Une solution optimale au sens de J peut quand même être instable si fmincon a mal convergé. Le filtre rejette les solutions avec pôles en demi-plan droit, marge de phase < 45°, ou dépassement > 35 %. Résultat : 713/1000 conditions acceptées = 28,7 % rejetées. C’est important : le réseau n’apprend que des “bons exemples”.

Étape 4 — Normalisation Z-score : (x − μ)/σ pour chaque entrée et sortie. Sans ça, Kp (~1,7) et Ki (~0,01) ont des magnitudes très différentes → le gradient est dominé par les grandes valeurs → convergence biaisée.

Étape 5 — Patience 20 époques : Si la RMSE de validation ne s’améliore pas pendant 20 époques, l’entraînement s’arrête. Le Profond s’arrête à 49 époques, le Simple à 29 — bien avant les maxima de 300 et 150.

Slide 23 — Résultats d’Entraînement

RMSE de 1,378 — est-ce bon ? (question probable) : La RMSE est en espace Z-score (normalisé). Ce chiffre seul ne dit pas grand-chose. Ce qui compte, c’est la performance en boucle fermée — et les résultats montrent que les paramètres prédits sont suffisamment bons. La RMSE est une métrique d’entraînement, pas de performance finale.

380 octets pour le Simple : 95 paramètres × 4 octets (float32) = 380 octets. Un STM32H7 a 1 Mo de RAM et 2 Mo de Flash — le réseau tient largement. Temps d’inférence : de l’ordre de quelques microsecondes pour 95 multiplications-additions.

713/1000 acceptées : Le filtre a rejeté 287 conditions, soit près de 30 %. C’est un choix de qualité sur la quantité — mieux vaut entraîner sur 713 bons exemples que sur 1000 avec du bruit.

Section VII — Résultats de Simulation

Slide 25 — PID Optimal

Ce qu’il faut dire : Le PID optimal (Kp=0,5465, Ki=0,1090, Kd=0,1159) est la baseline de référence. Il est réglé par fmincon pour la condition nominale m=1000 kg, pente nulle. Le schéma fig7a_pid.svg montre le bloc-diagramme en boucle fermée avec ce contrôleur. C’est le point de départ de toute la comparaison.

Slide 26 — FOPID Optimal

Ce qu’il faut dire : Le FOPID optimal (Kp=0,70, Ki=0,01, λ=0,90, Kd=0,03, µ=1,15) est la référence fractionnaire. λ=0,90 (intégrateur légèrement doux, moins de dépassement), µ=1,15 (dérivateur légèrement renforcé, récupération plus rapide). Ces valeurs sont obtenues par fmincon multi-start depuis la condition nominale. Le schéma fig7b_fopid.svg montre le contrôleur avec les blocs fractionnaires 1/sλ et sµ.

Slide 27 — Neuro-PID

Ce qu’il faut dire : Le Neuro-PID (3→10→3, ~73 paramètres) est le contrôle neuronal de référence — même idée que le Neuro-FOPID mais avec un PID classique sous-jacent. Il sert à isoler la contribution de la structure fractionnaire : si N-FOPID fait mieux que N-PID, c’est grâce au fractionnaire et pas juste au réseau.

Slide 28 — Neuro-FOPID

Ce qu’il faut dire : La contribution principale. Le réseau calcule les 5 paramètres du FOPID en ligne. Deux variantes : Simple (~95 params, RMSE=1,378) et Profond (~18 000 params, RMSE=1,524). Paradoxalement, le Simple a un RMSE de validation meilleur — avec moins de données (36/50 vs 713/1000 acceptées), le Profond est plus difficile à entraîner. Mais les deux donnent d’excellents résultats en boucle fermée. Le schéma fig7d_neurofopid.svg montre le RNA en parallèle du contrôleur FOPID.

Slide 29 — Réponses Indicielles — Comparaison Nominale

La progression monotone (à articuler clairement) : PID → N-PID → FOPID → N-FOPID. Chaque étape améliore :

PID → N-PID : le réseau adapte 3 paramètres → amélioration modérée
N-PID → FOPID : la structure fractionnaire apporte l’iso-amortissement → saut qualitatif plus important
FOPID → N-FOPID : adaptation neuronale sur 5 paramètres → amélioration supplémentaire

Cela prouve que les deux contributions (structure fractionnaire et adaptation neuronale) sont additives et indépendantes.

Pourquoi le Neuro-FOPID est plus rapide que le FOPID classique : Le FOPID classique est réglé offline pour la condition nominale. Le Neuro-FOPID adapte ses paramètres à la condition exacte du moment. Au démarrage (grande erreur), il choisit des gains plus agressifs. En régime établi, il les réduit. C’est du gain scheduling implicite appris par le réseau.

Le zoom transitoire (fig2_transient_zoom.png) : Insister sur ce graphique — il montre que sur les 500 premières millisecondes, l’écart entre les contrôleurs est très visible. Le N-FOPID monte plus vite et dépasse beaucoup moins.

Slide 30 — Ajustement Adaptatif des Paramètres

Ce que les courbes montrent (fig5_gain_scheduling.png) :

Kp démarre haut (erreur grande → besoin de gain fort) puis descend vers la valeur de régime
Ki démarre bas (éviter d’accumuler de l’intégrale trop tôt) puis monte
λ varie pour ajuster l’amortissement dynamiquement selon la phase du transitoire
Le Profond (bleu) donne des courbes plus lisses que le Simple (orange) — interpolation plus régulière dans l’espace des paramètres, d’où son léger avantage en Mp (2,11 % vs 2,23 %)

Ce qu’il ne faut pas dire : Cette adaptation n’est pas explicitement programmée — elle est apprise à partir des données d’optimisation. Le réseau a intériorisé la logique du réglage optimal pour chaque état.

Slide 31 — Tableau Comparatif

Chiffres à connaître par cœur :

Mp : 9,75 % (PID) → 2,11 % (N-FO Profond) — réduction de 78 % au total
ts : 9,970 s (PID) → 1,150 s (N-FO Profond) — 8,7× plus court
ITSE : 0,2225 (PID) → 0,0321 (N-FO Simple) — 7× plus faible

Le chiffre le plus parlant en termes concrets : ts = 9,97 s pour le PID vs 1,15 s pour le Neuro-FOPID. En conduite réelle, c’est la différence entre un véhicule qui “flotte” pendant 10 secondes après chaque changement de vitesse et un qui se stabilise en un peu plus d’une seconde.

Pourquoi N-FO Simple gagne plus de critères que N-FO Profond : Sur ISE, IAE, ITAE, ITSE, le Simple est meilleur. Le Profond ne gagne que sur Mp et ts. Explication probable : avec moins de données d’entraînement acceptées (36 vs 713), le Simple a appris sur un dataset plus petit mais plus dense et représentatif de la plage opératoire. La généralisation est meilleure pour ce cas précis.

Slide 32 — Indices de Performance et Métriques Temporelles

Ce que les deux graphiques montrent :

Gauche (fig11_perf_indices.png) : barres ISE/IAE/ITAE/ITSE pour les 5 contrôleurs — visuellement, les barres N-FO Simple et N-FO Profond sont nettement plus courtes que PID et N-PID.
Droite (fig12_step_metrics.png) : dépassement, temps de montée, temps de régulation, SSE normalisé — le N-FO Simple est le meilleur sur presque toutes les métriques temporelles.

Double levier à retenir :

PID → FOPID : Mp de 8,1 % à 3,28 % — grâce à la phase d’avance fractionnaire
Classique → Neural : ISE réduit de 49 % — grâce à la planification adaptative

Section VIII — Robustesse & Rejet de Perturbation

Slide 34 — Test de Robustesse : Variation de Masse ±30 % (figures)

Ce qu’il faut commenter visuellement : Les figures fig6a et fig6b_robustness_bundles.png montrent les familles de courbes pour chaque contrôleur, avec les différentes masses en variation de couleur.

Pour le PID : les courbes sont nettement écartées, le dépassement varie fortement
Pour le N-FOPID Simple et Profond : les courbes sont très groupées — quasi-superposées — ce qui démontre visuellement l’iso-amortissement adaptatif

Slide 35 — Robustesse : Tableau

Le résultat clé à mémoriser :

Étendue N-FO Profond = 0,72 pt vs PID = 4,04 pts → robustesse ×5,6

Pourquoi le FOPID classique a une étendue PLUS grande que le PID (4,46 vs 4,04) : C’est le paradoxe à bien expliquer si le jury le relève. L’iso-amortissement fonctionne si les paramètres restent fixes. Quand la masse varie, le gain de la boucle change. Le FOPID classique, avec ses paramètres fixes, maintient la forme de la réponse (peu d’oscillations) mais son dépassement absolu varie plus que le PID parce qu’il est réglé avec un dépassement nominal très faible (2,74 %) qui le rend plus sensible aux variations de gain. Le Neuro-FOPID recalcule les paramètres à chaque instant → l’étendue s’effondre à 0,72.

Signification pratique : Sur la plage 600–1400 kg (vide à plein chargement), le N-FO Profond maintient Mp entre 1,48 % et 2,20 % — pratiquement constant. Le conducteur ne ressent aucune différence de comportement quelle que soit la charge.

Slide 36 — Rejet de Perturbation

Ce que représente +30 % Fe : Une augmentation soudaine de 30 % de la force motrice peut représenter : coup de vent favorable, descente soudaine, changement de rapport de boîte, pic de charge de la batterie électrique. Ce sont des événements fréquents en conduite réelle.

655 ms vs 1070 ms — signification : Le N-FO Simple récupère 38 % plus vite que le PID. En termes de sécurité active (dépassement de vitesse en zone limitée par exemple), 400 ms de différence peut valoir plusieurs mètres.

Pourquoi le N-PID est le plus lent (1,325 s) : Paradoxalement plus lent que le PID classique en rejet de perturbation. Le réseau a appris à minimiser ITSE sur le transitoire initial (réponse à échelon), pas sur le rejet de perturbation. Les données d’entraînement ne comprenaient pas de tests de perturbation → le N-PID se retrouve “surpris”. C’est une limite identifiée de la stratégie de génération des données.

Slide 37 — Rejet de Bruit Gaussien

µ < 1 filtre le bruit (à expliquer) : Le terme dérivateur d’un PID classique amplifie le bruit haute fréquence par définition. Avec µ légèrement supérieur à 1 (µ=1,15 dans le FOPID optimal), l’effet est légèrement renforcé. Le réseau apprend à ajuster µ de façon adaptative pour équilibrer réactivité et filtrage selon la condition.

ISE bruité = 0,2113 vs nominal = 0,2112 : Différence de 0,0001 = 0,005 %. σ = 0,05 m/s représente 0,125 % de la consigne de 40 m/s — c’est un bruit relatif faible. Le fait que l’ISE soit quasi identique confirme que le réseau ne surréagit pas au bruit : il filtre implicitement les hautes fréquences grâce à la structure fractionnaire.

Le zoom (fig10b_noise_zoom.png) : Sur la période 15–20 s, en régime permanent, montrer que la courbe N-FOPID oscille beaucoup moins autour de la consigne que le PID ou le FOPID classique.

Section IX — Conclusion & Perspectives

Slide 39 — Synthèse des Contributions

Comment formuler les trois contributions à l’oral :

“Ce travail apporte trois contributions. Premièrement, une méthodologie complète — pas juste un réseau de neurones, mais toute la chaîne : génération de données, filtre de qualité, entraînement, validation. Deuxièmement, une étude d’ablation rigoureuse qui quantifie séparément ce que fait la structure fractionnaire — moins 72 % de dépassement — et ce que fait le réseau de neurones — 35 % d’ISE supplémentaire. Et qui démontre que la taille du réseau est secondaire : 95 paramètres font presque aussi bien que 18 000. Troisièmement, une démonstration robuste : l’étendue du dépassement est réduite d’un facteur 5,6 par rapport au PID.”

Slide 40 — Limitations et Perspectives

Sur “validation uniquement en simulation” : Un banc d’essai pour véhicule hybride est coûteux et requiert un partenariat industriel. La simulation avec le modèle non-linéaire complet est la meilleure alternative académique. Les tests de robustesse (±30 % masse, bruit, perturbations) simulent la variabilité réelle.

LSTM comme perspective : Pertinent si on veut que le réseau tienne compte de l’historique de conduite : profil de route prédit via GPS, état de charge de la batterie. Pour la relation statique “état actuel → paramètres optimaux”, le MLP suffit théoriquement. Le LSTM ajouterait une mémoire implicite sur l’historique.

Algorithmes génétiques : Explorent globalement l’espace des solutions, contrairement à fmincon qui descend localement. Prix : beaucoup plus lents. Acceptable pour la génération offline des données d’entraînement où le temps de calcul n’est pas critique.

Slide 41 — Conclusion Générale

Message final à délivrer clairement :

“Ce mémoire démontre que combiner le calcul fractionnaire et les réseaux de neurones est une direction prometteuse pour la commande de systèmes complexes. Le Neuro-FOPID hérite de la robustesse structurelle du FOPID et de la rapidité d’adaptation du MLP. Appliqué à un véhicule électrique hybride, il divise le dépassement par 4,6 par rapport au PID classique, réduit le temps de régulation de 8,7 fois, et maintient ses performances sur une variation de masse de ±30 % avec une robustesse 5,6 fois supérieure — le tout avec un réseau de 95 paramètres déployable sur microcontrôleur.”

Questions Probables du Jury

Q1 : Pourquoi ne pas utiliser un algorithme génétique ou PSO directement en ligne ? Ces algorithmes nécessitent des centaines à milliers d’évaluations de la fonction de coût, chacune impliquant une simulation complète du système. En temps réel (inférence < 1 ms nécessaire pour le contrôle), c’est impossible. Le réseau de neurones déplace ce coût en offline.

Q2 : Comment garantit-on la stabilité de la boucle fermée avec le réseau ? Le filtre de stabilité pendant la génération des données garantit que tous les paramètres FOPID appris correspondent à des systèmes stables. Si le réseau interpole correctement dans la région d’entraînement, les paramètres prédits restent dans la région de stabilité. En dehors de la plage d’entraînement (extrapolation), la garantie ne tient plus — c’est une limitation réelle.

Q3 : Pourquoi le réseau Simple fait-il presque aussi bien que le Profond ? La fonction à apprendre (3 entrées → 5 sorties) n’est pas extraordinairement complexe. Le théorème d’approximation universelle s’applique dès une couche cachée. Avec 10 neurones bien entraînés sur 36 conditions propres, le Simple capture les non-linéarités essentielles. La complexité supplémentaire du Profond n’apporte que 4 % de gain sur ISE — son avantage deviendrait plus visible sur un espace de conditions plus large ou un système plus complexe.

Q4 : Comment récupère-t-on les vrais paramètres FOPID après la normalisation Z-score ? Pendant l’entraînement, cibles normalisées : y_norm = (y − μ_y) / σ_y. À l’inférence, dénormalisation : y = y_norm × σ_y + μ_y. Les statistiques μ_y et σ_y sont calculées sur le dataset d’entraînement et stockées avec les poids du modèle.

Q5 : Avez-vous testé pour des consignes autres que r = 40 m/s ? Non — les données d’entraînement utilisent une consigne fixe de 40 m/s. L’extension à des profils de vitesse variables (cycles NEDC ou WLTC) est une perspective directe : il suffirait d’ajouter la consigne r comme quatrième entrée du réseau.

Q6 : Pourquoi fmincon si vous critiquez les minima locaux ? C’est une limitation identifiée, reconnue dans les perspectives. Le multi-start (5 fois) atténue le problème. Pour la génération offline des données, la qualité du filtrage (713/1000) assure que seuls les bons minima sont gardés. Les algorithmes génétiques sont envisagés pour améliorer cela.

Slides à maîtriser en priorité absolue pour le jury : 9 (iso-amortissement), 31 (tableau comparatif), 35 (robustesse ×5,6), et 39 (formulation des contributions).

RayaneKch

Explorer

notesv3