đ Notes de PrĂ©sentation â ContrĂŽleur Neuro-FOPID
Rayane Akkouche | UMMTO 2025â2026
Ces notes contiennent ce que tu dois expliquer Ă lâoral et qui ne figure pas dans les slides : le âpourquoiâ derriĂšre chaque choix, les intuitions physiques, les dĂ©tails mathĂ©matiques dĂ©veloppĂ©s, et les rĂ©ponses aux questions probables du jury.
Diapo 1 â Page de titre
Ă dire : PrĂ©sente-toi briĂšvement (nom, spĂ©cialitĂ©, encadrante). Annonce lâenjeu en une phrase avant mĂȘme de commencer :
âLâidĂ©e centrale de ce travail est simple : les contrĂŽleurs PID fractionnaires sont meilleurs que les PID classiques, mais difficiles Ă rĂ©gler. On va utiliser un rĂ©seau de neurones pour rĂ©soudre ce problĂšme de rĂ©glage automatiquement.â
Diapo 2 â Plan
Ă dire : La structure est volontairement en deux temps. La premiĂšre partie pose les briques thĂ©oriques â elle peut sembler dense, mais elle est nĂ©cessaire pour comprendre les choix de conception. La deuxiĂšme partie est la contribution originale. Insiste sur la contribution principale dĂšs maintenant pour orienter lâattention du jury :
âLe fil conducteur : le FOPID a une propriĂ©tĂ© remarquable appelĂ©e iso-amortissement. Le rĂ©seau de neurones va apprendre Ă exploiter cette propriĂ©tĂ© automatiquement, en temps rĂ©el, pour nâimporte quelle condition de fonctionnement du vĂ©hicule.â
Diapo 4 â Contexte et Motivation
Pourquoi le PID domine lâindustrie (Ă dĂ©velopper Ă lâoral) : Le PID a survĂ©cu parce quâil est simple, robuste, et interprĂ©table : Kp agit sur lâamplitude de lâerreur, Ki sur son accumulation dans le temps, Kd sur sa vitesse de variation. Un technicien peut lâintuiter. Sa part de 97 % en industrie nâest pas un hasard.
Pourquoi il devient insuffisant ici (Ă dĂ©velopper) : Un vĂ©hicule hybride nâest pas un systĂšme linĂ©aire stationnaire. Sa masse change (passagers, chargement), la pente de la route varie, la tempĂ©rature du moteur influe sur ses performances. Le PID rĂ©glĂ© pour une condition nominale se dĂ©grade quand les conditions changent, car ses paramĂštres sont fixes.
Intuition physique sur les minima locaux : Imagine une surface de coĂ»t Ă 5 dimensions (une par paramĂštre du FOPID). SQP et Nelder-Mead partent dâun point et descendent vers la vallĂ©e la plus proche â qui nâest pas forcĂ©ment la plus basse. Le multi-start attĂ©nue ça, mais ça reste coĂ»teux Ă chaque changement de condition. LâidĂ©e neuronale : entraĂźner une fois, puis infĂ©rer instantanĂ©ment.
Diapo 5 â Objectif
Le problĂšme inverse (Ă expliquer clairement) : Lâoptimisation classique rĂ©sout : âpour ces paramĂštres de vĂ©hicule, quels sont les meilleurs paramĂštres FOPID ?â Câest coĂ»teux (~15 min par condition avec fmincon). Le rĂ©seau de neurones, une fois entraĂźnĂ©, rĂ©sout le mĂȘme problĂšme en moins dâune milliseconde â câest une approximation de la fonction inverse, apprise par supervision.
Pourquoi MATLAB + FOMCON : FOMCON (Fractional Order Modeling and CONtrol) est la boĂźte Ă outils MATLAB dĂ©diĂ©e au calcul fractionnaire. Elle implĂ©mente lâapproximation dâOustaloup, les fonctions de transfert dâordre non entier, et les outils dâoptimisation FOPID. Sans elle, implĂ©menter sα de zĂ©ro serait trĂšs complexe.
Diapo 7 â OpĂ©rateurs DiffĂ©rentiels Fractionnaires
Lâintuition derriĂšre le calcul fractionnaire (indispensable Ă lâoral) : En calcul entier, dĂ©river deux fois une fonction donne sa dĂ©rivĂ©e seconde â un bond discret. Le calcul fractionnaire permet de âdĂ©river 1,5 foisâ, câest-Ă -dire dâinterpoler continĂ»ment entre la dĂ©rivĂ©e et la dĂ©rivĂ©e seconde. Ce nâest pas de la magie : câest une gĂ©nĂ©ralisation mathĂ©matique rigoureuse qui passe par lâintĂ©grale de convolution avec un noyau en loi de puissance.
Pourquoi la mĂ©moire longue est importante : LâintĂ©grale fractionnaire a un noyau (tâÏ)^(αâ1) qui dĂ©croĂźt lentement. Ăa signifie que toute lâhistoire passĂ©e du signal contribue Ă la valeur actuelle â avec un poids qui diminue graduellement. Câest diffĂ©rent dâun intĂ©grateur entier oĂč tout le passĂ© est pondĂ©rĂ© uniformĂ©ment. Cette âmĂ©moire longueâ est particuliĂšrement adaptĂ©e aux systĂšmes avec viscoĂ©lasticitĂ© ou diffusion â et au comportement des vĂ©hicules sur route variable.
Caputo plutĂŽt que Riemann-Liouville (Ă justifier) : La dĂ©finition de Caputo utilise la dĂ©rivĂ©e entiĂšre Ă lâintĂ©rieur de lâintĂ©grale, ce qui permet dâutiliser des conditions initiales physiques classiques (position initiale, vitesse initiale). Riemann-Liouville nĂ©cessite des conditions initiales dâordre fractionnaire, difficiles Ă mesurer en pratique. Câest pourquoi Caputo est universellement prĂ©fĂ©rĂ© en automatique.
Lâexemple numĂ©rique : D^(2,3) tÂł â 6,603 t^(0,7). Contraste avec DÂČ tÂł = 6 et DÂł tÂł = 6 (constant). La dĂ©rivĂ©e dâordre 2,3 donne un rĂ©sultat intermĂ©diaire qui varie encore avec t â câest ça lâordre fractionnaire : ni la constante de DÂł, ni la droite de DÂČ.
Diapo 8 â Approximation dâOustaloup
Pourquoi approximer sα (Ă expliquer) : LâopĂ©rateur sα est irrationnel â il ne peut pas sâexprimer comme un rapport de polynĂŽmes. Les systĂšmes de contrĂŽle numĂ©riques (microcontrĂŽleurs, DSP) ne peuvent implĂ©menter que des fonctions de transfert rationnelles. Oustaloup propose une approximation par un produit de pĂŽles et zĂ©ros rĂ©els, rĂ©partis logarithmiquement sur une bande de frĂ©quences.
Comment lire le diagramme de Bode (Ă commenter) :
- En gain : la droite bleue (idĂ©al) a une pente de 20α dB/dĂ©cade = 10 dB/dĂ©cade pour α=0,5. Lâapproximation dâordre 5 colle parfaitement sur [10â»ÂČ, 10ÂČ].
- En phase : lâidĂ©al est une ligne horizontale Ă 45° (pour α=0,5). Câest cette platitude de la phase qui garantit lâiso-amortissement. Lâapproximation lâatteint sur la bande utile mais oscille aux extrĂȘmes.
Choix N=5 : Un ordre 5 donne (2Ă5+1)=11 pĂŽles/zĂ©ros et offre un bon compromis prĂ©cision/complexitĂ©. Des ordres plus Ă©levĂ©s nâapportent pas de gain significatif sur la bande utile et alourdissent le calcul.
Diapo 9 â Iso-amortissement
Lâintuition physique de lâiso-amortissement (point clĂ© du travail) : Imagine que tu rĂšgles ton FOPID pour un vĂ©hicule Ă vide (m=1000 kg). Maintenant tu charges 400 kg de marchandises. Le gain de la boucle ouverte change (la dynamique est diffĂ©rente). Avec un PID, le dĂ©passement changerait significativement. Avec un FOPID bien conçu, le dĂ©passement reste le mĂȘme â câest lâiso-amortissement. La propriĂ©tĂ© tient parce que la phase de L(jÏ) est constante sur toute la bande.
Deux paramĂštres indĂ©pendants â lâavantage clĂ© : λ et Ïc permettent de rĂ©gler sĂ©parĂ©ment lâamortissement et la rapiditĂ©, ce que le PID ne peut pas faire (ses trois paramĂštres sont couplĂ©s). En pratique, tu choisis dâabord le dĂ©passement tolĂ©rĂ© (fixe λ), puis tu ajustes la rapiditĂ© voulue (fixe Ïc), sans que lâun interfĂšre avec lâautre.
Formule du dĂ©passement : Mp â 0,8λ(λ+0,25). Pour λ=0,5 : Mp â 30%. Pour λ=0,9 : Mp â 74%⊠Attends â ça semble Ă©levĂ© ? Non, car le paramĂštre λ ici est celui de la boucle ouverte idĂ©ale L(s) = 1/(Ïc·s^(λ+1)), donc lâexposant de s est λ+1. Un λâ0 donne un intĂ©grateur pur (beaucoup de dĂ©passement), λâ1 donne un double intĂ©grateur (instable). Les valeurs pratiques sont λ â [0,5 ; 0,9].
Diapo 11 â Du PID Classique au FOPID
Pourquoi λ et ” changent tout : Dans CFOPID(s) = Kp + Ki/s^λ + Kd·s^” :
- λ contrĂŽle lâintĂ©grateur : λ=1 â intĂ©grateur classique, λ<1 â intĂ©grateur âplus douxâ qui accumule lâerreur moins agressivement â moins de dĂ©passement
- ” contrĂŽle le dĂ©rivateur : ”=1 â dĂ©rivateur classique (amplifie le bruit), ”<1 â dĂ©rivateur âamortiâ moins sensible aux hautes frĂ©quences â meilleure robustesse au bruit
La gĂ©nĂ©ralisation : Le PID classique est un cas particulier du FOPID avec λ=”=1. Lâespace (λ,”) est un continuum â on explore une surface de solutions plutĂŽt quâun point.
Exemple de valeurs obtenues : Le FOPID optimal trouvé ici a λ=0,90 et ”=1,15. λ<1 donne un intégrateur plus doux (moins de dépassement), ”>1 donne un dérivateur renforcé (récupération plus rapide des perturbations).
Diapo 12 â MĂ©thodes dâOptimisation
DĂ©tail sur la fonction de coĂ»t utilisĂ©e (slide 22) : J = ITSE + 2,0·[max(0, ÎŽOSâ2%)]ÂČ + 5,0·t90 + 30·|Δss|
Cette formule est dĂ©libĂ©rĂ©ment asymĂ©trique : le dĂ©passement nâest pĂ©nalisĂ© que sâil dĂ©passe 2% (via max(0,·)), lâerreur statique est fortement pĂ©nalisĂ©e (Ă30) car lâerreur de vitesse Ă long terme est inacceptable en conduite. Ce nâest pas un ISE pur â câest un critĂšre composĂ© alignĂ© sur les specs rĂ©elles du cahier des charges.
Pourquoi multi-start : 5 lancements alĂ©atoires de fmincon pour le modĂšle Profond, 2 pour le Simple. On garde le meilleur rĂ©sultat. Ăa rĂ©duit la probabilitĂ© de se bloquer sur un mauvais minimum local, au prix dâun temps de calcul multipliĂ©.
Différence ISE vs ITAE :
- ISE pĂ©nalise fortement les grandes erreurs (carrĂ©) â favorise une rĂ©ponse rapide mĂȘme avec un peu de dĂ©passement
- ITAE pondĂšre par le temps â pĂ©nalise surtout les erreurs qui persistent longtemps â meilleur en rĂ©gime Ă©tabli Le choix de ITSE dans J combine les deux : pĂ©nalise les grandes erreurs tardives.
Diapo 14 â MLP et Fonctions dâActivation
Pourquoi ReLU et pas sigmoĂŻde (Ă justifier) : La sigmoĂŻde sature pour des entrĂ©es grandes â son gradient tend vers 0, ce qui provoque le âvanishing gradient problemâ dans les rĂ©seaux profonds : les couches lointaines nâapprennent plus. ReLU nâa pas ce problĂšme (gradient = 1 pour x>0). Pour le rĂ©seau Simple (une couche cachĂ©e), ça aurait peu dâimpact, mais pour le Profond (3 couches), câest critique.
Le thĂ©orĂšme dâapproximation universelle â ce quâil dit vraiment : Hornik (1989) dit quâun MLP Ă UNE couche cachĂ©e avec suffisamment de neurones peut approximer nâimporte quelle fonction continue. Mais âsuffisammentâ peut vouloir dire des millions de neurones. En pratique, les rĂ©seaux profonds apprennent des reprĂ©sentations hiĂ©rarchiques plus efficacement avec moins de paramĂštres totaux â dâoĂč les deux architectures testĂ©es.
Pourquoi 3 entrĂ©es (e, â«e, Ä) et pas juste e : Ces trois signaux correspondent exactement aux actions P, I et D du contrĂŽleur. Le rĂ©seau reçoit ainsi toute lâinformation pertinente pour calculer les paramĂštres optimaux : la magnitude de lâerreur actuelle, son historique (intĂ©grale), et sa tendance (dĂ©rivĂ©e). Câest une conception intentionnelle, pas arbitraire.
Diapo 15 â RĂ©tropropagation
Adam vs descente de gradient classique (Ă dĂ©tailler) : La descente de gradient classique utilise un taux dâapprentissage η unique pour tous les paramĂštres. Adam maintient une moyenne mobile du gradient (m) et de son carrĂ© (v) pour chaque paramĂštre. LâidĂ©e : si un paramĂštre a des gradients trĂšs variables, on rĂ©duit son taux dâapprentissage. Si ses gradients sont rĂ©guliers, on lâaugmente. RĂ©sultat : convergence plus rapide et plus stable, surtout avec des gradients bruitĂ©s.
Dropout â comment ça marche vraiment : Ă chaque mini-batch, on âĂ©teintâ alĂ©atoirement 15% des neurones (taux utilisĂ© ici). Ces neurones ne contribuent pas au forward pass et ne reçoivent pas de gradient au backward pass. Lâeffet : le rĂ©seau ne peut pas sâappuyer sur un sous-ensemble fixe de neurones â il doit distribuer la connaissance â gĂ©nĂ©ralisation meilleure. Ă lâinfĂ©rence, tous les neurones sont actifs mais leurs sorties sont multipliĂ©es par (1âp) pour compenser.
Diapo 19 â ModĂšle du VĂ©hicule
La non-linĂ©aritĂ© âΞ â pourquoi câest un problĂšme : La force motrice Fe1(Ξ) = F1 + Îłm·âΞ contient une racine carrĂ©e. Ăa signifie quâun mĂȘme incrĂ©ment de papillon Ξ produit un effet trĂšs diffĂ©rent selon la position initiale. Ă faible ouverture (Ξ petit), âΞ varie vite â grande sensibilitĂ©. Ă grande ouverture, âΞ varie lentement â saturation. Un contrĂŽleur linĂ©aire Ă gains fixes ne peut pas gĂ©rer ça correctement sur toute la plage â il sera soit trop agressif Ă faible ouverture, soit trop lent Ă grande ouverture.
La force gravitationnelle Fg = mg·sin(Ï) : Elle reprĂ©sente la rĂ©sistance Ă la montĂ©e. Pour une pente de 5° et m=1000 kg : Fg â 1000Ă9,81Ăsin(5°) â 854 N. Câest une perturbation permanente qui change la valeur dâĂ©quilibre du papillon. Les tests de robustesse en pente sont directement liĂ©s Ă cette terme.
Pourquoi deux Ă©quations diffĂ©rentielles : La premiĂšre (dynamique de vitesse) reprĂ©sente la mĂ©canique du vĂ©hicule â Newton appliquĂ© Ă la masse. La seconde (dynamique moteur) reprĂ©sente le dĂ©lai de rĂ©ponse mĂ©canique/thermique du moteur : mĂȘme si on change Ξ instantanĂ©ment, la force effective Fe met Ïe=0,2 s Ă rĂ©pondre. Ce retard est ce qui rend la commande dĂ©licate.
SpĂ©cifications difficiles Ă tenir simultanĂ©ment : Tr < 1 s exige un systĂšme rapide â pousse vers des gains Ă©levĂ©s â risque de dĂ©passement. Mp < 10% exige un systĂšme amorti â pousse vers des gains modĂ©rĂ©s. Ces deux exigences sont contradictoires pour un PID classique. Le FOPID les dĂ©couple via λ et ”.
Diapo 21 â Architecture Neuro-FOPID
Pourquoi la dĂ©rivĂ©e filtrĂ©e Äfilt et pas Ä brute : La dĂ©rivĂ©e pure amplifie le bruit haute frĂ©quence (câest sa dĂ©finition mathĂ©matique). En pratique, on filtre Ä avec un filtre passe-bas avant de le donner au rĂ©seau. Ăa Ă©vite que le rĂ©seau rĂ©agisse Ă des fluctuations de mesure plutĂŽt quâaux vraies dynamiques du systĂšme.
Choix des architectures â raisonnement :
- Simple (3â10â5) : 10 neurones Ă 3 entrĂ©es + 10 biais (couche 1) + 5Ă10 + 5 biais (couche 2) = 95 paramĂštres. Suffisant pour une relation non-linĂ©aire modĂ©rĂ©ment complexe.
- Profond (3â128â64â32â5) : 3Ă128 + 128Ă64 + 64Ă32 + 32Ă5 = 384 + 8192 + 2048 + 160 + biais â 18 000 paramĂštres. CapacitĂ© bien supĂ©rieure, mais risque de surapprentissage â dâoĂč le Dropout et L2.
Sortie linĂ©aire (sans activation) : Les 5 sorties du rĂ©seau (Kp, Ki, λ, Kd, ”) sont des valeurs rĂ©elles non bornĂ©es en principe. Utiliser une activation sigmoĂŻde ou tanh en sortie limiterait lâespace des valeurs accessibles. La couche linĂ©aire laisse le rĂ©seau libre de prĂ©dire nâimporte quelle valeur â la normalisation Z-score Ă lâentrĂ©e et la mise Ă lâĂ©chelle des cibles gĂšrent les plages.
Diapo 22 â EntraĂźnement
La chaĂźne complĂšte â pourquoi chaque Ă©tape est nĂ©cessaire :
-
GĂ©nĂ©ration : on simule N conditions alĂ©atoires tirĂ©es dans [m=600-1400 kg, α=2,4-7,2°, Îł=8750-16250, r=32-55 cm]. Ăa couvre lâespace des conditions opĂ©ratoires rĂ©elles.
-
Optimisation FOPID : pour chaque condition, fmincon cherche les 5 paramĂštres qui minimisent J. Câest ici que la connaissance du âbon rĂ©glageâ est gĂ©nĂ©rĂ©e â le rĂ©seau ne fait quâapprendre Ă reproduire cette expertise offline.
-
Filtre de stabilitĂ© : une solution optimale au sens de J peut quand mĂȘme ĂȘtre instable si fmincon a convergĂ© vers une solution aberrante. Le filtre rejette les solutions avec pĂŽles en demi-plan droit ou marge de phase insuffisante. RĂ©sultat : 713/1000 conditions acceptĂ©es pour le Profond â 28,7% rejetĂ©es. Câest important : ça garantit que le rĂ©seau nâapprend pas de âmauvais exemplesâ.
-
Normalisation Z-score : (x â ÎŒ)/Ï pour chaque entrĂ©e/sortie. Sans ça, Kp (~1,7) et Ki (~0,01) auraient des magnitudes trĂšs diffĂ©rentes â le gradient serait dominĂ© par les grandes valeurs â convergence biaisĂ©e.
Patience de 20 Ă©poques : Si la RMSE de validation ne sâamĂ©liore pas pendant 20 Ă©poques consĂ©cutives, lâentraĂźnement sâarrĂȘte. Ăa Ă©vite le surapprentissage et Ă©conomise du temps. En pratique, le modĂšle Profond sâarrĂȘte Ă 49 Ă©poques et le Simple Ă 29 â bien avant les maxima de 300 et 150.
Diapo 23 â RĂ©sultats dâEntraĂźnement
RMSE de 1,378 â est-ce bon ? (question probable du jury) : La RMSE est exprimĂ©e dans lâespace normalisĂ© des sorties (Z-score). Sans connaĂźtre lâĂ©cart-type des cibles, ce chiffre seul ne dit pas grand-chose. Ce qui compte câest la performance en boucle fermĂ©e â et les rĂ©sultats de simulation (diapos 29-37) montrent que le rĂ©seau prĂ©dit des paramĂštres suffisamment bons pour obtenir les performances dĂ©sirĂ©es. La RMSE est une mĂ©trique dâentraĂźnement, pas de performance finale.
380 octets pour le Simple : 95 paramĂštres Ă 4 octets (float32) = 380 octets. Un STM32H7 a 1 Mo de RAM et 2 Mo de Flash â le rĂ©seau tient largement. Le temps dâinfĂ©rence sur ce type de microcontrĂŽleur est de lâordre de quelques microsecondes pour 95 multiplications-additions.
Diapo 29 â RĂ©ponses Indicielles
Pourquoi le Neuro-FOPID est plus rapide que le FOPID classique Ă mĂȘme dĂ©passement : Le FOPID classique est rĂ©glĂ© offline pour UNE condition nominale. Le Neuro-FOPID adapte ses paramĂštres Ă la condition exacte du moment. Au dĂ©marrage (erreur grande, intĂ©grale nulle, dĂ©rivĂ©e grande), le rĂ©seau choisit des gains plus agressifs quâen rĂ©gime Ă©tabli. Câest du gain scheduling implicite appris par le rĂ©seau.
La progression monotone PID â N-PID â FOPID â N-FOPID :
- PID â N-PID : le rĂ©seau adapte les 3 paramĂštres classiques â amĂ©lioration modĂ©rĂ©e
- N-PID â FOPID : la structure fractionnaire apporte lâiso-amortissement â saut qualitatif plus grand
- FOPID â N-FOPID : lâadaptation neuronale sur 5 paramĂštres â amĂ©lioration supplĂ©mentaire Cela montre que les deux contributions (structure fractionnaire et adaptation neuronale) sont additives et indĂ©pendantes.
Diapo 30 â Gain Scheduling
Ce que les graphiques montrent vraiment :
- Kp dĂ©marre haut (erreur grande â besoin de gain fort) puis descend vers la valeur de rĂ©gime
- Ki dĂ©marre bas (on ne veut pas accumuler dâintĂ©grale trop vite au dĂ©marrage) puis monte
- λ varie pour ajuster lâamortissement dynamiquement
- Cette adaptation nâest pas programmĂ©e explicitement â elle est apprise par le rĂ©seau Ă partir des donnĂ©es dâoptimisation
Comparaison Simple vs Profond : Les profils du Profond (bleu) sont plus âlissesâ que ceux du Simple (orange) â le rĂ©seau plus profond fait une interpolation plus rĂ©guliĂšre dans lâespace des paramĂštres, ce qui explique le lĂ©ger avantage en Mp (2,11% vs 2,23%).
Diapo 31 â Tableau Comparatif
Analyse des critÚres intégraux (à développer) :
- ISE (carrĂ© de lâerreur) : pĂ©nalise les grandes erreurs transitoires. Le N-FO Simple gagne (0,2112) grĂące Ă son transitoire plus court.
- ITAE (erreur pondĂ©rĂ©e par le temps) : pĂ©nalise les erreurs tardives. N-FO Simple gagne massivement (0,2382 vs 1,0251 pour FOPID) car son ts plus court signifie que lâerreur reste non nulle moins longtemps.
- ITSE : combine les deux. N-FO Simple = 0,0321, soit 4Ă moins que le FOPID classique.
Le chiffre le plus important du tableau : ts(N-FO Simple) = 1,185 s vs ts(PID) = 9,970 s. Le temps de rĂ©gulation est 8,4Ă plus court. En conduite rĂ©elle, ça reprĂ©sente la diffĂ©rence entre un vĂ©hicule qui âflotteâ pendant 10 secondes aprĂšs chaque changement de vitesse, et un qui se stabilise en 1,2 seconde.
Diapo 35 â Robustesse Ă la Variation de Masse
Pourquoi le FOPID classique a une Ă©tendue PLUS grande que le PID (4,46 vs 4,04) : Câest contre-intuitif mais sâexplique : le FOPID classique est rĂ©glĂ© pour la condition nominale m=1000 kg. Sa propriĂ©tĂ© dâiso-amortissement fonctionne si les paramĂštres restent fixes. Mais quand la masse varie, le gain de la boucle change. Le FOPID classique maintient mieux la forme de la rĂ©ponse (pas de grande oscillation), mais son dĂ©passement absolu varie plus car ses paramĂštres ne sâadaptent pas. Le Neuro-FOPID, lui, recalcule les paramĂštres â lâĂ©tendue sâeffondre Ă 0,72.
Ătendue 0,72 vs 4,04 â signification pratique : Un vĂ©hicule peut passer de 600 kg (vide) Ă 1400 kg (plein chargement) â variation de ±40% par rapport Ă 1000 kg. Sur cette plage, le Neuro-FOPID Profond maintient le dĂ©passement entre 1,48% et 2,20% â pratiquement constant. Le conducteur ne ressent aucune diffĂ©rence de comportement quelle que soit la charge.
Diapo 36 â Rejet de Perturbation
Ce que représente la perturbation +30% Fe : Une augmentation soudaine de 30% de la force motrice peut représenter : un coup de vent favorable, une descente soudaine, un changement de rapport de boßte de vitesse, ou un pic de charge de la batterie sur le moteur électrique. Ce sont des événements réels fréquents.
655 ms vs 1070 ms â signification : Le N-FO Simple rĂ©cupĂšre en 655 ms, soit 38% plus vite que le PID. En termes de sĂ©curitĂ© active, si la perturbation provoque un dĂ©passement de vitesse (ex. en zone limitĂ©e), le temps pour revenir Ă la consigne est critique. 400 ms de diffĂ©rence peut signifier plusieurs mĂštres de dĂ©passement de vitesse.
Pourquoi le N-PID est le plus lent (1,325 s) : Paradoxalement plus lent que le PID classique en rejet de perturbation. La raison : le rĂ©seau N-PID a appris Ă minimiser lâITSE sur le transitoire initial, pas spĂ©cifiquement sur le rejet de perturbation. Câest une limite de la stratĂ©gie de gĂ©nĂ©ration des donnĂ©es â les donnĂ©es dâentraĂźnement ne comprenaient que des rĂ©ponses Ă Ă©chelon, pas des tests de perturbation.
Diapo 37 â Rejet de Bruit
Pourquoi le N-FOPID est moins sensible au bruit que le PID : Le terme dĂ©rivateur du PID classique amplifie le bruit haute frĂ©quence (câest une propriĂ©tĂ© fondamentale de la dĂ©rivation). Avec ” < 1 dans le FOPID (ici ” â 0,8â1,35 selon la condition), le dĂ©rivateur fractionnaire filtre naturellement les hautes frĂ©quences tout en maintenant lâaction dĂ©rivĂ©e utile sur les dynamiques lentes. Le rĂ©seau apprend Ă choisir ” de maniĂšre adaptative pour Ă©quilibrer rĂ©activitĂ© et filtrage.
ISE bruitĂ© vs nominal : 0,2113 vs 0,2112 â Ă expliquer : La diffĂ©rence est de 0,0001 soit 0,005%. Le bruit gaussien Ï=0,05 m/s reprĂ©sente environ 0,125% de la consigne de 40 m/s â câest un bruit mesurĂ© relativement faible. La quasi-identitĂ© des ISE confirme que le rĂ©seau ne surrĂ©agit pas au bruit : il ne lâamplifie pas dans son action de commande.
Diapo 39 â Contributions
Comment formuler la contribution lors de la soutenance :
âCe travail apporte trois contributions. PremiĂšrement, une mĂ©thodologie complĂšte : on ne prĂ©sente pas juste un rĂ©seau, mais toute la chaĂźne â gĂ©nĂ©ration de donnĂ©es, filtre de qualitĂ©, entraĂźnement et validation. DeuxiĂšmement, une Ă©tude dâablation rigoureuse qui quantifie sĂ©parĂ©ment ce que fait la structure fractionnaire et ce que fait le rĂ©seau de neurones â ça rĂ©pond Ă la question âquâest-ce qui contribue quoi ?â. TroisiĂšmement, une dĂ©monstration que la taille du rĂ©seau est secondaire â 95 paramĂštres suffisent, ce qui ouvre la voie Ă lâembarquĂ©.â
Diapo 40 â Limitations et Perspectives
Sur la limitation âsimulation seulementâ : Le jury demandera probablement pourquoi on ne teste pas sur un banc rĂ©el. RĂ©ponse honnĂȘte : un banc dâessai pour vĂ©hicule hybride est coĂ»teux et nĂ©cessite un partenariat industriel. La simulation avec le modĂšle non-linĂ©aire complet est la meilleure alternative acadĂ©mique. Les tests de robustesse (±30% masse, bruit, perturbations) simulent en partie la variabilitĂ© rĂ©elle.
Sur les LSTM comme perspective : Un LSTM serait pertinent si on voulait que le rĂ©seau tienne compte de lâhistorique de la conduite (profil de route prĂ©dit, Ă©tat de charge de la batterie). Pour la relation statique âĂ©tat actuel â paramĂštres optimauxâ, le MLP est thĂ©oriquement suffisant. Le LSTM ajouterait de la mĂ©moire implicite â utile pour anticiper des changements (vitesse sur autoroute, approche dâune montĂ©e connue via GPS).
Sur les algorithmes gĂ©nĂ©tiques : La principale limite de fmincon est la convergence locale. Les algorithmes gĂ©nĂ©tiques maintiennent une population de solutions et explorent globalement lâespace â moins de risque de minimum local. Le prix : beaucoup plus lent (centaines Ă milliers dâĂ©valuations). Acceptable offline pour gĂ©nĂ©rer les donnĂ©es dâentraĂźnement.
Questions Probables du Jury
Q1 : Pourquoi ne pas utiliser directement un algorithme génétique ou par essaim de particules pour régler le FOPID en ligne ?
Ces algorithmes nĂ©cessitent des centaines Ă milliers dâĂ©valuations de la fonction de coĂ»t, chacune impliquant une simulation. En temps rĂ©el (infĂ©rence en <1 ms nĂ©cessaire), câest impossible. Le rĂ©seau de neurones dĂ©place le coĂ»t computationnel Ă la phase offline dâentraĂźnement.
Q2 : Comment garantit-on la stabilité de la boucle fermée avec le réseau ?
Le filtre de stabilitĂ© pendant la gĂ©nĂ©ration des donnĂ©es garantit que tous les paramĂštres FOPID appris sont associĂ©s Ă des systĂšmes stables. Si le rĂ©seau interpole correctement, les paramĂštres prĂ©dits restent dans la rĂ©gion de stabilitĂ©. Cependant, lâextrapolation hors de la plage dâentraĂźnement nâest pas garantie â câest une limitation rĂ©elle.
Q3 : Pourquoi le réseau Simple fait-il presque aussi bien que le Profond ?
La fonction Ă apprendre (3 entrĂ©es â 5 paramĂštres FOPID) nâest pas extraordinairement complexe. Le thĂ©orĂšme dâapproximation universelle sâapplique dĂšs une couche cachĂ©e. Avec 10 neurones et des donnĂ©es suffisantes (36 conditions aprĂšs filtrage), le Simple peut capturer les non-linĂ©aritĂ©s essentielles. La complexitĂ© supplĂ©mentaire du Profond nâapporte que 4% de gain â son avantage se manifesterait sur des espaces de conditions plus larges ou des systĂšmes plus complexes.
Q4 : La normalisation Z-score des sorties â comment rĂ©cupĂ©rez-vous les vrais paramĂštres FOPID ?
Pendant lâentraĂźnement, les cibles (Kp, Ki, λ, Kd, ”) sont normalisĂ©es : y_norm = (y â ÎŒ_y)/Ï_y. Ă lâinfĂ©rence, on dĂ©normalise : y = y_norm Ă Ï_y + ÎŒ_y. Les statistiques ÎŒ_y et Ï_y sont calculĂ©es sur le dataset dâentraĂźnement et stockĂ©es avec le modĂšle.
Q5 : Avez-vous testé pour des consignes autres que r=40 m/s ?
Les donnĂ©es dâentraĂźnement couvrent diffĂ©rentes conditions physiques (masse, pente, etc.) mais la consigne de rĂ©fĂ©rence est fixĂ©e Ă 40 m/s (soit ~144 km/h). Lâextension Ă des profils de vitesse variables (cycle de conduite NEDC ou WLTC) est une perspective directe â il suffirait dâajouter la consigne r comme quatriĂšme entrĂ©e du rĂ©seau.
Q6 : Comment choisir λ et ” dans le FOPID optimal â y a-t-il une intuition ?
λ < 1 donne un intĂ©grateur âdouxâ qui accumule moins agressivement â moins de dĂ©passement mais erreur statique plus lente Ă Ă©liminer. ” > 1 donne un dĂ©rivateur renforcĂ© â rĂ©action plus vive aux changements dâerreur â rĂ©cupĂ©ration de perturbation plus rapide. Les valeurs obtenues (λ=0,90, ”=1,15) reflĂštent bien le cahier des charges : Mp < 10% (λ proche de 1) et rĂ©cupĂ©ration rapide (” > 1).
Bonne soutenance, Rayane ! MaĂźtrise bien les diapos 9 (iso-amortissement), 31 (tableau comparatif) et 35 (robustesse Ă5,6) â ce sont les points que le jury interrogera le plus.