Experte en analyse de données multivariées, l’équipe d’Ondalys participe activement aux conférences dédiées à la Chimiométrie, au Machine Learning et à la spectroscopie infrarouge.
Consultez ci-dessous un panel des présentations scientifiques d’Ondalys ces dernières années
-
Contrôle de procédé
- Supervision et compréhension des procédés par MSPC (Multivariate Statistical Process Control)
- Batch Statistical Process Control (BSPC) : un puissant outil d’analyse des risques et des procédés
- Supervision de mélanges pharmaceutiques et détermination du end-point par spectroscopie NIR en utilisant l’approche prototype
-
Discrimination
- Classification d’échantillons de biomasse lignocellulosique à partir de données LC-HRMS et identification de biomarqueurs
- Stratégies de discrimination de polymères sur des procédés continus par spectroscopie proche infrarouge en ligne
- Discrimination de profils qualitatifs de moûts de raisin par spectroscopie moyen infrarouge et transfert inter-instruments
Méthodes avancées de Chimiométrie et Machine Learning
22èmes Rencontres HélioSPIR – Novembre 2021
Comparaison de méthodes de Machine Learning pour l’analyse de données spectroscopiques
Pour l’analyse de données spectroscopiques, les termes « d’analyse de données multivariées » ou de « chimiométrie » sont les plus souvent employés. Depuis quelques années, avec l’avènement des « Big Data » et autres « IoT – Internet des Objets », les termes « Machine Learning » et « d’Intelligence Artificielle (IA) » sont de plus en plus employés. Mais qu’est ce que le Machine Learning ?
Comme Monsieur Jourdain, ne faisons-nous pas de la prose sans le savoir ?
Au travers d’un cas concret de spectroscopie proche infrarouge (SPIR), cette présentation a pour objectif de présenter la modélisation de la teneur en matières grasses dans la viande, paramètre non linéaire, et comparer différentes méthodes de Machine Learning :
- Transformation des variables d’origine et modèles PLS
- Modèle local (Locally Weighted Regression – LWR)
- CART / Forêts Aléatoires (Random Forest – RF)
- Support Vector Machines (SVM)
- Réseaux de Neurones Artificiels (ANN)
Congrès Chimiométrie 2019
Quelques aspects de la régression SVM : un exemple pour les prédictions quantitatives spectroscopiques
Dans la communauté de la chimiométrie, les techniques «Machine Learning» (ML) sont de plus en plus répandues, de même que les tendances en matière de battage publicitaire «Intelligence artificielle» (IA) et «Big Data». Mais comment appliquer ces techniques IA / ML de la manière la plus appropriée aux données de laboratoire et de production, et en particulier aux données spectroscopiques reste un défi.
Dans une étude précédente menée en 2018, nous avions comparé plusieurs méthodes de chimiométrie et d’apprentissage automatique: Partial Least Square Regression (PLS), Locally Weighted Regression (LWR), Random Forest (RF), Support Vector Machines (SVM) et réseaux de neurones artificiels (ANN) sur données spectroscopiques dans le proche infrarouge (NIR). Nous avons prouvé que les techniques de Machine Learning peuvent considérablement améliorer les performances du modèle quantitatif pour les relations de modélisation non linéaires.
Dans cette étude, nous nous intéressons plus particulièrement aux Support Vector Machines (SVM), car elles présentent plusieurs avantages: elles permettent de modéliser des relations non linéaires, avec de bonnes performances par rapport aux méthodes linéaires, mais nécessitent moins d’échantillons et moins d’optimisation que les ANN. Les SVM démontrent aussi leur performances élevées sur les données présentant des relations linéaires.
Conférence Chimiométrie 2013
Pourquoi et comment utiliser l’analyse multi-blocs exploratoire ?
Les données multivariées sont abondantes pour caractériser les produits et les procédés. De plus en plus d’utilisateurs (universitaires et industriels) utilisent plusieurs tableaux de données ou blocs pour les mêmes observations ou échantillons. Plusieurs techniques d’analyse ou capteurs sont utilisés simultanément pour caractériser les échantillons.
Les outils chimiométriques sont donc utilisés pour combiner les différents tableaux de données afin d’extraire les meilleures informations pour prendre des décisions. Différentes stratégies sont possibles pour explorer un ensemble de tableaux de données. L’idée la plus simple et intuitive est de concaténer ou de fusionner des données et d’effectuer une ACP en utilisant une stratégie de pondération appropriée. D’autres méthodes ont été développées pour prendre en compte dans l’algorithme le fait que les données proviennent de différentes tables et pour estimer la relation entre les tables.
Le présent travail provient de la mise en œuvre de l’atelier intitulé « Analyse multi-blocs permettant de combiner différents types de tableaux de données spectroscopiques », organisé lors des cours pré-conférence de la conférence NIR2013 à La Grande Motte, en France. Nous avons essayé de montrer de manière pédagogique, sous forme de didacticiel, les principaux problèmes adressés à l’utilisateur final en vue d’une analyse multi-blocs utilisée dans des applications exploratoires. Les différentes étapes et les pièges sont illustrés à l’aide d’un ensemble de tableaux de données réelles rassemblés sur des huiles d’olive vierges provenant de différentes régions.
Calibration, transfert et robustesse
20èmes Rencontres HélioSPIR – 2019
Optimisation, maintenance et transfert de modèles entre spectromètre et micro-spectromètre proche infrarouge : Application à l’évaluation de la maturité de la prune d’Ente
Cette étude réalisée conjointement par le Bureau national Interprofessionnel du Pruneau (B.I.P.) et Ondalys a pour objectif de remplacer ces méthodes de référence de laboratoire par une méthode rapide et non destructive telle que la spectroscopie proche infrarouge (ASD LabSpec4®) et éventuellement par un outil portable au verger (MicroNIRTM OnSite®).
Les expérimentations ont été menées par le B.I.P. et l’analyse de données par Ondalys. Elles ont consisté en :
- Une étude de faisabilité de la mesure du sucre et de l’acidité par spectroscopie proche infrarouge
- La réalisation de modèles de prédiction robustes sur un spectromètre en laboratoire
- L’optimisation et la maintenance des modèles au cours des millésimes
- Le transfert des bases de données et modèles vers un micro-spectromètre portable au champ
ICNIRS 2017
Méthode d’orthogonalisation pour améliorer la robustesse des applications NIR en ligne
La maintenance des modèles en ligne est l’un des principaux problèmes rencontrés lors du développement d’applications en spectroscopie proche infrarouge (SPIR). L’apparition de perturbations dues aux modifications de l’environnement, aux opérations de maintenance ou au vieillissement de l’instrument affecte souvent les performances du modèle.
Les corrections de modèle avec des méthodes classiques telles que le biais et la pente ou la mise à jour du modèle ne sont pas toujours satisfaisantes.
L’utilisation d’une méthode d’orthogonalisation peut être un moyen très efficace de résoudre ce problème. Cette approche est illustrée dans cette étude avec une application industrielle
Congrès Chimiométrie 2011
Transfert d’étalonnage dans un cas complexe –
Application dans le cadre d’un modèle de discrimination du potentiel aromatique des vins
Jusqu’à présent, les œnologues ne disposent pas d’outils rapides permettant d’orienter les raisins à la vendange selon leur potentiel aromatique vers un procédé de vinification spécifique.
Ce projet mené avec l’IFV a pour ambition de modéliser le potentiel qualitatif d’une parcelle de vigne en mettant en relation les données issues de spectres moyen infrarouge mesurés sur raisins avant vendange et la qualité finale du vin.
L’objectif est d’établir un modèle de discrimination entre spectres moyen infrarouge et un classement sensoriel à 2 modalités (Fruité / Végétal) sur plusieurs millésimes.
La problématique du transfert d’étalonnage en cas réel dans le cadre d’un modèle de discrimination sera détaillée, avec notamment l’importance du choix de la méthode de transfert (DS, PDS, TOP/EPO, centrage local…) et du choix des échantillons du jeu de standardisation.
Contrôle de procédé
Salon Analyse Industrielle 2018
Supervision et compréhension des procédés par MSPC (Multivariate Statistical Process Control)
L’initiative PAT (Process Analytical Technology) incite tous les industriels, en particulier dans l’industrie pharmaceutique, à contrôler leurs procédés de production de A à Z. Dans ce cadre, un nombre croissant de capteurs sont utilisés in-line, on-line ou at-line afin de contrôler la production.
Les données issues de ces capteurs doivent être compilées et analysées, afin de mener à bien la supervision du procédé dans sa globalité. Ce monitoring peut alors se faire via des méthodes multivariées telles que la MSPC (Multivariate Statistical Process Control) pour les procédés de production continus ou par la BSPC (Batch Statistical Process Control) pour les procédés en batch. Ces méthodes permettent non seulement d’optimiser les procédés de production, mais aussi de les superviser et de diagnostiquer les causes de dérive, en prenant en compte tous les paramètres process.
Congrès AgroStat 2016
Batch Statistical Process Control (BSPC) : un puissant outil d’analyse des risques et des procédés
L’initiative de la Food and Drug Administration (FDA) aux Etats-Unis a recommandé en 2004 la mise en œuvre du Process Analytical Technology (PAT) dans l’industrie pharmaceutique, afin d’améliorer le contrôle des risques et des procédés.
Dix ans après, le PAT a été développé, testé et mis en œuvre dans de nombreux sites de R&D et industriels dans le monde entier. La première partie de cette présentation traite des objectifs et de la mise en œuvre du PAT.
La seconde partie se concentre sur un domaine d’application important du PAT, présentant une haute valeur ajoutée, à savoir BSPC (Batch Statistical Process Control) à l’aide d’une analyse de données multivariées.
Conférence NIR 2013
Supervision de mélanges pharmaceutiques et détermination du end-point grâce à la spectroscopie NIR en utilisant l’approche Prototype.
L’échantillonnage suivi par analyse quantitative est progressivement remplacé par les technologies PAT telles que la spectroscopie NIR pour la détermination de l’homogénéité du mélange (Sanchez, 1995; El-Hagrasy, 2006; Shi, 2008; Igne, 2011).
En raison des diverses sources de variabilité du procédé ayant une incidence sur la trajectoire du processus, il n’y a pas deux mélanges qui atteindront l’homogénéité en même temps. Certaines méthodes qualitatives comme l’ACP ou SIMCA et quantitatives comme la PLS, associées à des statistiques spécifiques, ont déjà été appliquées pour aider à déterminer le moment où une opération de mélange doit être terminée. Cette étude propose d’utiliser une méthode qualitative appelée Prototype utilisant des statistiques innovantes pour la détermination du end-point d’une réaction.
Discrimination
Congrès Chimiométrie 2024
Stratégie de classification des niveaux de réactivité enzymatique d’échantillons de biomasse lignocellulosique à l’aide de leur signal LC-HRMS.
Identification des biomarqueurs responsables d’une activité enzymatique de faible niveau
Les produits intermédiaires tels que les composés oxygénés peuvent interférer avec la cinétique de bioconversion de la biomasse lignocellulosique en bioéthanol.
La discrimination des biomasses à faible réactivité enzymatique peut permettre l’identification des biomarqueurs responsables d’un effet inhibiteur de la bioconversion.
Les données Chromatographie en phase Liquide couplée à la Spectrométrie de Masse Haute Résolution (LC-HRMS) sont des données complexes en 3 dimensions. La stratégie proposée a été de considérer les deux dimensions LC et MS comme deux blocs de données distincts.
Diverses corrections (ligne de base, blanc, alignement…) et divers pré-traitements ont été réalisés pour chacun des blocs séparément. Puis des modèles de discrimination des échantillons à faible réactivité enzymatique ont été développés par PLS-DA (Partial Least Square Regression – Discriminant Analysis) pour les deux dimensions séparément, puis en fusion bas niveau après une standardisation des blocs.
Ainsi, les performances d’une analyse de ces blocs uniques et d’une analyse multi-blocs ont été comparées.
De bonnes performances ont été obtenues, avec un seul échantillon mal classé.
De plus, en étudiant les coefficients discriminants, les biomarqueurs pertinents de réactivité enzymatique peuvent être identifiés dans les deux dimensions et aider à l’interprétation.
Congrès Chimiométrie 2017
Stratégies de discrimination de polymères sur des procédés continus par spectroscopie proche infrarouge en ligne
Les méthodes basées sur la spectroscopie vibrationnelle, et plus spécifiquement le proche infrarouge (PIR), permettent d’obtenir des résultats rapides et précis at-line ou on-line. On peut ainsi remplacer des techniques lourdes en termes de maintenance, dangerosité ou préparation d’échantillons par la mesure d’un spectre PIR qui peut se faire sans préparation sur un prélèvement d’échantillon ou directement en ligne.
Lors du contrôle de procédés continus, la difficulté mais aussi l’intérêt de l’analyse PIR en ligne est de pouvoir suivre les transitions d’un produit A à un produit B, afin d’isoler les produits conformes de ceux dont les propriétés pourraient être affectées par la transition.
Dans le cas des polymères, les transitions peuvent être dues à un changement de composition (% de comonomère X par rapport à Y, ajout ou suppression d’un comonomère) ou à un changement de taux de polymérisation. Des modèles exhaustifs pour la prédiction quantitative des propriétés des polymères permettent d’obtenir des valeurs tout au long du procédé ; néanmoins, dans la plupart des cas, ces modèles ne sont pas suffisamment précis. Il est alors important de déterminer à quel produit l’analyseur PIR est confronté afin de choisir le modèle quantitatif spécifique du produit et ainsi prédire la fin de la transition et le passage à un état stabilisé.
Cet article vise donc à évaluer diverses stratégies de discrimination des polymères basées sur les spectres PIR lors des transitions afin de pouvoir choisir les méthodes quantitatives adéquates pour le suivi en ligne de la polymérisation.
Rencontres HélioSPIR 2014
Discrimination de profils qualitatifs de moûts de raisin par spectroscopie moyen infrarouge et transfert inter-instruments
Actuellement, les œnologues ne disposent pas d’outils rapides permettant d’orienter les raisins à la vendange selon leur potentiel aromatique vers un procédé de vinification spécifique. Le projet mené avec l’Institut Français de la Vigne et du Vin (IFV) a pour ambition de modéliser le potentiel qualitatif d’une parcelle de vigne en mettant en relation les données issues de spectres moyen infrarouge mesurés sur raisins avant vendange et la qualité finale du vin.
Cette étude permet d’aborder le problème de la discrimination et du transfert d’étalonnage en spectroscopie moyen infrarouge dans un cadre complexe comprenant les contraintes suivantes :
- Caractérisation d’un potentiel aromatique à partir de spectres moyen infrarouge
- Modèle de discrimination basé sur une mesure de référence sensorielle
- Transfert d’étalonnage entre spectromètres (divers équipementiers de spectromètres, réseau de mêmes spectromètres entre caves coopératives et laboratoires, gestion d’opérations de maintenance/pannes)
- Disponibilité des échantillons de standardisation
- Représentativité de l’échantillonnage
- Variabilité entre millésimes
L’objectif est d’établir un modèle de discrimination entre spectres moyen infrarouge et un classement sensoriel à 2 modalités (Fruité / Végétal) sur plusieurs millésimes.
La problématique du transfert d’étalonnage en cas réel dans le cadre d’un modèle de discrimination sera détaillée, avec notamment l’importance du choix de la méthode de transfert (DS, PDS, TOP/EPO, centrage local…) et du choix des échantillons du jeu de standardisation.
Ce travail a été mené en partie dans le cadre d’un projet collaboratif de recherche FUI appelé VINNEO, financé par l’état, la Région Occitanie (ex Languedoc-Roussillon), BPI France et le Fonds Européen FEDER, en collaboration avec les équipes de Vinovalie, caves coopératives viticoles du Sud-Ouest.
Nos prochaines formations
Ondalys, organisme de formation agréé, délivre des formations inter et intra-entreprises professionnelles aux industriels et institutionnels.
Notre expertise au service de l’analyse de vos données
Fort d’une expérience de plus de 15 ans dans l’analyse de données (chimiométrie), en particulier appliquée aux mesures spectroscopiques, analytiques et sensorielles, nos équipes vous accompagnent à chaque étape de vos projets
Besoin d’une formation sur mesure ?
Nos équipes étudient votre demande plus en détails pour vous proposer une formation personnalisée