Experte en analyse de données multivariées, l’équipe d’Ondalys participe activement aux conférences dédiées à la Chimiométrie, au Machine Learning et à la spectroscopie infrarouge.

 

Consultez ci-dessous un panel des présentations scientifiques d’Ondalys ces dernières années

Méthodes avancées de Chimiométrie et Machine Learning

22èmes Rencontres HélioSPIR – Novembre 2021

Comparaison de méthodes de Machine Learning pour l’analyse de données spectroscopiques

Pour l’analyse de données spectroscopiques, les termes « d’analyse de données multivariées » ou de « chimiométrie » sont les plus souvent employés. Depuis quelques années, avec l’avènement des « Big Data » et autres « IoT – Internet des Objets », les termes « Machine Learning » et « d’Intelligence Artificielle (IA) » sont de plus en plus employés. Mais qu’est ce que le Machine Learning ?

Comme Monsieur Jourdain, ne faisons-nous pas de la prose sans le savoir ?

Au travers d’un cas concret de spectroscopie proche infrarouge (SPIR), cette présentation a pour objectif de présenter la modélisation de la teneur en matières grasses dans la viande, paramètre non linéaire, et comparer différentes méthodes de Machine Learning :

Congrès Chimiométrie 2019

Quelques aspects de la régression SVM : un exemple pour les prédictions quantitatives spectroscopiques

Dans la communauté de la chimiométrie, les techniques «Machine Learning» (ML) sont de plus en plus répandues, de même que les tendances en matière de battage publicitaire «Intelligence artificielle» (IA) et «Big Data». Mais comment appliquer ces techniques IA / ML de la manière la plus appropriée aux données de laboratoire et de production, et en particulier aux données spectroscopiques reste un défi.

Conference Chimiométrie 2019

Dans une étude précédente menée en 2018, nous avions comparé plusieurs méthodes de chimiométrie et d’apprentissage automatique: Partial Least Square Regression (PLS), Locally Weighted Regression (LWR),  Random Forest (RF), Support Vector Machines (SVM) et réseaux de neurones artificiels (ANN) sur données spectroscopiques dans le proche infrarouge (NIR). Nous avons prouvé que les techniques de Machine Learning peuvent considérablement améliorer les performances du modèle quantitatif pour les relations de modélisation non linéaires.
Dans cette étude, nous nous intéressons plus particulièrement aux Support Vector Machines (SVM), car elles présentent plusieurs avantages: elles permettent de modéliser des relations non linéaires, avec de bonnes performances par rapport aux méthodes linéaires, mais nécessitent moins d’échantillons et moins d’optimisation que les ANN. Les SVM démontrent aussi leur performances élevées sur les données présentant des relations linéaires.

Conférence Chimiométrie 2013

Pourquoi et comment utiliser l’analyse multi-blocs exploratoire ?

Les données multivariées sont abondantes pour caractériser les produits et les procédés. De plus en plus d’utilisateurs (universitaires et industriels) utilisent plusieurs tableaux de données ou blocs pour les mêmes observations ou échantillons. Plusieurs techniques d’analyse ou capteurs sont utilisés simultanément pour caractériser les échantillons.

Conference Chimiométrie 2013

Les outils chimiométriques sont donc utilisés pour combiner les différents tableaux de données afin d’extraire les meilleures informations pour prendre des décisions. Différentes stratégies sont possibles pour explorer un ensemble de tableaux de données. L’idée la plus simple et intuitive est de concaténer ou de fusionner des données et d’effectuer une ACP en utilisant une stratégie de pondération appropriée. D’autres méthodes ont été développées pour prendre en compte dans l’algorithme le fait que les données proviennent de différentes tables et pour estimer la relation entre les tables.


Le présent travail provient de la mise en œuvre de l’atelier intitulé « Analyse multi-blocs permettant de combiner différents types de tableaux de données spectroscopiques », organisé lors des cours pré-conférence de la conférence NIR2013 à La Grande Motte, en France. Nous avons essayé de montrer de manière pédagogique, sous forme de didacticiel, les principaux problèmes adressés à l’utilisateur final en vue d’une analyse multi-blocs utilisée dans des applications exploratoires. Les différentes étapes et les pièges sont illustrés à l’aide d’un ensemble de tableaux de données réelles rassemblés sur des huiles d’olive vierges provenant de différentes régions.

Calibration, transfert et robustesse

20èmes Rencontres HélioSPIR – 2019

Optimisation, maintenance et transfert de modèles entre spectromètre et micro-spectromètre proche infrarouge : Application à l’évaluation de la maturité de la prune d’Ente

Cette étude réalisée conjointement par le Bureau national Interprofessionnel du Pruneau (B.I.P.) et Ondalys a pour objectif de remplacer ces méthodes de référence de laboratoire par une méthode rapide et non destructive telle que la spectroscopie proche infrarouge (ASD LabSpec4®) et éventuellement par un outil portable au verger (MicroNIRTM OnSite®).

Conference HelioSPIR 2019

Les expérimentations ont été menées par le B.I.P. et l’analyse de données par Ondalys. Elles ont consisté en :

  • Une étude de faisabilité de la mesure du sucre et de l’acidité par spectroscopie proche infrarouge
  • La réalisation de modèles de prédiction robustes sur un spectromètre en laboratoire
  • L’optimisation et la maintenance des modèles au cours des millésimes
  • Le transfert des bases de données et modèles vers un micro-spectromètre portable au champ

ICNIRS 2017

Méthode d’orthogonalisation pour améliorer la robustesse des applications NIR en ligne

La maintenance des modèles en ligne est l’un des principaux problèmes rencontrés lors du développement d’applications en spectroscopie proche infrarouge (SPIR). L’apparition de perturbations dues aux modifications de l’environnement, aux opérations de maintenance ou au vieillissement de l’instrument affecte souvent les performances du modèle.

Conference ICNIRS2017

Les corrections de modèle avec des méthodes classiques telles que le biais et la pente ou la mise à jour du modèle ne sont pas toujours satisfaisantes.


L’utilisation d’une méthode d’orthogonalisation peut être un moyen très efficace de résoudre ce problème. Cette approche est illustrée dans cette étude avec une application industrielle

Congrès Chimiométrie 2011

Transfert d’étalonnage dans un cas complexe  –
Application dans le cadre d’un modèle de discrimination du potentiel aromatique des vins

Jusqu’à présent, les œnologues ne disposent pas d’outils rapides permettant d’orienter les raisins à la vendange selon leur potentiel aromatique vers un procédé de vinification spécifique.

Conference Chimiométrie 2011

Ce projet mené avec l’IFV a pour ambition de modéliser le potentiel qualitatif d’une parcelle de vigne en mettant en relation les données issues de spectres moyen infrarouge mesurés sur raisins avant vendange et la qualité finale du vin.

L’objectif est d’établir un modèle de discrimination entre spectres moyen infrarouge et un classement sensoriel à 2 modalités (Fruité / Végétal) sur plusieurs millésimes.

La problématique du transfert d’étalonnage en cas réel dans le cadre d’un modèle de discrimination sera détaillée, avec notamment l’importance du choix de la méthode de transfert (DS, PDS, TOP/EPO, centrage local…) et du choix des échantillons du jeu de standardisation.

Contrôle de procédé

Salon Analyse Industrielle 2018

Supervision et compréhension des procédés par MSPC  (Multivariate Statistical Process Control)

L’initiative PAT (Process Analytical Technology) incite tous les industriels, en particulier dans l’industrie pharmaceutique, à contrôler leurs procédés de production de A à Z. Dans ce cadre, un nombre croissant de capteurs sont utilisés in-line, on-line ou at-line afin de contrôler la production.

Salon analyse industrielle 2018

Les données issues de ces capteurs doivent être compilées et analysées, afin de mener à bien la supervision du procédé dans sa globalité. Ce monitoring peut alors se faire via des méthodes multivariées telles que la MSPC (Multivariate Statistical Process Control) pour les procédés de production continus ou par la BSPC (Batch Statistical Process Control) pour les procédés en batch. Ces méthodes permettent non seulement d’optimiser les procédés de production, mais aussi de les superviser et de diagnostiquer les causes de dérive, en prenant en compte tous les paramètres process.

Congrès AgroStat 2016

Batch Statistical Process Control (BSPC) : un puissant outil d’analyse des risques et des procédés

L’initiative de la Food and Drug Administration (FDA) aux Etats-Unis a recommandé en 2004 la mise en œuvre du Process Analytical Technology  (PAT) dans l’industrie pharmaceutique, afin d’améliorer le contrôle des risques et des procédés.

Congrés agrostat 2016

Dix ans après, le PAT a été développé, testé et mis en œuvre dans de nombreux sites de R&D et industriels dans le monde entier. La première partie de cette présentation traite des objectifs et de la mise en œuvre du PAT.

La seconde partie se concentre sur un domaine d’application important du PAT, présentant une haute valeur ajoutée, à savoir BSPC (Batch Statistical Process Control) à l’aide d’une analyse de données multivariées.

Conférence NIR 2013

Supervision de mélanges pharmaceutiques et détermination du end-point grâce à la spectroscopie NIR en utilisant l’approche Prototype.

 

L’échantillonnage suivi par analyse quantitative est progressivement remplacé par les technologies PAT telles que la spectroscopie NIR pour la détermination de l’homogénéité du mélange (Sanchez, 1995; El-Hagrasy, 2006; Shi, 2008; Igne, 2011).

Conference NIR2013

En raison des diverses sources de variabilité du procédé ayant une incidence sur la trajectoire du processus, il n’y a pas deux mélanges qui atteindront l’homogénéité en même temps. Certaines méthodes qualitatives comme l’ACP ou SIMCA et quantitatives comme la PLS, associées à des statistiques spécifiques, ont déjà été appliquées pour aider à déterminer le moment où une opération de mélange doit être terminée. Cette étude propose d’utiliser une méthode qualitative appelée Prototype utilisant des statistiques innovantes pour la détermination du end-point d’une réaction.

Discrimination

Congrès Chimiométrie 2024

Stratégie de classification des niveaux de réactivité enzymatique d’échantillons de biomasse lignocellulosique à l’aide de leur signal LC-HRMS.
Identification des biomarqueurs responsables d’une activité enzymatique de faible niveau

Les produits intermédiaires tels que les composés oxygénés peuvent interférer avec la cinétique de bioconversion de la biomasse lignocellulosique en bioéthanol.

La discrimination des biomasses à faible réactivité enzymatique peut permettre l’identification des biomarqueurs responsables d’un effet inhibiteur de la bioconversion.

Les données Chromatographie en phase Liquide couplée à la Spectrométrie de Masse Haute Résolution (LC-HRMS) sont des données complexes en 3 dimensions. La stratégie proposée a été de considérer les deux dimensions LC et MS comme deux blocs de données distincts.

Diverses corrections (ligne de base, blanc, alignement…) et divers pré-traitements ont été réalisés pour chacun des blocs séparément. Puis des modèles de discrimination des échantillons à faible réactivité enzymatique ont été développés par PLS-DA  (Partial Least Square Regression – Discriminant Analysis) pour les deux dimensions séparément, puis  en fusion bas niveau après une standardisation des blocs.

Ainsi, les performances d’une analyse de ces blocs uniques et d’une analyse multi-blocs ont été comparées.

De bonnes performances ont été obtenues, avec un seul échantillon mal classé.

De plus, en étudiant les coefficients discriminants, les biomarqueurs pertinents de réactivité enzymatique peuvent être identifiés dans les deux dimensions et aider à l’interprétation.

Congrès Chimiométrie 2017

Stratégies de discrimination de polymères sur des procédés continus par spectroscopie proche infrarouge en ligne

Les méthodes basées sur la spectroscopie vibrationnelle, et plus spécifiquement le proche infrarouge (PIR), permettent d’obtenir des résultats rapides et précis at-line ou on-line. On peut ainsi remplacer des techniques lourdes en termes de maintenance, dangerosité ou préparation d’échantillons par la mesure d’un spectre PIR qui peut se faire sans préparation sur un prélèvement d’échantillon ou directement en ligne.

Conference Chimiométrie 2017

Lors du contrôle de procédés continus, la difficulté mais aussi l’intérêt de l’analyse PIR en ligne est de pouvoir suivre les transitions d’un produit A à un produit B, afin d’isoler les produits conformes de ceux dont les propriétés pourraient être affectées par la transition.

Dans le cas des polymères, les transitions peuvent être dues à un changement de composition (% de comonomère X par rapport à Y, ajout ou suppression d’un comonomère) ou à un changement de taux de polymérisation. Des modèles exhaustifs pour la prédiction quantitative des propriétés des polymères permettent d’obtenir des valeurs tout au long du procédé ; néanmoins, dans la plupart des cas, ces modèles ne sont pas suffisamment précis. Il est alors important de déterminer à quel produit l’analyseur PIR est confronté afin de choisir le modèle quantitatif spécifique du produit et ainsi prédire la fin de la transition et le passage à un état stabilisé.

Cet article vise donc à évaluer diverses stratégies de discrimination des polymères basées sur les spectres PIR lors des transitions afin de pouvoir choisir les méthodes quantitatives adéquates pour le suivi en ligne de la polymérisation.

 

Rencontres HélioSPIR 2014

Discrimination de profils qualitatifs de moûts de raisin par spectroscopie moyen infrarouge et transfert inter-instruments

Actuellement,  les œnologues ne disposent pas d’outils rapides permettant d’orienter les raisins à la vendange selon leur potentiel aromatique vers un procédé de vinification spécifique. Le projet mené avec l’Institut Français de la Vigne et du Vin (IFV) a pour ambition de modéliser le potentiel qualitatif d’une parcelle de vigne en mettant en relation les données issues de spectres moyen infrarouge mesurés sur raisins avant vendange et la qualité finale du vin.

Cette étude permet d’aborder le problème de la discrimination et du transfert d’étalonnage en spectroscopie moyen infrarouge dans un cadre complexe comprenant les contraintes suivantes :

  • Caractérisation d’un potentiel aromatique à partir de spectres moyen infrarouge
  • Modèle de discrimination basé sur une mesure de référence sensorielle
  • Transfert d’étalonnage entre spectromètres (divers équipementiers de spectromètres, réseau de mêmes spectromètres entre caves coopératives et laboratoires, gestion d’opérations de maintenance/pannes)
  • Disponibilité des échantillons de standardisation
  • Représentativité de l’échantillonnage
  • Variabilité entre millésimes

 

L’objectif est d’établir un modèle de discrimination entre spectres moyen infrarouge et un classement sensoriel à 2 modalités (Fruité / Végétal) sur plusieurs millésimes.

La problématique du transfert d’étalonnage en cas réel dans le cadre d’un modèle de discrimination sera détaillée, avec notamment l’importance du choix de la méthode de transfert (DS, PDS, TOP/EPO, centrage local…) et du choix des échantillons du jeu de standardisation.

Ce travail a été mené en partie dans le cadre d’un projet collaboratif de recherche FUI appelé VINNEO, financé par l’état, la Région Occitanie (ex Languedoc-Roussillon), BPI France et le Fonds Européen FEDER, en collaboration avec les équipes de Vinovalie, caves coopératives viticoles du Sud-Ouest.

  • Milena VELEVA
    On a, plusieurs fois, eu recours à Ondalys. Pour nous, Ondalys c’est un pont entre la recherche universitaire et l’industrie. Et un pont de bonne qualité je dirais parce qu’en fait, on a pleinement confiance. On sait que si les méthodes qui sont étudiées dans les domaines universitaires, ont des retombées pour les industriels, et ben Ondalys va les connaitre. Ondalys nous permet de gagner du temps. Lorsque nous leur confions une problématique, ils y répondent rapidement avec la bonne compétence, une bonne écoute et une réponse ciblée à notre question.
    Milena VELEVA
    Royal Canin - Mars Petcare

Nos prochaines formations


Ondalys, organisme de formation agréé, délivre des formations inter et intra-entreprises professionnelles aux industriels et institutionnels.

Notre expertise au service de l’analyse de vos données

Fort d’une expérience de plus de 15 ans dans l’analyse de données (chimiométrie), en particulier appliquée aux mesures spectroscopiques, analytiques et sensorielles, nos équipes vous accompagnent à chaque étape de vos projets

Besoin d’une formation sur mesure ?

Nos équipes étudient votre demande plus en détails pour vous proposer une formation personnalisée

Inscrivez-vous
à la newsletter Ondalys

Français