Experte en Chimiométrie et Machine Learning pour les données spectroscopiques, l’équipe d’Ondalys participe activement aux conférences dédiées ces thèmes.

 

Consultez ci-dessous les présentations scientifiques d’Ondalys
sur le thème des méthodes avancées de Chimiométrie et de Machine Learning

Méthodes avancées de Chimiométrie et Machine Learning

Colloquim Chemiometricum Mediterraneum 2025 – Septembre 2025

Machine Learning explicable : Interprétabilité des modèles de ML sur des données de spectroscopie proche infrarouge

Les modèles de Machine Learning (ML) sont souvent être décrits comme des « boîtes noires ». Afin de fiabiliser les résultats de ces modèles, il est crucial d’améliorer leur interprétabilité.  C’est ce que l’on appelle l’IA explicable (intelligence artificielle). Les travaux décrits dans cette présentation se focalisent sur l’interprétabilité des modèles de Machine Learning, basés sur des données spectroscopiques proche infrarouge.

Différents modèles de régression, tels que les machines à vecteurs de support (SVM), les réseaux de neurones artificiels (ANN) et les méthodes de Boosting (XGBoost), ont été entraînés et comparés aux modèles d’étalonnage PLS classiques. Différents algorithmes d’interprétabilité de modèles ML (LIME, Shapley…) actuellement appliqués à des données non spectroscopiques ont été testés et comparés entre eux mais également aux coefficients de régression d’un modèle de régression PLS intrinsèquement interprétable.

Cette étude démontre le potentiel d’application de différentes méthodes d’interprétabilité de modèles de Machine Learning appliqués aux données spectroscopiques proche infrarouge. 

Conférence Chimiométrie 2022 – Juin 2022

Analyse exploratoire des spectres de fluorescence 3D des matières premières et lien avec le rendement du procédé de bioproduction

Les matières premières (MP) utilisées en fermentation cellulaire peuvent être complexes et les conditions de culture cellulaire sont rigoureusement contrôlées dans la fabrication biopharmaceutique. Ainsi la variabilité d’un lot à l’autre des MP peut avoir un impact important sur le rendement des procédés de production d’antigènes vaccinaux.

La spectroscopie de fluorescence 3D, souvent combinée à des méthodes chimiométriques et de machine learning telles que l’analyse en composantes principales (ACP), l’analyse factorielle parallèle (PARAFAC) ou la modélisation par moindres carrés partiels (PLS) et PLS multilinéaire (N-PLS), est couramment utilisée pour l’identification ou la classification des matières premières.

Dans cet oral, nous présentons nos travaux communs avec GlaxoSmithKline ayant conduit au développement d’une méthode de fluorescence 3D permettant de caractériser une matière première complexe et, in fine, prédire le rendement en antigènes en fonction de la qualité du lot de matières premières.

Après optimisation des prétraitements pour améliorer la reproductibilité intra-lot et la séparation inter-lot, et sélection des variables les plus importantes grâce aux données issues des charges PARAFAC, le modèle PLS optimal semble très prometteur.

Club Chro du Val de Seine – AFSEPS – Juin 2022

Le data mining et le Machine Learning appliqués aux données chromatographiques

En Juin 2022, à l’Université de Rouen, le Club de Chromatographie du Val de Seine, co-fondateur de l’AFSEP – l’Association Francophone des Sciences Séparatives – organisait sur une journée de travail sur le thème l’analyse de données chromatographiques : Datamining : que faire de toutes ces données ?

A cette occasion Ondalys a présenté les méthodes de Chimiométrie analyse de données multivariées – et Machine Learning qui peuvent être appliqués aux données OMICS, et plus particulièrement de données de Metabolomics, telles que les données de chromatographie LC (Chromatographie en phase Liquide), LC-MS (Chromato Liquide – Spectroscopie de Masse), HPLC (chromatographie en phase liquide haute performance ou haute pression) mais aussi de MS (Spectrométrie de Masse)…

22èmes Rencontres HélioSPIR – Novembre 2021

Comparaison de méthodes de Machine Learning pour l’analyse de données spectroscopiques

Pour l’analyse de données spectroscopiques, les termes « d’analyse de données multivariées » ou de « chimiométrie » sont les plus souvent employés. Depuis quelques années, avec l’avènement des « Big Data » et autres « IoT – Internet des Objets », les termes « Machine Learning » et « d’Intelligence Artificielle (IA) » sont de plus en plus employés. Mais qu’est ce que le Machine Learning ?

Comme Monsieur Jourdain, ne faisons-nous pas de la prose sans le savoir ?

Au travers d’un cas concret de spectroscopie proche infrarouge (SPIR), cette présentation a pour objectif de présenter la modélisation de la teneur en matières grasses dans la viande, paramètre non linéaire, et comparer différentes méthodes de Machine Learning :

Congrès Chimiométrie 2019

Quelques aspects de la régression SVM : un exemple pour les prédictions quantitatives spectroscopiques

Dans la communauté de la chimiométrie, les techniques «Machine Learning» (ML) sont de plus en plus répandues, de même que les tendances en matière de battage publicitaire «Intelligence artificielle» (IA) et «Big Data». Mais comment appliquer ces techniques IA / ML de la manière la plus appropriée aux données de laboratoire et de production, et en particulier aux données spectroscopiques reste un défi.

Conference Chimiométrie 2019

Dans une étude précédente menée en 2018, nous avions comparé plusieurs méthodes de chimiométrie et d’apprentissage automatique: Partial Least Square Regression (PLS), Locally Weighted Regression (LWR),  Random Forest (RF), Support Vector Machines (SVM) et réseaux de neurones artificiels (ANN) sur données spectroscopiques dans le proche infrarouge (NIR). Nous avons prouvé que les techniques de Machine Learning peuvent considérablement améliorer les performances du modèle quantitatif pour les relations de modélisation non linéaires.
Dans cette étude, nous nous intéressons plus particulièrement aux Support Vector Machines (SVM), car elles présentent plusieurs avantages: elles permettent de modéliser des relations non linéaires, avec de bonnes performances par rapport aux méthodes linéaires, mais nécessitent moins d’échantillons et moins d’optimisation que les ANN. Les SVM démontrent aussi leur performances élevées sur les données présentant des relations linéaires.

Conférence Chimiométrie 2013

Pourquoi et comment utiliser l’analyse multi-blocs exploratoire ?

Les données multivariées sont abondantes pour caractériser les produits et les procédés. De plus en plus d’utilisateurs (universitaires et industriels) utilisent plusieurs tableaux de données ou blocs pour les mêmes observations ou échantillons. Plusieurs techniques d’analyse ou capteurs sont utilisés simultanément pour caractériser les échantillons.

Conference Chimiométrie 2013

Les outils chimiométriques sont donc utilisés pour combiner les différents tableaux de données afin d’extraire les meilleures informations pour prendre des décisions. Différentes stratégies sont possibles pour explorer un ensemble de tableaux de données. L’idée la plus simple et intuitive est de concaténer ou de fusionner des données et d’effectuer une ACP en utilisant une stratégie de pondération appropriée. D’autres méthodes ont été développées pour prendre en compte dans l’algorithme le fait que les données proviennent de différentes tables et pour estimer la relation entre les tables.


Le présent travail provient de la mise en œuvre de l’atelier intitulé « Analyse multi-blocs permettant de combiner différents types de tableaux de données spectroscopiques », organisé lors des cours pré-conférence de la conférence NIR2013 à La Grande Motte, en France. Nous avons essayé de montrer de manière pédagogique, sous forme de didacticiel, les principaux problèmes adressés à l’utilisateur final en vue d’une analyse multi-blocs utilisée dans des applications exploratoires. Les différentes étapes et les pièges sont illustrés à l’aide d’un ensemble de tableaux de données réelles rassemblés sur des huiles d’olive vierges provenant de différentes régions.

  • Milena VELEVA
    On a, plusieurs fois, eu recours à Ondalys. Pour nous, Ondalys c’est un pont entre la recherche universitaire et l’industrie. Et un pont de bonne qualité je dirais parce qu’en fait, on a pleinement confiance. On sait que si les méthodes qui sont étudiées dans les domaines universitaires, ont des retombées pour les industriels, et ben Ondalys va les connaitre. Ondalys nous permet de gagner du temps. Lorsque nous leur confions une problématique, ils y répondent rapidement avec la bonne compétence, une bonne écoute et une réponse ciblée à notre question.
    Milena VELEVA
    Royal Canin - Mars Petcare

Nos prochaines formations


Ondalys, organisme de formation agréé, délivre des formations inter et intra-entreprises professionnelles aux industriels et institutionnels.

Notre expertise au service de l’analyse de vos données

Fort d’une expérience de plus de 15 ans dans l’analyse de données (chimiométrie), en particulier appliquée aux mesures spectroscopiques, analytiques et sensorielles, nos équipes vous accompagnent à chaque étape de vos projets

Besoin d’une formation sur mesure ?

Nos équipes étudient votre demande plus en détails pour vous proposer une formation personnalisée

Inscrivez-vous
à la newsletter Ondalys