Data mining : faites parler vos données !

Explorer les données par des méthodes de Data Mining

Pourquoi faire du Data Mining ?

Vous disposez de masses de données issues de différentes sources : instrumentales (spectroscopie proche infrarouge (NIR), moyen infrarouge (MIR), Raman, imagerie hyperspectrale, chromatographie HPLC, GC, etc..), paramètres procédés, mesures physico-chimiques, profils sensoriels…avec un nombre important d’échantillons et/ou de variables. Les méthodes de data mining vous aideront à augmenter la compréhension  de vos données et à en extraire des informations pertinentes…

Qu’est-ce que le Data Mining ?

Le data mining ou fouille de données constitue un ensemble de méthodes exploratoires qui vont vous permettre de trouver un sens à ces données, de détecter les échantillons atypiques, les mesures aberrantes et d’identifier des groupes d’individus ou des tendances fortes.

Vous souhaitez :

data visualization - visualisation des données

Visualiser

les échantillons atypiques, les clusters, les tendances…

Comprendre

les leviers de la qualité des procédés, la complémentarité des mesures

Dévleopper des calibrations spectroscopiques

Interpréter

les mélanges de spectres, la corrélation entre blocs

data mining - information extraction

L’ACP (Analyse en Composantes Principales) est la méthode multivariée la plus classique en Data Mining. D’autres méthodes plus spécifiques de déconvolution du signal peuvent également s’appliquer pour vos données spectroscopiques notamment dans les domaines de la chimie ou de l’industrie pharmaceutique. Parmi ces méthodes, on retrouve la MCR ou encore l’ICA. Elles permettent une meilleure interprétabilité des composantes du modèle en se focalisant sur l’extraction des spectres purs.

Si vous avez plusieurs blocs de données issus de différentes techniques analytiques ou différents capteurs, la complexité est d’autant plus importante. Il est alors intéressant de combiner ces blocs de données pour en extraire encore plus d’informations, notamment les informations communes à tous ces blocs et l’information spécifique de chaque bloc. L’analyse exploratoire est alors réalisée grâce à des méthodes multi-blocs.

Ces modèles exploratoires constituent une aide précieuse pour définir et optimiser les leviers de la qualité dans diverses applications.

Constituée d’experts pluridisciplinaires en analyse de données, l’équipe d’Ondalys vous assiste dans l’exploration de vos données et vous aide à les « faire parler ».

data mining and information extraction
  • Prétraitements spectroscopiques et sélection de variables
  • Calibration – Étalonnage multivarié (PLS, SVM, ANN, régression locale, …)
  • Classification (PLS-DA, SIMCA, SVM, …)
  • Validation et Robustesse des modèles
  • Transfert de calibrations (standardisation, orthogonalisation, …)

Implémentation logicielle

Nous développons vos calibrations avec tous les logiciels de chimiométrie du marché : Unscrambler®, SOLO®, PLS_Toolbox® dans l’environnement MATLAB®, SIMCA®, etc…,mais aussi les logiciels libres (R, Python…).

Notre expertise au service de l’analyse de vos données

Fort d’une expérience de plus de 15 ans dans l’analyse de données (chimiométrie), en particulier appliquée aux mesures spectroscopiques, analytiques et sensorielles, nos équipes vous accompagnent à chaque étape de vos projets

Besoin d’une formation?

Ils en parlent


« Ondalys nous a amené des compétences en traitement des données multi-tableaux »

Dr Jean-Michel ROGER, Chercheur à l'INRAe - Irstea

Inscrivez-vous
à la newsletter Ondalys

Français