Bandeau_V4

Formations pré-congrès: 27 janvier 2020

Ces séminaires pré-congrès s'adressent aux étudiants (doctorants, post-doctorants, etc.) mais également aux chercheurs, enseignants-chercheurs et ingénieurs afin de découvrir, parfaire et/ou consolider des connaissances dans le domaine de la chimiométrie. Les sessions sont de 3 heures et se dérouleront le lundi 27 janvier 2020 sur le Campus Liège Sart Tilman, réparties entre le matin et l'après-midi. Ces formations seront théoriques ou en alternance théorie/pratique (ordinateur non fourni). Les places sont limitées à 25 personnes par cours et l'inscription au congrès est obligatoire. 

L'accès au site est assuré par la ligne de bus 48 (Opéra - Guillemins - Sart Tilman Université - CHU): Arrêt SART-TILMAN Amphithéatres.

Les sessions se tiendront dans le bâtiment B31, Quartier AGORA.

 

B31

 

Utilisation des approches sparses pour l'analyse d'un ou plusieurs tableaux de données en grande dimension (Formation annulée) 

Philippe Bastien, L'Oréal Recherche

Ph Bastien

Après une introduction sur les problèmes d’estimation en grande dimension (malédiction de la dimensionnalité, multicollinéarité), on présentera les versions régularisées sparses (contraintes de type lasso) des méthodes d’analyse des données les plus utilisées : ACP, PLS (classique, discriminante, généralisée), analyse canonique simple et généralisée, K-means, clustering hiérarchique, bi-clustering. Ce cours qui se veut pédagogique à travers de nombreuses applications avec R fournira les éléments de base nécessaires à la compréhension de ces méthodes d'un point de vue à la fois théorique et pratique. 

 Analyse chimiométrique en imagerie hyperspectrale

 Ludovic Duponchel, Université de Lille

 L_Duponchel.pngL'objectif de ce cours de 3h est d'introduire l'ensemble des outils nécessaires à l'exploration de données hyperspectrales / multispectrales provenant d'expériences d'imagerie spectroscopique comme par exemple en Raman, moyen infrarouge, proche infrarouge et bien plus. Nous nous pencherons ainsi sur cette structure particulière du cube de données mêlant informations spectrales et spatiales. Après une introduction sur les principes instrumentaux spécifiques à ces expériences, nous aborderons en premier lieu l'exploration univariée qui est à la base de l'imagerie en insistant sur ses avantages et ses inconvénients. Les outils multivariés seront ensuite abordés comme par exemple l'Analyse en Composantes Principales (ACP), les méthodes de classification non-supervisée (Clustering, K-means...), les méthodes de classification supervisée (k-Nearest Neighbors, SIMCA, PLS-DA...) ou encore la résolution multivariée de courbes (MCR-ALS). Ce sont bien entendu des outils classiques de la chimiométrie mais nous les aborderons dans ce cadre spécifique de l'imagerie spectroscopique. Ce cours sera aussi l'occasion d'insister sur l'importance des prétraitements des données spectrales spécifique à ce domaine.

Aspects méthodologiques pour l'acquisition et le traitement de données métabolomiques

Julien Boccard & Serge Rudaz, Université de Genève

Julien_BoccardSerge_RudazLa métabolomique vise l'analyse la plus large possible des métabolites et de leurs potentielles altérations dans un système biologique. Pour cela, elle s’appuie sur la mesure de signatures biochimiques obtenues à l’aide d'outils analytiques de pointe pour caractériser des échantillons issus d’essais dirigés ou non. Des approches adaptées sont ensuite nécessaires pour extraire l'information biologique ou chimique pertinente de la grande quantité de signaux mesurés. Ce cours a pour objectif de présenter les principes, les objectifs et les outils importants de la métabolomique et son flux de travail.  Les principales plates-formes analytiques utilisées, basées sur la spectrométrie de masse, seront présentées, ainsi qu'une introduction à l'analyse de données multivariées et à la stratégie d’annotation des signaux instrumentaux pour obtenir une identité probable ou confirmée permettant une interprétation biologique.

Statistiques bayesiennes appliquées à la chimiométrie. Opportunités et exemples pour une mise en oeuvre pratique

Bruno Boulanger, PharmaLex Statistical Solutions

Bruno_boulangerAu cours des 15 dernières années, nous avons observé une utilisation et une application croissantes des statistiques bayésiennes dans la recherche, le dévelopement, la fabrication et la vente de produits biopharmaceutiques. Alors que les statistiques bayésiennes étaient principalement reconnues dans l'industrie pharmaceutique grâce au concept d'essais cliniques adaptatifs et innovants, la disponibilité des langages informatiques et de programmation, les statistiques bayésiennes sont de plus en plus utlisées dans tous les domaines, de la découverte à la fabrication en passant par l'économie de la santé et la prise de décision. Cela se produit également pour la chimiométrie au 21ème siècle. 

L'objectif de cette formation sera d'introduire progressivement les concepts communs aux statistiques bayésiennes, tels que les distributions a priori, a posterio et préfictives, à travers une grande variété d'exemples couvrant toute la gamme d'activités. Le rôle central des statistiques bayésiennes pour le développement et la validation des systèmes de mesure sera mis en évidence et comparé aux approches fréquentistes. Par exemple, la différence entre précision et incertitude sera expliquée dans une perspective bayésienne.

De plus, dans une perspective de cyle de vie pour les méthodes analytiques, nous montrerons comment développer des méthodes analytiques robustes et identifier l'espace de conception au moyen de la distribution prédictive postérieure. Les avantages liés à la simplicité de modélisation multivariée dans la statistique bayésienne seront également démontrés pour l'optimisation rapide de systèmes de mesure. En utilisant la distribution a priori, nous montrerons également comment effectuer efficacement un étalonnage complexe avec un nombre très limité d'échantillons, voire sans échantillon. Enfin, les systèmes de mesure étant développés pour aider à la décision ou par exemple pour contrôler un processus, nous montrerons comment connecter simplement, mais correctement la performance du système de mesure à la performance d'une décidion ou d'un processus. Plusieurs exemples pratiques serviront de base pour montrer de manière intuitive le concept et la valeur ajoutée des statistiques bayésiennes. 

Démélange spectral et résolution de courbes multivariées

Cyril Ruckebusch, Université de Lille 

Cyril RuckebuschLe cours démarre par la présentation géométrique du problème de démélange spectral. Il propose d’abord un aperçu rapide de l’ensemble des approches existant dans des domaines très divers. Il se focalise ensuite sur l’étude de mélanges bilinéaires et notamment l’approche dite de résolution de courbes multivariées (MCR) dont l’algorithme MCR-ALS est emblématique en chimiométrie. Il détaille les travaux récents effectués dans ce cadre  pour l'analyse de données de mélanges spectroscopiques (procédé, cinétique, imagerie hyperspectrale). Sur la base d’exemples détaillés, il illustre les principes de l’analyse multi-expérience, de la fusion de données de l’implémentation de contraintes spécifiques, …

ICA (Formation annulée) 

Douglas N. Rutledge, AgroParisTech

Douglas_RutledgeL'Analyse en Composantes Indépendantes (ICA) est une méthode d'analyse de signaux, développée il y a une vingtaine d'années dans le domaine des télécommunications, mais dont les applications se sont étendues à bien d'autres domaines dans lesquels le traitement du signal est nécessaire (comme en médecine, contrôle de procédés, chimie analytique, etc.). L'ICA est une méthode qui vise à extraire d'un ensemble de signaux mélangés, les "signaux purs" sous-jacents, ainsi que les proportions de ces signaux dans chaque mélange. Dans ce séminaire, cette méthode est comparée à une méthode beaucoup plus fréquemment utilisée, l'Analyse en Composantes Principales, qui calcule de nouvelles variables (latentes), les Composantes Principales, qui sont des combinaisons linéaires des variables originales et qui correspondent aux axes de dispersion maximale des échantillons.

Les méthodes de Machine Learning pour les données de laboratoire et industrielles

Sylvie Roussel, Ondalys

sylvie RosselLes méthodes de Machine Learning ont le vent en poupe dans le cadre de la digitalisation et de l'Industrie 4.0 avec l'émergence de la data science. Appliquées aux données de laboratoire et industrielles, ces méthodes peuvent être très performantes et très utiles, en élargissant le champ des méthodes chimiométriques. Ce cours visera à faire un tour d'horizon des différentes méthodes issues du Machine Learning (Arbres de décision, Forêts aléatoires, Boosting, Support Vector Machines, Réseaux de neurones) en abordant le principe de ces méthodes, leurs particularités, avantages et limites. Un focus sera également réalisé sur le risque de surapprentissage et les techniques de validation pour y remédier. Enfin quelques applications réelles seront exposées.

Personnes connectées : 1