Informations sur les séminaires passés de l’équipe DYNI du laboratoire LSIS :
Date : 07/06/2013 |
Title : Machine Learning For Bioacoustics |
Talk (Video) |
Heure : 15h00 à 17h00 |
Speaker : PR, Yann LeCun Director of the Center for Data Science
|
|
Place : USTV, K 108 | Abstract:Animals and humans can learn to perceive and communicate with an efficiency that no Machine Learning method can approach. The brains of humans and animals are « deep », in the sense that each action is the result of a long chain of synaptic communications (many layers of processing). We are currently researching efficient learning algorithms for such « deep architectures ». We are currently concentrating on unsupervised learning algorithms that can be used to produce deep hierarchies of features for recognition. We surmise that understanding deep learning will not only enable us to build more intelligent machines.
Talk (Video) |
Date : 28/03/2013 |
Title : Functional Data Analysis via Bayesian nonparametrics with application to signal classification | Slides[download id= »6″] |
Heure : 13h30 à 14h30 | Speaker : DR. Asma Rabaoui (Institut Fresnel, Equipe Phyti) | |
Place : USTV, R prim 107 | Abstract: In many signal processing applications, data collected are drawn from continuous processes and often obtained in the form of functions. Functional data analysis (FDA) is a very attractive field of research that provides the possibility to fully exploit structure in such inherently continuous data. While more traditional approaches of functional data analysis are parametric and require specifying in advance a basis function for the data, challenges in modern signal processing applications motivate the nonparametric analysis of these data. In this talk, I will show how to deal with functional classification problems from a Bayesian nonparametric approach. Then, I will provide theoretical and practical motivations for our approach using Dirichlet process mixtures and Gaussian processes. Finally, I will illustrate experimentally that the Bayesian nonparametric FDA framework is particularly relevant for audio processing applications where attributes are really functions and dependent of each others.. |
Date : 06/03/2013 |
Title : Structuration et analyse automatique de flux audio | Slides[download id= »5″] |
Heure : 13h30 à 14h30 | Speaker : DR. Thomas Fillon, TELECOM ParisTech | |
Place : USTV, R prim 107 | Abstract: Flux radiophoniques, musique, vidéo, archives ou collections sonores : dans de nombreux contextes applicatifs, la numérisation des données audio offre la possibilité de réaliser des traitements automatisés ou semi-automatisés et permet un accès facilité à ces données. En outre, le développement conjoint de méthodes de traitement de signal et de classification autorise l’extraction d’informations sémantiques sans avoir recours à une annotation manuelle systématique.Cet exposé propose une description des méthodes de classification et de traitement du signal utilisées dans les tâches de structuration et d’analyse automatique des flux audio en précisant les différents contextes applicatifs et leurs problématiques respectives. Deux exemples particuliers de structuration et d’analyse de flux audio seront présentés : la classification automatique de signaux audio et l’analyse rythmique de morceaux de musique. La méthodologie de classification de signaux audio proposée repose sur l’extraction de descripteurs audio de natures diverses (temporelle, énergétique, spectrale, cepstrale) et d’horizons temporels variés (long terme ou court terme) et sur l’utilisation d’un classificateur par Machine à Vecteurs de Support (SVM). Dans le domaine de l’analyse des signaux musicaux, l’extraction automatique d’informations rythmiques comme la position des temps est une tâche essentielle car elle caractérise la structure temporelle d’un morceau de musique. Dans ce contexte, la méthodologie proposée consiste premièrement à estimer les instants d’attaques des instruments au cours du temps. Par la suite, l’estimation et le suivi conjoints du tempo (fréquence) et de la position des temps (phase) sont effectués grâce à un formalisme probabiliste original basé sur le concept de Champs de Markov aléatoires (Conditional Random Fields, CRF). Chaque partie de l’exposé sera illustrée d’exemples concrets de réalisation. |
Date : 20/12/2012 |
Title : Classification non supervisée à base de modèles de mélanges topologiques : Application à la fouille de données catégorielles, continues et séquentielles | Slides[download id= »4″] |
Heure : 13h00 à 14h00 | Speaker : DR. Nicoleta ROGOVSCHI (Université Paris Descartes, LIPADE Equipe GFD) | |
Place : USTV, R prim 107 | Abstract: L’exposé présente des approches de classification non supervisée (clustering) utilisant des méthodes à base de prototypes exprimées dans un formalisme de modèles de mélanges pour le traitement de données qualitatives, mixtes et séquentielles. Pour chaque type de données, un modèle d’apprentissage non supervisé adapté à la nature des données traitées est proposé. L’exposé est structuré autour de trois parties : La première partie présente un nouvel algorithme d’apprentissage non supervisé BeSOM (Bernoulli Self-Organizing Map) dédié aux données binaires. Dans ce modèle génératif, chaque unité de la carte est associée à une distribution de Bernoulli. Dans ce cas, l’apprentissage a pour objectif d’estimer la fonction densité sous forme d’un mélange de densités élémentaires. Chaque densité élémentaire est elle aussi un mélange de lois de Bernoulli définies sur un voisinage topologique. La seconde partie de l’exposé aborde le problème des approches probabilistes pour le partitionnement des données mixtes (quantitatives et qualitatives). Le modèle proposé donne une autre dimension aux cartes topologiques : il permet une interprétation probabiliste des cartes et offre la possibilité de tirer profit de la distribution locale associée aux variables continues et catégorielles. La troisième partie est consacrée au cas de données structurées en séquences pour lesquelles je propose un nouveau formalisme de mélanges Markovien dédié au traitement de ce type de données. L’approche proposée est une extension des chaînes de Markov traditionnelles. Deux variantes sont développées : une approche globale où la topologie est utilisée d’une manière implicite, et une approche locale où la topologie est utilisée d’une manière explicite. La validation de ces approches a été effectuée sur plusieurs types de données : données médicales, chiffres manuscrits, données textuelles (récit d’accident de la route), et des séquences de gènes. Les résultats obtenus sont encourageants et prometteurs à la fois pour la classification non supervisée et pour la modélisation de données de différentes natures. |
Date : 29/11/2012 |
Title : Utilisation des modèles de mélange pour la classification des données temporelles | [download id= »3″] |
Heure : 13h30 à 14h30 | Speaker : DR. Allou Samé (IFSTTAR, GRETIA) | |
Place : USTV, R’107 | Abstract: La description des données évoluant au cours du temps devient un problème central dans de nombreuses applications. La classification automatique permet, dans ce cadre, de déceler l’organisation sous-jatente des données sous la forme de classes évoluant au cours du temps. Fondamentalement, ce problème nécessite la définition de métriques appropriées mais une alternative consiste à s’appuyer sur les mélanges de lois. L’utilisation intensive, ces dernières années, des modèles de mélange tient surtout du fait de l’efficacité de l’algorithme EM pour l’estimation des paramètres.Nous montrerons dans cet exposé comment le formalisme des modèles de mélange, initialement conçu pour les données « statiques » indépendantes peut être étendu à la classification des données temporelles. Les algorithmes de classification et de segmentation résultants seront illustrés sur des données simulées ainsi que dans le secteur des transports, sur des applications de télé – diagnostic de systèmes industriels dynamiques (portes pneumatiques d’autobus, aiguillage de rails). |