Date : 06/03/2013 |
Titre :Structuration et analyse automatique de flux audio | Slides[download id= »5″] |
Heure : 13h30 à 14h30 | Speaker : DR. Thomas Fillon Chercheur à TELECOM ParisTech | |
Place : USTV, R prim 107 | Résumé : Flux radiophoniques, musique, vidéo, archives ou collections sonores : dans de nombreux contextes applicatifs, la numérisation des données audio offre la possibilité de réaliser des traitements automatisés ou semi-automatisés et permet un accès facilité à ces données. En outre, le développement conjoint de méthodes de traitement de signal et de classification autorise l’extraction d’informations sémantiques sans avoir recours à une annotation manuelle systématique.
Cet exposé propose une description des méthodes de classification et de traitement du signal utilisées dans les tâches de structuration et d’analyse automatique des flux audio en précisant les différents contextes applicatifs et leurs problématiques respectives. La méthodologie de classification de signaux audio proposée repose sur l’extraction de descripteurs audio de natures diverses (temporelle, énergétique, spectrale, cepstrale) et d’horizons temporels variés (long terme ou court terme) et sur l’utilisation d’un classificateur par Machine à Vecteurs de Support (SVM). Dans le domaine de l’analyse des signaux musicaux, l’extraction automatique d’informations rythmiques comme la position des temps est une tâche essentielle car elle caractérise la structure temporelle d’un morceau de musique. Dans ce contexte, la méthodologie proposée consiste premièrement à estimer les instants d’attaques des instruments au cours du temps. Par la suite, l’estimation et le suivi conjoints du tempo (fréquence) et de la position des temps (phase) sont effectués grâce à un formalisme probabiliste original basé sur le concept de Champs de Markov aléatoires (Conditional Random Fields, CRF). Chaque partie de l’exposé sera illustrée d’exemples concrets de réalisation. |
Next Talks
Lien Permanent pour cet article : https://seminaire-dyni.univ-tln.fr/