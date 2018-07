Le laboratoire d'informatique et d'intelligence artificielle du MIT vient de créer le premier système capable d'identifier un son à partir d'une image. Précédemment, la séparation de sources audio ne se basait que sur les sonorités et non sur l'image. Cette innovation permet de se passer de supervision manuelle. PixelPlayer ne requiert pas de précisions sur le type d'instrument ou sur le son que celui-ci produit.

A partir d'une image, cette intelligence artificielle analyse quels groupes de pixels sont responsables de la production d'ondes sonores spécifiques. Il peut en effet localiser un instrument grâce aux pixels de la vidéo (d'où le nom du projet). Après l'analyse ces derniers, PixelPlayer sait identifier l'instrument et extraire les sons qu'il produit. Un exploit possible après un entraînement de plus de 60 heures de visionnage vidéo. Le système est dorénavant efficace pour n'importe quelle performance musicale filmée. Un seul clic sur un instrument suffit pour l'isoler du reste de l'ensemble musical.

L'intelligence artificielle se montre encore une fois plus évoluée que l'être humain. Pourtant, celle-ci affiche encore quelques limites. Le système n'est capable de reconnaître qu'une vingtaine d'instruments pour l'instant. Un apprentissage plus en profondeur réduira ces limites. Par contre, certaines distinctions subtiles entre sous-classes d'instruments (aux tonalités différentes) seront difficiles à reconnaître pour le système.

Dans l'avenir, PixelPlayer devrait aider les ingénieurs à améliorer la qualité audio d'anciens enregistrements de concerts. Il pourrait aussi avoir une utilité pour les producteurs de musique. Cela permettrait de prévisualiser l'association d'autres instruments avec certaines parties musicales, comme remplacer une guitare électrique par une acoustique. Selon un des chercheurs, Hang Zhao, cette nouvelle intelligence artificielle devrait aussi potentiellement aider les robots à distinguer le bruit produit par les animaux de celui des voitures par exemple. Une véritable avancée scientifique avec des répercussions dans plusieurs domaines. L'équipe des six chercheurs du projet "The Sound of Pixel" présenteront leur invention lors de la "European Conference on Computer Vision", prévue à Munich en septembre prochain.