Projet de recherche

Genèse du projet

Le L3i a initié en 2011, le projet eBDthèque afin de valoriser les contenus des bandes dessinées. Les recherches ont été initiées par les thèses de Christophe Rigaud et Clément Guérin. La première était consacrée au développement de méthodes de traitement d’images pour extraire le contenus des images de bandes dessinées. La seconde, quant à elle, s’est attachée à l’analyse sémantique du contenu des bandes dessinées.
En 2015, le L3i et Actialuna ont débuté une première collaboration avec le projet iiBD financé dans le cadre des Programmes d’Investissement d’Avenir (PIA).
A l’issu de ce projet, s’est manifesté le désir d’aller plus loin et de créer un laboratoire commun. C’est ainsi qu’est né le Sequential Art Image Laboratory (SAIL).

Objectifs

Le SAIL a pour ambition de mutualiser les compétences du L3i et de Actialuna afin de développer des outils et des services disruptifs. Ces innovations, issues des recherches menées au L3i, vont permettre à la plateforme Sequencity d’offrir à ses utilisateurs des usages originaux, à même de lui donner un réel avantage compétitif.

L’un des premiers objectifs du LabCom est de fiabiliser le travail entamé au cours de l’Investissement d’Avenir iiBD, afin de passer du prototype à une chaîne de traitement à 90% opérationnelle — le taux d’analyses satisfaisantes se situant à ce jour autour de 25% du catalogue. En outre, les recherches menées au sein du LabCom auront pour objectif de s’attaquer à des problèmes de plus en plus complexes.
Ainsi, au-delà de la détection des éléments de base comme les cases, les bulles ou le texte, la reconnaissance du texte manuscrit, des personnages, des situations, des éléments de décor, des onomatopées, etc. nécessiteront de développer des approches mixant des compétences en traitement et analyse d’images, de représentation des connaissances, et d’intelligence artificielle. Avec pour objectif final d’obtenir une description sémantique précise des albums, des pages et des cases tant au
niveau géométrique (structure des pages) que textuel (compréhension du texte) et graphique (éléments visuels).
Les résultats de ces recherches seront exploités par Actialuna pour donner à sa plateforme Sequencity un avantage compétitif certain, en développant des services innovants tels que :
• la recherche plein texte au sein d’un corpus de BD ;
• la recommandation automatique issue des thèmes/noms/lieux/périodes cités ;
• la traduction automatique et sociale des oeuvres ;
• la recherche d’éléments visuels (objets, lieux, …) ;
• des informations et services contextuels à la lecture (situer un lieu cité sur une carte, une page Wikipedia, etc.)

Structuration

Afin de mener à bien le projet, la feuille de route a été définie ainsi :

  • Améliorer la chaîne de traitement IA+Big Data obtenue au terme du projet iiBD
  • Ajouter de nouvelles fonctionnalités à la chaine de traitement
  • Automatiser les traitements pour s’adapter aux différents type de bandes dessinées (Comics, Manga, …)