Le CDRIN développe un logiciel libre pour démocratiser la vision par ordinateur en milieux scientifiques

Rédaction

CDRIN

Date

7 mai 2026

Au CDRIN, plusieurs projets de reconnaissance visuelle ont permis de constater un frein récurrent : l’annotation manuelle des données. Ce défi s’est notamment manifesté dans le cadre de travaux menés avec Pêches et Océans Canada, où la vision par ordinateur peut soutenir l’analyse de données visuelles liées aux écosystèmes marins.

Pour entraîner un modèle d’intelligence artificielle, les images doivent être annotées avec précision. Les objets doivent être identifiés, classés et parfois mesurés. Cette étape demande du temps et doit souvent être reprise lorsqu’un nouveau contexte, un nouvel environnement ou un nouveau type de données apparaît. Dans plusieurs cas, cette contrainte ralentit l’utilisation de la vision par ordinateur malgré le potentiel des outils disponibles. Ce sont surtout les coûts humains et techniques associés à la préparation des données qui limitent leur adoption.

Une approche pour réduire l’effort d’annotation

C’est dans ce contexte que le CDRIN a entrepris le développement de VAIT (Vision AI Trainer), un logiciel libre visant à réduire l’effort d’annotation. Le projet, réalisé dans le cadre d’un partenariat avec Pêches et Océans Canada et l’Institut Maurice-Lamontagne, cherche à simplifier plusieurs étapes qui demandent habituellement des connaissances spécialisées en intelligence artificielle.

Pour y parvenir, le CDRIN combine différents outils, librairies et modèles à code source ouvert afin de construire une solution cohérente et adaptable à des contextes variés. Cette approche d’intégration technologique permet de simplifier des chaînes de traitement souvent complexes tout en conservant une architecture extensible.

L’objectif n’est pas de remplacer l’expertise humaine, mais de réduire le travail répétitif associé à la préparation des données et à l’entraînement des modèles.

Nous avons joint différents outils et modèles à code source ouvert et développé le logiciel nommé VAIT, également à code source ouvert. VAIT permet d'abstraire les étapes non nécessaires et qui habituellement exigent des compétences dans le domaine de l'IA, telles que l'annotation manuelle, la fusion d'ensembles de données, le traitement des hyperparamètres, le lancement d'entrainement et d'inférence.

Ce que le logiciel permet

VAIT intègre des méthodes d’étiquetage automatique, d’augmentation de données et de génération de données synthétiques afin de réduire le travail nécessaire à la préparation des données d’entraînement. Le logiciel vise à accélérer la création de modèles légers de détection et de classification d’objets.

Le module de détection, de classification et de mesure développé précédemment par l’équipe est enrichi par un processus automatisé de génération d’annotations. Des modèles généralistes servent à initialiser les ensembles de données avant leur adaptation à des contextes plus spécifiques.

Le logiciel s’appuie sur un pipeline regroupant différents outils et modèles ouverts pour simplifier les étapes de préparation des données, d’entraînement et d’inférence. Il utilise notamment des architectures YOLO adaptées à des workflows d’inférence efficaces et portables.

Pipeline du logiciel libre à code ouvert VAIT.

Garder l’humain au centre du processus

Même avec cette automatisation, l’humain conserve un rôle central. Les annotations proposées automatiquement doivent être validées et ajustées. Cette étape permet d’assurer la qualité des données et la précision des résultats. À chaque cycle d’entraînement, le système améliore aussi ses propositions.

L’équipe souhaite également éviter les interfaces complexes souvent associées aux outils d’intelligence artificielle. Le logiciel doit rester accessible. Une personne sans expertise avancée en IA doit pouvoir l’utiliser après une courte prise en main.

Un outil pensé pour des environnements contraints

Le projet vise aussi des usages en milieux contraints. Le logiciel pourra être installé localement, sans dépendance au nuage. Cette approche facilite son utilisation sur le terrain, dans des environnements naturels ou dans des stations éloignées où la connectivité demeure limitée.

Des applications en contexte maritime et scientifique

Plusieurs applications peuvent être envisagées. Le logiciel pourrait soutenir des projets de surveillance d’écosystèmes marins, d’identification d’espèces aquatiques ou d’analyse automatisée de contenus visuels dans des contextes scientifiques.

Une solution transférable

Le CDRIN souhaite enfin développer un outil transférable. La solution pourra être utilisée en recherche appliquée, en formation collégiale et dans différents contextes scientifiques. En réduisant l’effort d’annotation et les barrières techniques, le projet contribue aussi à rendre la vision par ordinateur plus accessible à des organisations qui disposent de peu de ressources spécialisées en intelligence artificielle.

La recherche appliquée Développement d’un logiciel libre facilitant la création des données nécessaires à l’entraînement de modèles légers de détection et classification d’objets du CDRIN est présentée en communication affichée lors du Colloque de l’ARC et du Réseau des CCTT dans le cadre du 93e Congrès de l’Acfas, Université du Québec à Trois-Rivières, 11 mai 2026.

Développement d’un logiciel libre facilitant la création des données nécessaires à l’entraînement de modèles légers de détection et classification d’objets

Équipe de recherche

Maxime Daigle: Diplômé en informatique du Cégep de Matane, Maxime se spécialise dans l’intégration de technologies de pointe au sein d’applications modernes. Au CDRIN, il contribue à des projets en analyse et génération d’animation, création de données synthétiques, vision par ordinateur, ainsi qu’en packaging et déploiement de solutions. Passionné par la création sur moteur de jeux, l’automatisation et l’impression 3D, il aime explorer les frontières entre le développement logiciel et les technologies émergentes.

Azzahrae El Khiati est programmeuse-chercheuse R&D au CDRIN. Titulaire d’un baccalauréat en génie logiciel de Polytechnique Montréal, elle a débuté au CDRIN comme stagiaire en 2021 avant de rejoindre l’équipe à temps plein. Son expertise couvre l’IA, le traitement d’images et le développement de logiciels. Elle participe à la conception, la programmation et les tests de solutions pour divers projets de R&D.

Olivier Leclerc: Le programmeur chercheur senior construit construit des ponts entre le réel et le virtuel. Expert R&D en vision numérique et IA et fort d’une riche expérience qui inclut le développement de jeux vidéo multijoueurs (Frima), la réalité augmentée (Arcane Technologies) et l’analyse d’images médicales (Optel), il excelle dans le développement d’algorithmes et de prototypes d’applications. Les champs de recherche d’Olivier touchent la photogrammétrie, la vidéogrammétrie, la détection d’objets, les cartes de profondeur ainsi que la technologie SLAM et les NeRFs.

Yann Roubeau est programmeur-chercheur au CDRIN. Formé en France (BTS SNIR) puis au Québec (DEC Informatique) au Cégep de Matane, il se spécialise en vision par ordinateur et en grands modèles de langage. Il contribue à plusieurs projets de R-D appliquée, de la détection de poissons à la génération 3D, avec un intérêt marqué pour l’IA, les mathématiques appliquées et l’astrophysique.

Le CDRIN développe un logiciel libre pour démocratiser la vision par ordinateur en milieux scientifiques