Rédaction
Date
Au CDRIN, plusieurs projets de reconnaissance visuelle ont permis de constater un frein récurrent : l’annotation manuelle des données. Ce défi s’est notamment manifesté dans le cadre de travaux menés avec Pêches et Océans Canada, où la vision par ordinateur peut soutenir l’analyse de données visuelles liées aux écosystèmes marins.
Pour entraîner un modèle d’intelligence artificielle, les images doivent être annotées avec précision. Les objets doivent être identifiés, classés et parfois mesurés. Cette étape demande du temps et doit souvent être reprise lorsqu’un nouveau contexte, un nouvel environnement ou un nouveau type de données apparaît. Dans plusieurs cas, cette contrainte ralentit l’utilisation de la vision par ordinateur malgré le potentiel des outils disponibles. Ce sont surtout les coûts humains et techniques associés à la préparation des données qui limitent leur adoption.
Une approche pour réduire l’effort d’annotation
C’est dans ce contexte que le CDRIN a entrepris le développement de VAIT (Vision AI Trainer), un logiciel libre visant à réduire l’effort d’annotation. Le projet, réalisé dans le cadre d’un partenariat avec Pêches et Océans Canada et l’Institut Maurice-Lamontagne, cherche à simplifier plusieurs étapes qui demandent habituellement des connaissances spécialisées en intelligence artificielle.
Pour y parvenir, le CDRIN combine différents outils, librairies et modèles à code source ouvert afin de construire une solution cohérente et adaptable à des contextes variés. Cette approche d’intégration technologique permet de simplifier des chaînes de traitement souvent complexes tout en conservant une architecture extensible.
L’objectif n’est pas de remplacer l’expertise humaine, mais de réduire le travail répétitif associé à la préparation des données et à l’entraînement des modèles.
Ce que le logiciel permet
VAIT intègre des méthodes d’étiquetage automatique, d’augmentation de données et de génération de données synthétiques afin de réduire le travail nécessaire à la préparation des données d’entraînement. Le logiciel vise à accélérer la création de modèles légers de détection et de classification d’objets.
Le module de détection, de classification et de mesure développé précédemment par l’équipe est enrichi par un processus automatisé de génération d’annotations. Des modèles généralistes servent à initialiser les ensembles de données avant leur adaptation à des contextes plus spécifiques.
Le logiciel s’appuie sur un pipeline regroupant différents outils et modèles ouverts pour simplifier les étapes de préparation des données, d’entraînement et d’inférence. Il utilise notamment des architectures YOLO adaptées à des workflows d’inférence efficaces et portables.
Garder l’humain au centre du processus
Même avec cette automatisation, l’humain conserve un rôle central. Les annotations proposées automatiquement doivent être validées et ajustées. Cette étape permet d’assurer la qualité des données et la précision des résultats. À chaque cycle d’entraînement, le système améliore aussi ses propositions.
L’équipe souhaite également éviter les interfaces complexes souvent associées aux outils d’intelligence artificielle. Le logiciel doit rester accessible. Une personne sans expertise avancée en IA doit pouvoir l’utiliser après une courte prise en main.
Un outil pensé pour des environnements contraints
Le projet vise aussi des usages en milieux contraints. Le logiciel pourra être installé localement, sans dépendance au nuage. Cette approche facilite son utilisation sur le terrain, dans des environnements naturels ou dans des stations éloignées où la connectivité demeure limitée.
Des applications en contexte maritime et scientifique
Plusieurs applications peuvent être envisagées. Le logiciel pourrait soutenir des projets de surveillance d’écosystèmes marins, d’identification d’espèces aquatiques ou d’analyse automatisée de contenus visuels dans des contextes scientifiques.
Une solution transférable
Le CDRIN souhaite enfin développer un outil transférable. La solution pourra être utilisée en recherche appliquée, en formation collégiale et dans différents contextes scientifiques. En réduisant l’effort d’annotation et les barrières techniques, le projet contribue aussi à rendre la vision par ordinateur plus accessible à des organisations qui disposent de peu de ressources spécialisées en intelligence artificielle.
La recherche appliquée Développement d’un logiciel libre facilitant la création des données nécessaires à l’entraînement de modèles légers de détection et classification d’objets du CDRIN est présentée en communication affichée lors du Colloque de l’ARC et du Réseau des CCTT dans le cadre du 93e Congrès de l’Acfas, Université du Québec à Trois-Rivières, 11 mai 2026.