Date de début de contrat : dès que possible
Le/la stagiaire développera un outil d’annotation de données multiformats (texte, image, PDF), en s’appuyant sur des solutions open-source. Il/elle concevra une interface intuitive d’annotation manuelle, explorera l’intégration de modèles de langage (LLM) pour l’annotation semi-automatique, et évaluera leurs performances pour accélérer et fiabiliser le processus.
Durée du contrat : 4 à 6 mois
Nous vous proposons d’effectuer votre stage de fin d’étude de 4 à 6 mois au sein de l’équipe Probayes Paris où nous traitons de nombreux sujets tels que : la détection et classification d’anomalies, la maintenance prédictive, le Traitement Automatique des Langues ainsi que différents cas d’usage industriels mêlant problématiques de vision ou de calcul embarqué.
Face aux besoins croissants en traitement et exploitation de données, l’annotation manuelle reste une étape cruciale mais chronophage qui devient une contrainte en termes de temps et de coûts. Nous recherchons donc une solution qui pourrait accélérer et améliorer ce processus d’annotation.
Ce stage vise à développer un outil d’annotation de données avancé capable de gérer plusieurs formats de données (PDF, images, textes, etc.). L’outil s’appuiera sur des bases open-source, en y intégrant des fonctionnalités d’automatisation pour simplifier et réduire le temps d’annotation. Il permettra également d’explorer des pistes innovantes d’annotation semi-automatique via des modèles de langage (LLM), afin de limiter le besoin d’interventions humaines.
Le/la stagiaire aura pour mission principale de développer cet outil d’annotation de données en suivant plusieurs phases. Voici les grandes lignes du projet :
État de l’art et choix technologiques
Objectif : Étudier les outils open-source d’annotation existants pour évaluer leurs avantages, inconvénients et limites par rapport aux besoins identifiés.
Tâches :
Développement d’une interface d’annotation manuelle
Objectif : Développement d’une interface intuitive pour faciliter l’annotation des données.
Tâches :
Exploration de l’annotation assistée par LLM
Objectif : Analyser et intégrer les capacités des modèles de langage (LLM) pour l’annotation semi-automatique.
Tâches :
Étudiant(e) en 3ème année d’école d’ingénieurs, en informatique, ou en Master spécialisé en Intelligence Artificielle / Big Data.
Compétences requises
Compétences appréciées
Conformément aux engagements pris par Probayes, en faveur de l'accueil et de l'intégration des personnes en situation de handicap, une priorité sera donnée, à compétences égales aux personnes en situation de handicap.
Utilisez notre formulaire :
Infos sur sur vos données personnelles :
Les données vous concernant font l’objet d’un traitement informatique destiné à la gestion des candidatures soumises à Probayes. Ces données sont traitées de manière confidentielle. Seules les personnes habilitées de notre société pourront accéder à vos données à des fins strictement internes. Vos données sont conservées pour une durée maximale de 24 mois après la date de notre dernier contact. Conformément à la réglementation applicable en matière de protection des données personnelles, entrée en application le 25 mai 2018, vous disposez d’un droit d’accès, de rectification, d’opposition, de limitation du traitement, de portabilité et d’effacement. Ces droits peuvent être exercés aux adresses suivantes (veillez à préciser vos nom, prénom, adresse postale en justifiant de votre identifié) :
Dans le cadre de la politique de protection des données personnelles de La Poste, vous pouvez contacter Madame la Déléguée à la Protection des Données, CP C703, 9 rue du Colonel Pierre Avia 75015 PARIS. En cas de difficulté dans la gestion de vos données personnelles, vous pouvez introduire une réclamation auprès de la CNIL.