Hôpitaux de Brabois (Vandoeuvre-les-Nancy)

INGENIEUR DE DONNEES - 100% - H/F

Publié le 07 avr. 2026

Détails de l’offre

Poste proposé
INGENIEUR DE DONNEES - 100% - H/F
Contrat
CDD
Descriptif
Descriptif du poste :

LE CRID
Le CRID est une structure de soutien à la recherche de la Délégation à la Recherche Clinique et à l'Innovation (DRCI) du Département Recherche et Innovation. Il est constitué de deux Unités Fonctionnelles : le Centre Données de Santé (CDS) et l'Unité de Méthodologie Data-Management et Statistiques (UMDS), qui regroupe des compétences en méthodologie de la recherche clinique et épidémiologique, en biostatistique, en datamanagement et data-sciences, et en chefferie de projets de recherche sur données existantes.
L'activité principale du CDS est d'accompagner les chercheurs à la conception, la mise en uvre et l'exploitation de projets de recherche à partir de données hospitalières existantes, regroupées dans un entrepôt de données de santé (EDS). Cet entrepôt contient les données (démographiques, cliniques, biologiques et thérapeutiques) de tous les patients passés par le CHRU de Nancy depuis 2014.
LE POSTE
Service : Centre de recherche interventionnelle et sur données (CRID)
Horaires : 39h minimum par semaine
FONCTIONS ET ACTIVITÉS
Dans ce cadre, l'ingénieur de données contribuera à l'amélioration de l'exploitation des données textuelles du dossier patient, en s'appuyant notamment sur OpenSearch comme moteur d'indexation et de recherche.
Il aura pour mission de valoriser ces données en développant des méthodes d'extraction et de structuration de l'information issue des comptes rendus médicaux, en tenant compte du contexte clinique (négation, niveau de certitude, antécédents, traitements, etc.).
Il participera au développement et à l'intégration de méthodes de traitement automatique du langage naturel (NLP) et d'intelligence artificielle, notamment des approches récentes d'IA générative (LLM).
Activités principales :
Mise en uvre de méthodes d'analyse de texte médical (normalisation, synonymie, extraction de concepts)
Intégration de modèles NLP dans les pipelines d'indexation (embeddings, recherche sémantique, vector search)
Évaluation et optimisation de stratégies de recherche hybride (lexicale et sémantique)
Développement d'approches basées sur des modèles de langage de grande taille (LLM), notamment de type RAG, pour l'interrogation et l'exploitation des données textuelles
Adaptation et évaluation de modèles open source en santé (fine-tuning, validation)
Ces travaux visent à améliorer l'accès aux informations cliniques non structurées.
À terme, ces développements pourraient permettre la conception d'un outil avancé de requêtage en langage naturel, sous forme d'interface simplifiée, permettant d'interroger l'EDS sur des données à la fois structurées et non structurées, en s'appuyant sur des approches d'intelligence artificielle générative.

Profil recherché :

Connaissances théoriques :
Formation supérieure (Bac+5) en informatique, data science, mathématiques appliquées ou domaine connexe
Maîtrise de Python et des bibliothèques associées (NLP, machine learning, deep learning)
Connaissance des approches récentes en IA générative (LLM) : embeddings, transformers, RAG, fine-tuning
Compétences pratiques :
Expérience en traitement automatique du langage naturel (NLP), idéalement appliqué à des données textuelles complexes ou médicales
Intégration de modèles NLP/LLM dans des pipelines de traitement de données
Expérience en gestion et traitement de données à grande échelle (SQL, Spark ou équivalent)
Expérience avec OpenSearch / Elasticsearch, notamment pour l'indexation et la recherche de données textuelles
Mise en uvre de moteurs de recherche hybrides (lexical + sémantique, vector search)
Capacités :
Sensibilité aux enjeux liés aux données de santé (qualité des données, confidentialité, évaluation des modèles)
Qualités relationnelles. Bonne aptitude au travail en équipe, dans un contexte multidisciplinaire : s'intégrer, interagir, coopérer et communiquer sur leur travail au sein d'équipes constituées de spécialistes ou non de la donnée
Rigueur scientifique
Autonomie dans le travail
Capacité à rechercher et mettre à profit les ressources documentaires afin d'investir un nouveau sujet ou parfaire sa connaissance de celui-ci.
Grade ciblé : Ingénieur Hospitalier
Date limite de dépôt des candidatures : 28 avril 2026
Pour le personnel du CHRU de Nancy, nous vous remercions d'indiquer votre numéro de matricule sur votre candidature ou de joindre complété, le modèle de lettre de motivation disponible sur l'Intranet accompagné d'un CV à jour.
Personne à contacter
Postulez sur le site carrière : https://hopitauxsudlorraine.softy.pro/offre/201892?idt=159

URL de l’offre : https://hopitauxsudlorraine.softy.pro/offre/201892?idt=159

Etablissement

Hôpitaux de Brabois
rue du Morvan
54511 Vandoeuvre-les-Nancy

Voir la fiche de l’établissement

Retourner en haut de la page