Offre d'emploi Responsable de l’équipe Intégration de Données - Plateforme Big Data de l’AP-HP 2019-112 - Assistance Publique - Hôpitaux de Paris (AP-HP)

Offre d'emploi

Offre d'emploi Responsable de l’équipe Intégration de Données - Plateforme Big Data de l’AP-HP 2019-112 - Assistance Publique - Hôpitaux de Paris (AP-HP)

Annonce déposée le vendredi 22 novembre 2019 à 15h08
Date limite des candidatures : vendredi 31 janvier 2020

Etablissement

Assistance Publique - Hôpitaux de Paris (AP-HP)
3, avenue Victoria
75184 Paris

Site géographique de l'offre

Siège de l'AP-HP
3 avenue Victoria
75184 Paris
Visiter le site de l'établissement

Détail de l'offre

Poste proposé
Responsable de l’équipe Intégration de Données - Plateforme Big Data de l’AP-HP 2019-112
Contrat(s)
CDD;Détachement;Mutation
Descriptif

L’AP-HP
L'Assistance Publique - Hôpitaux de Paris (AP - HP) est le centre hospitalier universitaire (CHU) d’Île-De-France. Ses missions sont le soin, la recherche et l’enseignement. À dimension internationale, il est constitué de 38 hôpitaux, organisés en 12 groupes hospitaliers. Accueillant plus de 7 millions de patients par an, il possède un budget annuel de près de 7,2 milliards d’euros.

Direction des Systèmes d’Information de l’AP-HP
La Direction des Systèmes d’Information (DSI) a pour mission d'assister le Directeur Général de !'Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique système d’information de l'AP-HP. Elle est rattachée au secrétariat général de l’AP-HP.
Sous réserve des attributions propres aux Directions assurant la maîtrise d’ouvrage métier, les missions et domaines de compétences de la DSI sont les suivantes :
 La planification et le pilotage général des systèmes d’information ;
 La préparation des décisions du comité stratégique des systèmes d’information de l’AP-HP, ainsi que des comités de pilotage gestion, patients et innovation et recherche ;
 L'organisation et l'alignement de la fonction générale «système d'information» sur les objectifs de I'AP-HP
 La mesure et la gestion de la performance et des risques liés aux systèmes d'information ;
 La gestion du portefeuille des projets de systèmes d'information ;
 La maîtrise d’œuvre des projets informatiques ;
 La maîtrise d’ouvrage des projets des SI cliniques ;
 La gestion budgétaire et le contrôle de gestion informatiques ;
 La gestion prospective des emplois et des ressources humaines affectées aux systèmes d’information ;
 La coordination des groupes hospitaliers pour le domaine informatique ;
 La gestion de la sécurité des systèmes d’information.
Le budget d’investissement géré est de près de 70 M€ et le budget d’exploitation est de 125 M€.
Le nombre d’agents de la DSI centrale en équivalents temps pleins est de 370.

Le département Web Innovation Données au sein de la DSI a en charge :

 À travers le domaine Web, en lien avec la direction de la communication (DIRCOM) et la direction du pilotage et de la transformation (DPT) : les portails internet de l’institution (Drupal, WordPress, etc.), les outils collaboratifs (SharePoint, Alfresco, etc.), les applications mobiles et les nouveaux téléservices de l’AP-HP (paiement en ligne, prise de rendez-vous en ligne, portail patient, etc.) permettant de dématérialiser les relations avec le patient ;
 À travers le domaine Données, en lien avec la direction de l’organisation médicale et des relations avec les universités (DOMU) : (i) le développement de l’entrepôt de données de santé de l’AP-HP et l’organisation de la mise à disposition des données à des fins de recherche, de pilotage et d’innovation, au travers du pilotage des trois piliers : technique, gouvernance, et réglementaire ; (ii) la maintenance de divers référentiels de données cliniques sur des standards internationaux, nationaux ou AP-HP ;
 À travers la plateforme Bio-Informatique : la proposition d’une offre de services et d'expertise aux pôles de biologie de l’AP-HP face aux besoins dans leur gestion informatique du séquençage, qu’il s’agisse de l’infrastructure, des logiciels avec leurs ressources de calcul associées, ainsi que de l’expertise métier en bio-informatique.
 A travers le domaine BNDMR (Banque Nationale de Données Maladies Rares) en lien avec la DOMU : le pilotage d’un projet national visant à développer, maintenir et déployer une application de collecte de données dans le cadre du soin (BaMaRa- Base Maladies Rares) et la mise en place d’un entrepôt de données national sur les maladies rares.

Le département a par ailleurs comme mission de favoriser l’Innovation, en lien avec la direction du pilotage et de la transformation (DPT) : le développement progressif d’une offre permettant l’organisation d’évènements dans les hôpitaux (conférences, cafés, hackathons, etc.), le soutien aux projets les plus prometteurs, et plus généralement l’organisation de la veille et la prospective sur les transformations numériques et leur impact sur l’hôpital ;

Description du projet Plateforme Big Data :

Le domaine Données s’occupe actuellement de la mise en place de la Plateforme « Mégadonnées » ou Big Data de l’AP-HP brique principale de l’Entrepôt de Données de Santé. Les environnements techniques sur lesquels le cluster est bâti sont : un cluster Hadoop (distribution Hortonworks avec les briques Hive, Spark2, Solr, Phoenix, Hbase, HDFS, Zookeper, Ambari…), un entrepôt de données s’appuyant sur une base de données structurée PostGreSQL, des outils d’explotation de données Jupyter Lab, l’outil I2B2, Cognos…

Cette plateforme compte actuellement 22 machines pour le cluster Hadoop (4928Go RAM, 840 cores CPU,1,4To d’espace disque HDFS), de 3 machines GPU (20 GPU Nvidia), de 10 machines CPU dédiées aux environnements Jupyter pour l’analyse de données, et 1 machine NFS de 78To.
Un effort important est porté à l’intégration rapide des données cliniques (structurées et non structurées) produites dans les différents systèmes d’information hospitaliers (dossier patient informatisé ORBIS, logiciels historiques et de spécialité, données des moniteurs haute fréquence, données d’imagerie…) afin de pouvoir les mettre à disposition de tiers au travers d’outils spécifiques (logiciel I2B2, outil BI Cognos, outils propres de visualisation et de création de cohortes...) ou d’interfaces FHIR (API).
La plateforme contient aujourd’hui les données médicales de plus de 8 millions de patients (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Un travail important de standardisation des données est en cours afin de s’aligner sur les standards internationaux et assurer une interopérabilité maximale des données (OMOP, FHIR et les terminologies médicales de référence LOINC, CIM…). Plus de 30 projets de recherche sont actuellement en cours.

L’AP-HP souhaite désormais industrialiser et accélérer la mise en place de l’entrepôt de données de santé et créer ainsi un nouveau domaine « Plateforme Big Data » au sein du département WIND, qui aura pour objectifs :
-De finaliser l’architecture de la plateforme dans son ensemble afin de répondre aux besoins métiers, et réglementaires (sécurité, traçabilité…) et l’administrer,
-D’accélérer et consolider les processus d’intégration des données
-De développer les outils nécessaires à la mise à disposition de ces données à la communauté de recherche (outils d’analyse, d’annotation de données & Jupyter, I2B2, projet interne Cohort360 – application web permettant la constitution de cohortes de patients et leur visualisation)
-De développer les interfaces nécessaires à l’alimentation de l’ensemble des systèmes d’information nécessitant un accès à ces données (Portail Patient, logiciels métiers…)
-De créer les interfaces avec d’autres Systèmes tels que le Health Data Hub ou des réseaux de CH(U) à l’échelle régionale, nationale ou Européenne,

Il s’agit ainsi d’un nouveau domaine à créer et structurer afin de répondre aux objectifs ambitieux que se donne l’AP-HP pour développer l’usage de ses données, et notamment permettre l’émergence et le développement de l’intelligence artificielle dans le domaine médical. Le domaine Plateforme Big Data sera structuré en trois équipes : Une équipe Recherche et Développements, Une équipe Administration et Architecture, et une Equipe Intégration de Données.

COMPOSITION DE L’EQUIPE :

L’équipe Plateforme Big Data sera composée, d’environ 12 professionnels techniques (6 internes, 6 prestataires). Les effectifs seront amenés à s’agrandir suite aux récents partenariats engagés avec le Health Data Hub, certains industriels…

L’équipe Intégration de donnée, à constituer, sera composée outre sa/son responsable de 5-6 professionnels techniques (1 interne, 4 prestataires)

ACTIVITES

Mission générale :

Le/la responsable de l’équipe Intégration de Données au sein du nouveau domaine Plateforme Big Data aura pour mission principale de structurer et de piloter l’équipe, d’accélérer l’intégration de données au sein du cluster, de l’entrepôt de données et des datamarts spécifiques aux outils d’exploitation (I2B2, Cognos, interfaçage/API), d’étendre le périmètre de données présentes ainsi que les types de flux (ETL, flux HL7, interfaces FHIR…).
L’enjeu principal des mois à venir est de finaliser la transition déjà engagée permettant de transformer le « Data Warehouse » actuel en un « Data Lake » construit sur une architecture Big Data.

Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique en cours de recrutement.

Missions principales :

-Recrutement et management opérationnel des professionnels de l’équipe Intégration de Données
-Mise en place d’une équipe de prestataire destinée à intégrer, en complément de l’équipe interne, des données au sein des bases de données du Cluster Big Data (organisation projet, définition des objectifs et des processus de travail, qualification de l’intégration…)
-Elaboration de la feuille de route technique pour répondre aux enjeux croissants d’intégration de données massives et permettant de répondre aux différents cas d’usages : innovation, pilotage, recherche
-Assurer la transition d’un mode d’intégration de données quotidien en un mode d’intégration de données en temps réel
-Assurer la maintenance opérationnelle des flux de données développés
-Définir et construire des méthodes d’intégration de données innovantes et une architecture adaptée afin d’intégrer des données massives et nouvelles telles que les données audio, haute fréquence, génomiques, appareils bio-médicaux, d’objets connectés…
-En lien avec le reste de l’équipe, s’assurer que les méthodes, les outils et l’architecture de flux, suivent les évolutions technologiques
-Mettre en place les environnements informatiques adaptés à une intégration de données assurée par des professionnels internes et externes
-Mettre en place les processus de qualification de données,
-Mettre en place un processus de supervision des flux de données
-En lien avec le reste de l’équipe de la plateforme, contribuer aux travaux de standardisation de données (FHIR, OMOP..), de mise en qualité, et de documentation de ces données pour les différents cas d’usage

Savoir-faire requis

Requis :
• Maîtrise des langages Java, SQL, Python
• Maîtrise des outils ETL (Talend, Sqoop…)
• Maîtrise de l’informatique décisionnelle et des méthodes de Data Warehouse classiques (OLTP, RDBMS…)
• Maîtrise des standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
• Bonne connaissance des architectures et de l’écosystème Big Data (Hadoop, Hive, HBase, Spark…)
• Bonne connaissance des formats et schémas de données Big Data (ORC, Parquet, Avro…)
• Connaissance des bases de données Oracle
• Connaissance des environnements Linux
• Rédiger/contrôler des documents techniques (Dossier d’architecture technique - DAT, Dossier d’exploitation - DEX, Dossier d’alarmes – DAL, matrice des flux réseau, etc.)
• Encadrer une équipe de développeurs
• Bonne connaissance des méthodologies de gestion de projet (cycle en V, Scrum, Agile)


Apprécié :
• Connaissance des méthodologies devops et des outils associés (Docker, Kubernetes, jenkins…)
• Bonne connaissance et pratique des webservices (SOA, REST) et des technologies d’intégration à l’aide d’interfaces de programmation (API)
• Connaissance de la réglementation informatique et libertés ;
• Maîtrise de la communication et de la négociation en situation complexe

Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d'activité
• Animer / communiquer / motiver une ou plusieurs équipes
• Capacité à animer des réunions courtes, en imposant une préparation et un compte rendu
• Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence
• Concevoir et rédiger une documentation spécifique à son domaine de compétence
• S'exprimer en public
• Utiliser les logiciels métier
Connaissances associées
Apprécié :
• Environnement des systèmes d’information hospitaliers
• Enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie…)

PRE-REQUIS
• Ingénieur(e) A+ et/ou PhD et/ou MD (Mathématiques, Informatique, Santé publique, etc.),
• Expérience significative dans la gestion technique de projets informatiques (admin système, développeur, architecte technique…)
• Expérience dans l’encadrement d’une équipe
QUALITES REQUISES
• Esprit d’équipe et fort sens du relationnel
• Autonomie, rigueur, méthode
• Capacité de travail très importante, associée à un fort dynamisme.
• Curiosité et capacité d’adaptation et d’anticipation
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé

QUOTITE :
100 %

HORAIRES DE TRAVAIL :
Amplitude horaire 9h30-18h30

Personne à contacter
Elisa Salamanca
Email : elisa.salamanca@aphp.fr

Retour à la liste Mémoriser cette offre Postuler en ligne
  • Diminuer la taille du texte
  • Augmenter la taille du texte
  • Imprimer
  • Share
  • Rss

Plan d'accès

Siège de l'AP-HP

3 avenue Victoria
75184 Paris
plan d'accès