Offre d'emploi Architecte Système de la plateforme Big-Data de l’AP-HP (2019-108) - Assistance Publique - Hôpitaux de Paris (AP-HP)

Offre d'emploi

Offre d'emploi Architecte Système de la plateforme Big-Data de l’AP-HP (2019-108) - Assistance Publique - Hôpitaux de Paris (AP-HP)

Annonce déposée le mercredi 12 juin 2019 à 14h53
Date limite des candidatures : vendredi 16 août 2019

Etablissement

Assistance Publique - Hôpitaux de Paris (AP-HP)
3, avenue Victoria
75184 Paris

Détail de l'offre

Poste proposé
Architecte Système de la plateforme Big-Data de l’AP-HP (2019-108)
Contrat(s)
CDI
Descriptif

PRÉSENTATION DE LA STRUCTURE :
Direction des Systèmes d’Information de l’AP-HP
La Direction des Systèmes d’Information (DSI) a pour mission d'assister le Directeur Général de l'Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique système d’information de l'AP-HP. Elle est rattachée au secrétariat général de l’AP-HP. Sous réserve des attributions propres aux Directions assurant la maîtrise d’ouvrage métier, les missions et domaines de compétences de la DSI sont les suivants :
 La planification et le pilotage général des systèmes d’information ;
 La préparation des décisions du comité stratégique des systèmes d’information de l’AP-HP, ainsi que des comités de pilotage gestion, patients et innovation et recherche ;
 L'organisation et l'alignement de la fonction générale «système d'information» sur les objectifs de I'AP-HP
 La mesure et la gestion de la performance et des risques liés aux systèmes d'information ;
 La gestion du portefeuille des projets de systèmes d'information ;
 La maîtrise d’œuvre des projets informatiques ;
 La maîtrise d’ouvrage des projets des SI cliniques ;
 La gestion budgétaire et le contrôle de gestion informatiques ;
 La gestion prospective des emplois et des ressources humaines affectées aux systèmes d’information ;
 La coordination des groupes hospitaliers pour le domaine informatique ;
 La gestion de la sécurité des systèmes d’information.

Le budget d’investissement géré est de près de 70 M€ et le budget d’exploitation est de 125 M€.
Le nombre d’agents de la DSI centrale en équivalents temps pleins est de 370.

Le département Web Innovation Données au sein de la DSI:
À travers le domaine Web, en lien avec la direction de la communication (DIRCOM) et la direction du pilotage et de la transformation (DPT) : les portails internet de l’institution (Drupal, WordPress, etc.), les outils collaboratifs (SharePoint, Alfresco, etc.), les applications mobiles et les nouveaux téléservices de l’AP-HP (paiement en ligne, prise de rendez-vous en ligne, portail patient, etc.) permettant de dématérialiser les relations avec le patient ;
À travers le domaine Données, en lien avec la direction de l’organisation médicale et des relations avec les universités (DOMU) : (i) l’expertise données en soutien à la mise en place d’une gouvernance institutionnelle des données, (ii) le développement de l’entrepôt de données de santé et de la plateforme Big Data de l’AP-HP et l’organisation de la mise à disposition des données à des fins de recherche, de pilotage et d’innovation (iii) la maintenance de divers référentiels de données cliniques sur des standards internationaux, nationaux ou AP-HP ;
À travers la plateforme Bio-Informatique : la proposition d’une offre de services et d'expertise aux pôles de biologie de l’AP-HP face aux besoins dans leur gestion informatique du séquençage, qu’il s’agisse de l’infrastructure, des logiciels avec leurs ressources de calcul associées, ainsi que de l’expertise métier en bio-informatique.
A travers le domaine BNDMR (Banque Nationale de Données Maladies Rares) en lien avec la DOMU : le pilotage d’un projet national visant à développer, maintenir et déployer une application de collecte de données dans le cadre du soin (BaMaRa- Base Maladies Rares) et la mise en place d’un entrepôt de données national sur les maladies rares.

Le département a par ailleurs comme mission de favoriser l’Innovation, en lien avec la DPT: le développement progressif d’une offre permettant l’organisation d’évènements dans les hôpitaux (conférences, cafés, hackathons, etc.), le soutien aux projets les plus prometteurs, et plus généralement l’organisation de la veille et la prospective sur les transformations numériques et leur impact sur l’hôpital.

Description du projet Plateforme Big Data :

Le domaine Données s’occupe actuellement de la mise en place de la Plateforme « Mégadonnées » ou Big Data de l’AP-HP brique principale de l’Entrepôt de Données de Santé. Les environnements techniques sur lesquels le cluster est bâti sont : un cluster Hadoop (distribution Hortonworks avec les briques Hive, Spark2, Solr, Phoenix, Hbase, HDFS, Zookeper, Ambari…), un entrepôt de données s’appuyant sur une base de données structurée PostGreSQL, des outils d’explotation de données Jupyter Lab, l’outil I2B2, Cognos…

Cette plateforme compte actuellement 22 machines pour le cluster Hadoop (4928Go RAM, 840 cores CPU,1,4To d’espace disque HDFS), de 3 machines GPU (20 GPU Nvidia), de 10 machines CPU dédiées aux environnements Jupyter pour l’analyse de données, et 1 machine NFS de 78To.
Un effort important est porté à l’intégration rapide des données cliniques (structurées et non structurées) produites dans les différents systèmes d’information hospitaliers (dossier patient informatisé ORBIS, logiciels historiques et de spécialité, données des moniteurs haute fréquence, données d’imagerie…) afin de pouvoir les mettre à disposition de tiers au travers d’outils spécifiques (logiciel I2B2, outil BI Cognos, outils propres de visualisation et de création de cohortes...) ou d’interfaces FHIR (API).
La plateforme contient aujourd’hui les données médicales de plus de 8 millions de patients (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Un travail important de standardisation des données est en cours afin de s’aligner sur les standards internationaux et assurer une interopérabilité maximale des données (OMOP, FHIR et les terminologies médicales de référence LOINC, CIM…). Plus de 30 projets de recherche sont actuellement en cours.

L’AP-HP souhaite désormais industrialiser et accélérer la mise en place de l’entrepôt de données de santé et créer ainsi un nouveau domaine « Plateforme Big Data » au sein du département WIND, qui aura pour objectifs :
-De finaliser l’architecture de la plateforme dans son ensemble afin de répondre aux besoins métiers, et réglementaires (sécurité, traçabilité…) et l’administrer,
-D’accélérer et consolider les processus d’intégration des données
-De développer les outils nécessaires à la mise à disposition de ces données à la communauté de recherche (outils d’analyse, d’annotation de données & Jupyter, I2B2, projet interne Cohort360 – application web permettant la constitution de cohortes de patients et leur visualisation)
-De développer les interfaces nécessaires à l’alimentation de l’ensemble des systèmes d’information nécessitant un accès à ces données (Portail Patient, logiciels métiers…)
-De créer les interfaces avec d’autres Systèmes tels que le Health Data Hub ou des réseaux de CH(U) à l’échelle régionale, nationale ou Européenne,

Il s’agit ainsi d’un nouveau domaine à créer et structurer afin de répondre aux objectifs ambitieux que se donne l’AP-HP pour développer l’usage de ses données, et notamment permettre l’émergence et le développement de l’intelligence artificielle dans le domaine médical. Le domaine Plateforme Big Data sera structuré en trois équipes : Une équipe Recherche et Développements, Une équipe Administration et Architecture, et une Équipe Intégration de Données.

COMPOSITION DE L’ÉQUIPE :
L’équipe Plateforme Big Data sera composée, d’environ 12 professionnels techniques (6 internes, 6 prestataires). Les effectifs seront amenés à s’agrandir suite aux récents partenariats engagés avec le Health Data Hub, certains industriels…

L’équipe Administration et Architecture sera à constituer. Ce poste constitue ainsi une des premières briques de mise en place de cette équipe.


LES MISSIONS :
Mission générale :
Le/la administrateur/trice de plateforme big-data du nouveau domaine Plateforme Big Data aura pour mission principale de d'assurer le bon fonctionnement de du parc informatique à travers sa maintenance, monitoring, renfort sécuritaire et évolution en coordination avec les équipes responsables du centre de données auto-hébergé de l'APHP.
L’enjeu principal des mois à venir est de renforcer la plateforme à travers la virtualisation de services et de participer à la transition déjà engagée permettant de transformer le « Data Warehouse » actuel en un « Data Lake » construit sur une architecture Big Data.

Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique en cours de recrutement.

Missions principales :
- Participer à la définition de l’architecture globale de la plateforme et des outils d’accès et de traitement de données
- Mettre en place les modes d’accès sécurités à la plateforme et aux environnements de travail (VPN…)
- Automatiser les Sauvegardes des bases de données
- Assurer la haude disponibilité des services et des bases de données
- Assurer la maintenance logicielle et mettre en production des montées de version
- Virtualiser des services sous Docker et Kubernetes
- Mettre en place les tests de sécurité et de pénétration
- Mettre en place un processus de supervision de l'infrastructure
- Documenter l'architecture
- Préparer et justifier les commandes de matériel
- Adapter les outils utilisés aux besoins spécifiques de l'institution
- En lien avec le reste de l’équipe, s’assurer que les méthodes, les outils et l’architecture de flux, suivent les évolutions technologiques

PROFIL:
SAVOIR-FAIRE REQUIS :

Requis :
• Maîtrise de linux et bash
• Maîtrise de la programmation python
• Maîtrise de systèmes de sauvegardes et restauration
• Maîtrise d'outils de monitoring système
• Maîtrise d'optimisation et maintenance de SGBD (postgresql, mysql...)
• Maîtrise d'outils d'automatisation (Ansible, Chef, Puppet...)
• Maîtrise de la virtualisation (docker, kubernetes)

Apprécié :
• Expérience avec HADOOP
• Expérience de moteur de recherches plein textes (SolR, ElasticSearch, Sphynx...)
• Expérience de systèmes de calculs distribués
• Expérience en GPU
• Expérience en sécurité, réseau informatique
• Connaissance de la réglementation informatique et libertés ;
• Maîtrise de la communication et de la négociation en situation complexe

Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d'activité
• Animer / communiquer / motiver une ou plusieurs équipes
• Capacité à animer des réunions courtes, avec préparation et compte rendu
• Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence
• Concevoir et rédiger une documentation spécifique à son domaine de compétence (document d’architecture technique)
• S'exprimer en public
• Utiliser les logiciels métier

CONNAISSANCES ASSOCIÉES :
• Environhnv

SAVOIR-ÊTRE REQUIS :
• Esprit d’équipe et fort sens du relationnel
• Autonomie, rigueur, méthode
• Capacité de travail très importante, associée à un fort dynamisme.
• Curiosité et capacité d’adaptation et d’anticipation
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé

PRE-REQUIS:
• Ingénieur(e) et/ou MD Informatique
• Expérience significative dans la gestion technique de projets informatiques (admin système, devops, architecte technique…)

Personne à contacter
M. Nicolas PARIS
Email : elisa.salamanca@aphp.fr

URL de l'offre
2019-108

Retour à la liste Mémoriser cette offre Postuler en ligne
  • Diminuer la taille du texte
  • Augmenter la taille du texte
  • Imprimer
  • Share
  • Rss