À propos
Ingénieur de Recherche au LAMSADE, à l'interface entre la bioinformatique, l'apprentissage automatique et le développement full-stack. Formé Kenya, Algérie, France — je conçois des outils qui rendent les workflows biologiques et computationnels complexes accessibles et reproductibles.
En ce moment
Projet Actif · LAMSADE / PEPR Santé Numérique
ShareFAIR — Provenance Interrogeable pour les Workflows Nextflow
Développement d'un système pour structurer et rendre interrogeables les données brutes de provenance
des workflows bioinformatiques Nextflow. Cela implique la construction d'un graphe de connaissances
conforme à PROV dans Neo4j, intégrant la provenance prospective (spécification du workflow) et
la provenance rétrospective (traces d'exécution capturées via nf-prov sous forme de JSON-LD RO-Crate),
permettant aux scientifiques de retracer la lignée des données et de reproduire les analyses sans
naviguer dans des répertoires d'exécution dispersés.
Expérience
Ingénieur de Recherche
2025 — présent
LAMSADE – Université Paris-Dauphine · Paris, France
- Structuration et mise en interrogeabilité des données brutes de provenance des workflows bioinformatiques Nextflow.
- Développement d'un système de traçabilité granulaire au niveau des enregistrements et attributs.
- Évaluation empirique des performances et de la précision des outils développés via des cas d'usage concrets.
- Contribution à la rédaction d'articles de recherche pour la diffusion des résultats.
Stagiaire R&D — Visualisation de Workflows
04/2024 — 09/2025
LISN – Laboratoire Interdisciplinaire des Sciences du Numérique · Paris
- Développement d'un système de visualisation convivial pour les workflows à sorties graphiques.
- Transformation de sorties complexes de workflows en visualisations interactives pour une meilleure réutilisabilité et analyse.
Stagiaire R&D — Équipe IFB-Core Madbot
04/2024 — 08/2024
CNRS – Institut Français de Bioinformatique (IFB) · Paris
- Développement d'un connecteur pour améliorer l'intégration de données multi-omiques dans la plateforme IFB-Core.
- Amélioration de l'efficacité du traitement des données et de la collaboration inter-équipes.
Stagiaire Chercheur — Neurosciences Computationnelles
04/2022 — 06/2022
CNRS – NeuroPSI · Gif-sur-Yvette, France
- Simulation des patterns de décharge neuronale à l'aide du modèle AdEx pour l'étude des neurones du claustrum.
- Analyse de la dynamique neuronale avec Python et Brian2, en se concentrant sur les intervalles inter-spikes et les interactions thalamo-corticales.
- Classification des neurones selon leurs propriétés électriques et leur expression peptidique.
Publications
Chargement depuis ORCID…
Formation
Université Paris-Saclay · Orsay, France
2023 – 2025 · Spécialisation : AMI2B
Apprentissage automatique avancé (CART, Forêts aléatoires, LASSO) · Analyse statistique des données · Applications de l'IA aux données biologiques · Algorithmes computationnels · Programmation orientée objet en C & Java · Conception et analyse de workflows bioinformatiques.
Moringa School · Nairobi, Kenya
2022 – 2023
Python · JavaScript · Conception d'API RESTful · Programmation orientée objet · Développement web full-stack · Pratiques SDLC aux standards industriels · Apprentissage par projets avec applications concrètes.
Université Paris-Saclay · Orsay, France
2021 – 2023
Biologie moléculaire · Biologie cellulaire · Biochimie · Génomique · Génétique · Cours complémentaires en programmation et analyse de données.
Université Ferhat Abbas · Sétif, Algérie
2018 – 2021
Microbiologie · Génétique moléculaire · Biochimie · Algorithmes en biotechnologie · Approches basées sur les données pour les systèmes biologiques.
Catholic University of Eastern Africa · Nairobi, Kenya
2017 – 2018
Bases de la programmation · Structures de données · Résolution algorithmique de problèmes · Principes orientés objet.
Projets
GenAnnotator
Django · Next.js · Docker · Redis · Biopython
Plateforme full-stack open-source pour l'annotation génomique. Analyse de gènes, peptides et protéines avec intégration BLAST, authentification JWT et traitement asynchrone via Huey.
Classification d'Étoiles Variables
Python · Scikit-learn · RAMP · CI
Pipeline ML pour la classification automatisée d'étoiles variables à partir de courbes de lumière, via extraction de features, apprentissage ensembliste et validation croisée.
ReproHackathon
Nextflow · Bash · R · Singularity
Projet de groupe reproduisant un article bioinformatique de 2019 pour valider la reproductibilité des workflows computationnels à l'aide d'outils modernes de conteneurisation.
Visualiseur de Workflows
JavaScript · D3.js · Graph APIs
Système de visualisation interactive pour les workflows scientifiques à sorties graphiques (stage LISN), rendant les résultats de pipelines complexes accessibles pour l'analyse et la réutilisation.