Mohamed D.

DATA SCIENTIST

732 euro

Mon expérience

Voir plus

HomeServeAugust 2019 - Présent

Dynamic pricing
Voir plus

Shapr - Business Networking appSeptember 2016 - March 2019

Shapr is a business networking app that brings you a daily suggestion of people to meet. I was leading the Data team, in charge of building and improving the suggestion algorithms. Keywords: machine learning, recommender systems, R, Python, Web services, Agile, project management.


PROJET 1 : « Suggestion de Profils » : Algorithmes de recommandation pour le matching de
profils professionnels sur la base de l’intérêt mutuel et le parcours d’utilisation. Modélisation
mathématique, développement, évaluation & mise en production. Prototypes utilisés au sein
de l’app. mobile Shapr. (350 j/h)
DOMAINE D’INTERVENTION :
Lead d’une petite équipe de Data Scientists, en mode Agile (Scrum)
 Analyse des besoins et affinage des cas d’usage avec les utilisateurs finaux
Proposition et adaptation de modèles statistiques pour la suggestion de profils
Conception, modélisation, développement, tests et évaluation
 Déploiement des modèles en production en R/Rserve, Python/Flask
Amélioration continue du produit et prise en compte des feedbacks utilisateurs
Reporting sous Splunk et Tableau.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisées : modélisation, latent variable analysis, topic models, machine
learning, text mining, time series
R / Python
 Tableau / Splunk
 MySQL.
Voir plus

InsermSeptember 2015 - August 2016

Data science for healthcare is one of the most promising and challenging fields today. At INSERM research lab., I worked on automating diagnosis-code assignment (ICD codes) to discharge summaries. Keywords: NLP, machine learning, deep learning, text mining, R, deployment.


PROJET 1 : « Codage des CRHs/CROs » : Algorithmes pour l’assignation automatique de
codes aux compte-rendus hospitaliers (CRHs) et opératoires (CROs). Appréhension des
problématiques métier, traduction du besoin, développement des algorithmes en cycles
courts en collaboration avec les équipes d’information médicale. (180 j/h)
DOMAINE D’INTERVENTION :
 Analyse des besoins avec les médecins d’information médicale
Proposition de modèles de classification à base de réseaux de neurones,
particulièrement adaptés à la nature hétérogène des données (numérique, texte,
images)
 Implémentation et évaluation sur des données réelles en temps réel
Déploiement des modèles en R/Rserve.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisées : text mining, machine learning, deep learning, réseaux de
neurones profonds
R, Python (Keras)
Voir plus

Bertin IT - CNIM GroupJanuary 2012 - August 2014

At Bertin IT , my job revolved around semantic analysis and learning from textual/unstructured data (Web and social media). My work was part of the Enterprise Intelligence platform. Keywords: machine learning, text mining, C/C++, computational linguistics.


PROJET : « Thèse industrielle sur les nouveaux outils de veille » : Algorithmes pour l’analyse et le
suivi des opinions sur le Web et les médias sociaux. Défis liés à la taille et la vélocité des
données en plus de leur caractère non-structuré et bruité. (900 j/h)
DOMAINE D’INTERVENTION :
Proposition de solutions innovantes pour modéliser l’évolution des opinions sur Internet
(latent variable models, topic models, LDA-like models)
 Implémentation des algorithmes from scratch en C/C++
Evaluation et optimisation de paramètres sur des cas d’usage réels
 Déploiement en production
Documentation technique et publications scientifiques à l’international.
ENVIRONNEMENT TECHNIQUE :
 Compétences mobilisés : data cleansing, modélisation, latent variable analysis, time
series, machine learning, text mining
C/C++.
Voir plus

France Telecom R&DFebruary 2011 - July 2011

I did my 6-month internship at France Telecom R&D, on preprocessing and categorization of CRM data for market segmentation.


PROJET : «Prédiction du churn » : Algorithmes pour la détection du churn à partir des
réclamations et messages échangés avec les clients Mobile. (100 j/h)
DOMAINE D’INTERVENTION :
Collecte et mise en forme des données textuelles non-structurées
Algorithmes de prédiction
Evaluation et documentation
ENVIRONNEMENT TECHNIQUE :
 R.

Mes compétences

SQL, Social Networking, Social Media, Research, Python, Project Management, Natural Language Processing (NLP), MySQL, Machine Learning, LaTeX, Kibana, Keras, Java, ElasticSearch, Deep learning, Data Science, Data Mining, Data analysis, C/C++, C++, Big Data, Artificial Intelligence, Algorithms