Souleymane S.

Data Scientist

555 dollar
Freelancer
1 an
Boulogne-Billancourt, FRANCE

Mon expérience

Voir plus

Generali France (Sainte Luce sur Loire, Nantes)March 2019 - August 2019

Projet:  La collecte des données réassurance: Migrer la collecte des données MRH vers Hadoop.

Tâches réalisées:

- Transférer les requêtes BOBI et codes SAS sous Hadoop en utilisant PySpark

- Construire une base de données contenant les données clients collectés sous Hadoop.

- Rehausser les valeurs des champs manquants.

- Automatiser les prochaines collectes des données réassurances sous Hadoop.

- rédiger un cahier des charges fonctionnels.

Voir plus

Generali France (Sainte Luce sur Loire, Nantes)January 2019 - March 2019

Projet : Automatiser la Lecture / Traitement des rapports d'expertises des contrats sinistres  concernant les dégâts des eaux.

Tâches réalisées:

- Développement de modules python PDFminer et PyPDF et collection d'une liste de mots clés

- Extraction des informations pertinentes via les mots clés sur les rapports via les bibliothèques PDFminer et PyPDF

- Construire une base de sortie contenant les informations pertinentes 

Voir plus

Generali France (Sainte Luce sur Loire, Nantes)October 2018 - December 2018

 Projet : Produire une application via Dash python
afin d'avoir une vision interactive de la rentabilité des produits (Prévoyance, Santé, Retraite, Épargne)

Tâches Réalisées :

- Calcul du volume des frais généraux sur une plage de 3 ans (2016, 2017 et 2018) 

- Comparaison des volumes de frais par rapports aux frais calculés en 2018 via
des graphes dynamiques afin d'apercevoir la rentabilité des produits 

-  Déploiement des travaux sur une application obtenue via Dash python
permettant au service de valeur d'avoir une vision interactive sur les frais  généraux de l'entreprise

Voir plus

IMT-ATLANTIQUE (Brest)March 2018 - July 2018

Projet : La mise en place d'un modèle de prédiction des accidents routiers en France
.

Tâches réalisées:

- Formulation de la problématique et nettoyage des données

- Développement des modèles de prédiction python (Random Forest, SVM, Régression) sur Scikit-Learn

- Déploiement de la solution sous forme d'API web avec Flask Python

Mes compétences

Technologies

NumPy, Machine Learning, ElasticSearch, Pandas, MySQL-python

IT Infrastructure

Git

Databases

Oracle, MySQL, NoSQL

Business Intelligence

ETL, Business Intelligence

Big Data

Hadoop, Data Mining, PySpark, Big Data

Languages

Java, JavaScript, HTML, CSS3

Machine Learning

Scikit-Learn

Other

Cascading Style Sheets, Python Programming, French, English, Services Web Amazon (AWS)

Mes études et formations

Master 2 - Diplôme d'Ingénieur Généraliste option Système de Traitement d'Information / Data science2016 - 2019

Master 1 en Mathématique Fondamentale - Université de Bretagne Occidentale2017 - 2018

Licence 3 Mathématique - Université Pierre et Marie Curie2015 - 2016