Mhedhbi O.

Data Engineer

415 dollar

Mon expérience

Voir plus

FNACDARTYJune 2019 - February 2020

∠ Étude technique de l’architecture du projet, des provenances des différents sources des données
∠ Préparation des données qui proviennent des différentes sources afin qu’elles puissent être agrées.
∠ Transformation des données, injection des tables externes sous Hive.
∠ Évaluation de la qualité des données des produits Fnac : Comparaison des résultats d’enrichissement
avec des champs existants.
∠ Normalisation des données textuelles suivant des règles métiers et création des nouveaux colonnes
à travers l’extraction des caractéristiques des produits dans les descriptions.
∠ Détection et classification des valeurs aberrantes selon les typologies des produits et remonter des
échantillons de test au métier.
∠ Agrégation d’un ensemble de modèles de détection des langues à partir des courts textes.
∠ Création des workflow Oozie qui englobent toutes les actions implémentant les règles métier demandées en Spark Scala.
∠ Monitoring des application Yarn associées aux jobs Spark développées.

Scala, Hadoop, Jenkins, Nexus, Spark, Gitlab, Anaconda, Python, Hive, Pyspark, SQL, Oozie
Voir plus

TECHNIPFMCJanuary 2019 - May 2019

∠ Structuration des données issues des fichiers de données dans une base MongoDB.
∠ Mise en place d’un algorithme généralisé de détection et d’extraction des variables et des descriptifs
des projets Technip.
∠ Extraction de plus de 120 variables explicatives du poids sur les projets Technip.
∠ Développement des jobs spark implémentant des règles métiers et injection des données dans des
tables externe Hive.
∠ Études statistiques sur l’importance des variables extraites
∠ Mise en place d’une application Web avec Django pour visualiser les résultats et automatiser l’extraction des données et l ‘enrichissement des données.

Scala, Python, Hadoop, Spark, Text mining, MongoDB, ElasticSearch, Django.
Voir plus

KAINSENSDATAOctober 2018 - December 2018

∠ Détection des fenêtres dans des images de bâtiments : Annotation des images et préparation des
bases de données d’apprentissage, Structuration des données sous format YOLO et CSV,Etude comparative entre les différents modèles de Deep Learning SSD,R-CNN,YOLO .
∠ Extraction et Structuration des données issues des dossiers techniques des consultants : Extraction
des compétences techniques, des compétences métiers, des expériences , Représenter les données
textuelles sous forme matricielle (Word embedding) , Représenter les données textuelles sous forme
matricielle (Word embedding)

Python, Anaconda, Object Detection Tensorflow API, Word2vec, doc2vec, Machine learning, Natural language processing, nltk, docx2txt, gensim
Voir plus

SOCIETE GENERALEMarch 2018 - September 2018

∠ Analyse et détection des textes similaires au niveau sémantique.
∠ Mise en place d’unmoteur de recherche intelligent : prendre en compte les synonymes et un ensemble
de règles métiers
∠ Analyse et classification des données textuelles via des : Random Forest, Régression Logistique, SVM
, Réseaux de neurones
∠ Préprocessing (normalisation des données textuelles et vectorisation) et nettoyage des données en
Python

Python, sklearn, numpy, pandas, nltk, gensim, Tensorflow, Keras, SQL Oracle
Voir plus

ALTEREOMarch 2017 - April 2017

∠ Récupération des données à travers d’un Logiciel SIG (Système d’Information géographique).
∠ Analyse exploratoires des données et mise en place d’un outil de classification des états des infrastructures : (Arbre de décision, RadomForest, Régression Logistique, SVM, Adaboost, Réseaux de neurones)
∠ Preprocessing, Analyse descriptive, Détection et traitement des données aberrantes, Paramétrage des
algorithmes machine Learning et construction des réseaux de neurones.
∠ Application des différents indicateurs de performances et rédaction des rapports synthétiques

R, Python, sklearn, numpy, pandas, nltk, gensim, Tensorflow, Keras, SQL Oracle

Mes compétences

Others

Artificial Intelligence, Natural Language Processing (NLP), SVM, Nexus, Maple, Data analysis, Continuous Integration

Computer Tools

MS Office

Analysis methods and tools

Apache Maven, Functional Programming

Machine Learning

TensorFlow, Linear Regression, Scikit-Learn, Logistic Regression, K-means, Neural networks, Keras, Deep learning, Convolutional Neural Networks, Clustering, Anaconda

Languages

Python, C/C++, Delphi, SQL, R Language, Scala, Java, C++

Graphic

Image Processing

Middleware

Jenkins

Big Data

Hive, Apache Kafka, Hadoop, Spark, Oozie, Big Data

Mobile

Android

Frameworks

OpenCV, Django

IT Infrastructure

Windows, Linux, Ubuntu, Git, CentOS, Linux (Ubuntu, CentOS)

Databases

PostGreSQL, MongoDB, Oracle, Microsoft SQL Server, MySQL

Business Intelligence

Business Intelligence, ETL

Environment of Development

IntelliJ Idea, Maven, Oracle SQL Developer, Visual Studio Code, GitLab

Technologies

Matplotlib, NumPy, MapReduce, HDFS, Pandas, Machine Learning, ElasticSearch, Yarn, Scrapy, J2EE

Mes études et formations

Master Modélisation, 2018 - Université de Paris Dauphine

Études d’ingénieur, 2017 - École Polytechnique de Tunisie