Amar S.

DATA ENGINEER

952 dollar
Freelancer
7 ans
Paris, FRANCE

Mon expérience

Voir plus

OVHMarch 2019 - Présent

Contexte
Au sein d'une équipe de 7 personnes, je suis en charge de faire la totale migration d'un système complexe consistant a calculer le revenu total de l'entreprise, d'un cluster Legacy vers un autre basé sur Hortonworks, avec Spark comme techno principale.

Actions 
- Etudier le comportement des anciens jobs en Pig.
- Traduire les Jobs Pig en Spark Scala.
- Intégrer et suivre les jobs Spark sur Airflow

Résultats 
- Créer un Job Spark pour analyser et reporter la disponibilité des tables SQL dans le nouveau cluster.
- Créer et optimiser les Jobs Spark traduits depuis Pig.
- Contribuer a l'automatisation du flow avec l'outil Airflow

Environnement technique 
Spark Scala, Pig, Hadoop, Hbase, Hive, Phoenix, Airflow, Linux
Voir plus

BLECKWENNovember 2017 - March 2019

Contexte
Au sein d'une équipe de 8 personnes , Data ingénieurs, Scientists et responsables de validation travaillant en mode Scrum avec un sprint de 2 semaines, je suis en charge de mener a bien les Dev d'un produit d'une grande importance au sein de Bleckwen. Actions 
- Participer aux discussions pour la conception et l'évolution du tableau de bord du produit.
- Développer les taches du sprint.
- Participer aux discussions pour valider les merges requests.
- Etudier, proposer et mettre en place des nouvelles solutions (ex : Superset pour la partie Viz)

Résultats
- Développer et améliorer des jobs conçus en Spark Scala.
- Participer a la mise en place de Docker dans tout les sous projets.
- Mettre en place Superset et PostgresSQL comme outils de Visualisation.
- Mise en place de H2O pour la partie Machine learning.
- Améliorer le monitoring avec la stack ELK.
- Contribuer a l'automatisation des déploiements avec Ansible.

Environnement technique 
Spark Scala Hadoop Kafka Flume ELK Filebeat / MetricBeat Ansible
Voir plus

Orange Business ServicesSeptember 2016 - September 2017

Contexte
Au sein d'une équipe marketing « Connaissance Client » constituée de 5 Data Analysts et 3 Data Scientists, je suis en charge d'intervenir sur toutes les phases du projet ALL-IP mené par
OBS.
Un projet Data Science qui consiste à modéliser l'attrition de clients OBS (départ vers la
concurrence) engendré par la transition de l'analogique vers l'IP des produits.

Actions
• Bubbles sur Tableau Software: Collecte et nettoyage de données, intégration sur Tableau et présentation sous forme de Bubbles.
• Analyse du parcours client sur site web d'Orange : Collecte et transformation de données, mise en place d'un outil de visualisation en D3 Js basé sur la visualisation Sunburst.
• Enrichissement de la base de données, via des algorithmes de clusturing et visualisation du résultat via D3 Js.
• Mise à disposition d'un outil D3 Js pour visualiser interactivement des Arbres de décisions.

Résultats
• Graphiques en Tableau
• Graphique Sunburst en D3 Js
• Visualisation du resultat du clustring/Arbre de décision en D3 Js
• Scripts en Python pour le nettoyage récurent des données.
• Mise en place d'un blog en ligne : http://fractalytics.io/, alimenté par nos résultats basés sur
D3 Js (open source).

Environnement technique
Python, R, Tableau, D3 Js, Spark (PySpark), Zeppellin, Hive, MLlib
Voir plus

SECAFIMarch 2016 - August 2016

Contexte
Au sein d'une équipe responsable du pole Média, j'étais la seule compétence informatique, objectif de la mission est d'enrichir les rapports produits à l'issue de l'expertise via la collecte des données sur le web, des graphiques, et de l'analyse exploratoire.

Actions
• Scrapping de plus de 10 sites.
•Nettoyage des données et préporacessing.
• Visualisation des données, classique et cartographies
• J'ai profite des periodes creuses pour acquerir des certifications Coursera en Machine Learning et en Data Science, et participer à quelques compétions sur Kaggle.com

Résultats
• Plus de 10 projets Scrapy réutilisables.
• Graphiques via Python.

Environnement technique
Python, Scrappy. Pandas, Selenium. MatplotLib.

Description de l'entreprise
Cabinet de consulting qui intervient auprès des Comités d'entreprises.
Voir plus

MoobifunApril 2015 - August 2015

Contexte
Au sein d'une équipe de 4 développeurs, je suis en charge de développer leur solution de modélisation de menus USSD, de façon graphique.

Actions
• Application Front qui permet la modélisation graphique des menus USSD
• Branchement avec le Back développé en Grails.

Environnement technique
Grails, Angular Js, Html, Css. Bootstrap.

Mes compétences

Tableau Software, Spring, Spark, Selenium, Scrapy, Scikit-Learn, Scala, R Language, Python, PySpark, PostgreSQL, Pig, PHP, Phoenix, Pandas, MySQL, MS Office, Matplotlib, Marketing, Mahout, Machine Learning, Logstash, Linux, Kibana, JavaScript, Java EE, J2EE, HTML, Hive, Hibernate, HBase, Hadoop, Grails, Git, ELK Stack, ELK, ElasticSearch, Docker, D3.js, CSS, CodeIgniter, Bootstrap, Ansible, AngularJS, Angular