Karim B.

Data Scientist

415 dollar
Freelancer
2 ans
Chelles, FRANCE

Mon expérience

Voir plus

Capgemini insights&Data - Ministère Des ArméesNovember 2019 - December 2020

• Construction et maintenance d'un écosystème Big Data comprennent un Data lake sous Hadoop HDFS et de Data Warehouse/Data Mart en PostgreSQL.
• Scripting shell et environnement Linux (Debian) .
• Développement ETL avec le Framework Talend permettant la migration de données sous format JSON imbriqué provenant de serveur mainframe/MySQL vers le Data lake, data warehouse et Data mart , script Java/Python utilisé en complément.
• Conception de pipelines spark dans un environnement docker et déploiement effectué via la plateforme Data-ops Saggie orchestrant les clusters sur les serveurs locaux.
• Contrôle de qualité et d'intégrité des données tous au long du processus ETL.
• Gestion de versions sous Tortoise SVN.
• Technologies utilisées : Hadoop HDFS, Docker, Soogie, Talend Big Data, PostgreSQL, Python, Spark, Kerberos, Bash,Hive .
Voir plus

FreelanceOctober 2018 - November 2018

• Développement de scripts Python permettant la collecte de données.
• Conception et implémentation d'une base de donnée MySQL
• Développer en python, l'application assure la réception, le nettoyage et le stockage des données (MySQL) provenant de moteurs de recherche  (Tripadvisor)
• Construction d'un micro web service  (Flask)
Voir plus

Ministère de l'Éducation nationaleSeptember 2016 - July 2018

• Management et assistance de la direction d'une école primaire
• Aide aux devoirs et accompagnement des écoliers

Mes compétences

Analysis methods and tools

Kanban, Functional Programming, Agile Methodology, Scrum

IT Infrastructure

Google Cloud Platform (GCP), Docker, Mainframe, Windows, Linux

Databases

PostGreSQL, MySQL, MongoDB, NoSQL

Business Intelligence

Power BI, ETL, Talend

Others

Data Science, GitHub, Artificial Intelligence, Data Migration, Data analysis, Web Scraping

Languages

Python, Shell Scripting, SQL, Java, C/C++, R Language, Scala, Bash

Open Source solutions

Kubernetes

Big Data

Big Data, Spark, Apache Kafka, Hive, Hadoop, Data Mining, Apache Sqoop

Protocols

JSON, Kerberos

Application servers

Apache

Technologies

TortoiseSVN, Flask, HDFS, Machine Learning, Pandas, NumPy, ElasticSearch

Mes études et formations

Licenses & certifications - -

RNCP niveau 6 - Simplon.co2019 - 2020