Top 5%
Catalina C.

DATA ENGINEER

820 dollar
Freelancer
11 ans
Lyon, FRANCE
i

Why I'm Top 5%

  • 11 years of industry experience
Learn how we hire

Mon expérience

Voir plus

Hardis GroupJune 2014 - June 2019

* Depuis mars 2018:

* Création des divers prototypes en utilisant des algorithmes et outils de machine learning. Implémentation en Scala (avec Breeze), Octave.

* Dans le cadre de Lab Innovation Hardis: détection d'un nouveau business: intelligence artificielle pour un métier des grands clients de l'entreprise (métier de l'assurance): étude de marché.

* En collaboration avec EyeSnap : pilotage de projet pour la détection des nouvelles tendances sur Internet (détection automatique de sens).

* Formation / certification en machine learning

* Conférence - retour expérience Meetup Lyon Data Science

* Organisation de l'accueil du Meetup Scala de Lyon (SLUG) dans les locaux de Hardis

* Programmation Python pour divers projets
Voir plus

LizeoMarch 2016 - March 2018

* Durée: 2 ans

* Rôle: Création d'un algorithme pour l'extraction automatique des aspects:

* Apprentissage automatique supervisé suivi d'extraction sur des nouvelles données

* Évaluation de la qualité de données

* Mise en place des techniques d'extraction et d'analyse de données pertinentes

* Analyse des données spécifiques au Métier afin de les transformer en problème mathématique

* Comparaison et tests des différents modèles et méthodes de calcul

* Taux de réussite: 80%-95%

* Participation à l'élaboration d'une offre pour un projet client

* Environnement technique: Scala, Java 1.8, Maven, ElasticSearch (Kibana), Mysql, PERL; parseurs TAL/NLP (Stanford, Snowball)
Voir plus

CPSJune 2014 - January 2016

* Duréede la mission : 1 an

* Rôle: Développeur outils support

* Tâches: Création outils en Python

* Environnement technique: PHP (avec Zend), Python, MYSQL procédural.
Voir plus

CNRSJanuary 2013 - January 2014

Durée de la mission: 1 an

* Contexte: CNRS Villejuif, laboratoire SEDYL

* Rôle: Création d'algorithmes de clustering

* Tâches:

* Création d'une sauvegarde du résultat du concordancier, en format éditable (ODT): génération du code XML correspondant au fichier ODT (PERL et PHP).

* Création d'une interface de recherche dans la base de données, sur plusieurs niveaux, et avec un résultat complexe.

* Création d'un outil de représentation de données concernant un ou plusieurs corpus, qui comporte la génération d'images en PHP: conception de l'algorithme, développement en PHP.

* Analyse de données pour traduire une problèmatique métier en problème mathématique (algorithme clustering).

* Création d'une sauvegarde des corpus en XML (créés avec l'interface Jaxe) en format éditable (ODT)

* Génération d'un type de codage pour la représentation schématique des énoncés dans un corpus donné, travail en XSLT sur la représentation automatique de ces schémas dans la page XML.


* Environnement technique: PHP, PERL, XSLT, HTML, CSS.
Voir plus

KATEXPERTJanuary 2010 - January 2012

Durée de la mission: 2 ans

* Contexte: client final, éditeur de logiciel

* Rôle: Création d'algorithmes de recherche de données pour de la e-réputation

* Tâches:

* Création d'un outil pour l'extraction intelligente des éléments des forums multilingues, à partir des pages Web, à l'aide des expressions régulières. Par exemple: extraire, pour un message diffusé sur un forum: l'auteur, les discussions parentes, la date de la diffusion, le contenu, les éventuelles citations des autres messages dans le contenu; cet outil était destiné à un traitement ultérieur pour la fouille d'opinion;

* Analyse des données afin de les transformer en problème mathématique;

* Application des techniques de text mining d'extraction et d'analyse d'information;

* Conception et implémentation en PHP5 d'un modèle de parcours de réseaux imbriqués. Ce modèle est destiné de trier un ensemble de données reçues en entrée, selon des critères structurés sur plusieurs niveaux et ayant des priorités différentes.

* Conception et implémentation d'une interface en PHP5 et JavaScript permettant de créer des parcours composés de plusieurs étapes structurées sous forme d'arbre. Cet outil, conçu pour être très général, afin d'être utilisé à plusieurs finalités, est destiné essentiellement à la planification et automatisation des tâches.


* Environnement technique: PHP5, Java Script, MYSQL
Voir plus

APXJanuary 2008 - January 2010

Durée de la mission: 1 an

* Contexte: SS2I, chez divers clients: AERMC.

* Rôle: Missions de développement et maintenance informatique.

* Tâches:

* Création d'un site Intranet pour AERMC de Lyon

* Saisie du contenu pour un site réalisé en Typo3, AERMC (saisie dans le back-office)

* Création d'un site Internet et mise à jour d'un site Intranet en PHP+MYSQL (AERMC).

* Maintenance informatique (TMA).

* Environnement technique: PHP5, Oracle, CMS: Typo3, Web (HTML, CSS).
Voir plus

Université de CaenMay 2007 - April 2008

Durée de la mission: 1 an

* Contexte: Université de Caen, Laboratoire GREYC

* Rôle: Attaché de recherche

* Tâches:

* Dans le cadre du projet Résurgence, pour l'extraction de la structure logique des documents en format PDF:

* Création d'un modèle pour l'extraction de la structure logique des articles scientifiques et journalistiques multilingues;

* Analyse des données afin de transformer un problème Métier en problème mathématique;

* Comparaison et tests des différents modèles de calcul afin de choisir le plus approprié;

* Algorithmes fondés sur le TAL (NLP)


* Environnement technique: PHP5, Java, XML
Voir plus

DIGIMINDFebruary 2006 - May 2006

Durée de la mission: 4 mois

* Contexte: Entreprise Digimind spécialisée dans la veille stratégique

* Rôle: Stagiaire

* Tâches:

* Création de corpora, en anglais et en français, destinés à être donnés en entrée à un programme d'apprentissage automatique pour le clustering;

* Classification automatique par méthode bayesiènne;

* Nettoyage des corpora.


* Environnement technique: Java (Weka)

Mes compétences

Zend Framework, XSLT, XML, TYPO3, Tableau, SQL, Spark, Scala, Python, Perl, Oracle, MySQL, Matlab, Machine Learning, Kibana, JavaScript, Java, HTML, ElasticSearch, Data Mining, Big Data, Apache Maven