En poursuivant votre navigation, vous acceptez l’utilisation de cookies à des fins d’authentification et d’ajout de favoris. En savoir plus
Moteur de recherche d'offres d'emploi Clarins

Lead Data Engineering & Data Science / Responsable International Science des Données H/F


Détail de l'offre

Informations générales

Société

Clarins n'est pas qu'une entreprise leader en cosmétique. C'est une histoire familiale engagée, un esprit d'innovation et d'indépendance. Aujourd'hui leader sur certains de nos marchés, nous continuons notre développement en Europe et en Amériques et accélérons notre croissance en Asie.  

Référence

2019-1293  

Description du poste

Métier

Direction Systèmes d'Informations - Développement

Contrat

CDI

Le poste

Au sein de l'entité Data Science, nos objectifs sont de contribuer à l'accélération Direct-to-Consumer (DTC) de Clarins, et plus généralement à la transformation digitale de l'entreprise, par une meilleure capture, analyse et exploitation des données clients.

Description de la mission

• DATA ENGINEERING / Compléter et opérer le Data Lake Clarins
o Construction de nouveaux pipelines
 Batch
• Extraction de données de bases relationnelles (Sqoop, Script shell)
• Extraction de données de solutions SaaS (API, Rest, SOA, Java, Spring)
 Streaming
• Création de data pipelines en streaming (Flume, Spark Streaming, Scala, Logstash)
o Maintenance et monitoring des pipelines existants
 Log monitoring (ELK, time series databases, …)
 Scheduler (Opcon, Cron)
o Création des bases big data (Spark, Python, Scala, Jupyter)
 Append-only (Parquet)
 Update (Kudu, Elasticsearch, NoSQL)
 SQL on Hadoop (Hive, Impala, SQL)
o Maintenance et évolution de l'architecture existante pour traiter l'ensemble des cas d'usage (MS Azure, Cloudera, Hadoop, GCP, ELK, ADLS, HDFS, Unix, NoSQL, Ansible…)
• DATA SCIENCE / Promouvoir et concevoir de nouveaux usages/produits basés sur la donnée
o Délivrer des projets data en partenariat avec les équipes crm, e-commerce, r&d, media…
 Data exploration/modélisation: Jupyter, Pandas, Scikit-learn, NumPy
 Modélisation/clustering: RFM, Random Forest, K-Means, XGBoost
 Natural Language Processing : FastText
 Deep Learning: TensorFlow, Pytorch
 Data visualisation: Superset, Seaborn, Data Studio, Qliksense
o Evangéliser les différents acteurs sur les cas d'usage possibles et nouveaux services envisageables à l'aide de la donnée (Reconnaissance d'image, Natural Language Processing, forecast, segmentation…)
o Gestion de projets multi-départements / pays
 Versioning: Gitlab
 Ticketing: Jira
 Wiki: Confluence

Profil

Expérience et nombre d'années d'experience : 5 ans

Compétences techniques:
- Data Engineering: Cloudera, Hadoop, Spark, NoSQL, Parquet, Kudu, Impala, Kafka, Flume, Hive, Sqoop
- Data Science: Jupyter, Random Forest, K-Means, XGBoost, NLP, TensorFlow, Pandas, Scikit-learn, NumPy, Seaborn…
- Dataviz: Superset, Qliksense, Data Studio
- Devops: Gitlab, Ansible, ELK, Jira, Confluence, Scripting…
- Langages de développement: Shell, Java, Python, Scala, PySpark, Js…
- Cloud: MS Azure, GCP
- Others: Unix, Open Source, SOA, Rest, Cloud, Streaming


Soft and Leadership Skills:
• Bonne connaissance du retail dans un contexte international
• Intérêt porté au E-commerce
• Savoir faire adhérer et embarquer des équipes sur ses projets

Vous êtes

Bilingue français/anglais
Ingénieur, Informatique et Mathématiques (Bac +5)

Vous avez

Capacité de vulgarisation des problématiques techniques auprès de la communauté business
Goût pour l'innovation et l'exploration de nouveaux usages
Appétence pour la veille autour des sujets data et nouvelles technologies
Première expérience en management

Localisation du poste

Lieu

PARIS 17

Critères candidat

Niveau d'études min. requis

DESS, DEA, Grandes Ecoles, Bac + 5

Diplôme

Autres Masters

Niveau d'expérience min. requis

Entre 5 et 10 ans