Qu’est-ce qu’un Data Engineer ?

Collecter des données c’est bien. Pouvoir les stocker, les rendre fiables et les analyser, c’est mieux ! Pour ce faire, les entreprises ont besoin d’experts alliant compétences techniques et compréhension des enjeux business : les Data Engineers.

LES MISSIONS DU DATA ENGINEER

Un Data Engineer est quelqu’un ayant un background technique (en développement logiciel le plus fréquemment). Il va construire l’architecture du système Big Data et doit s’assurer de pouvoir collecter, transformer et stocker les données de différentes sources. Pour cela, il développe des solutions qui permettent de traiter un gros volume de data dans un temps limité.

Le travail d’un Data Engineer est de préparer le terrain pour qu’un Data Scientist puisse se servir des données «propres» afin de les exploiter de façon plus complexe, tirer des tendances (Insights), prédire, inférer avec les algorithmes de Machine Learning.

Le Data Engineer va construire l’architecture du système Big Data. Il optera pour des outils de stockage adaptés au type de données et au ratio stockage/query.

Avec un intérêt pour le Développement et Opérations (DevOps), il est en collaboration directe avec les autres rôles de la data. Il sait doser l’aspect mise en production avec les itérations rapides du développement.

Les principaux enjeux auxquels il fait face sont : la performance, la scalabilité et la gestion de gros volumes de données.

LA COLLABORATION DANS L’ÉQUIPE

Machine Learning Engineer

Data Scientist

Devops

LES COMPÉTENCES

Il utilise la plupart du temps des bases de données NoSQL et se basera sur le cloud pour les infrastructures. Il sait également employer les technologies comme le Airflow et Spark pour orchestrer et traiter convenablement ces grands volumes de données. De manière générale le Data Engineer a un background de développeur. Afin de proposer les meilleures solutions, c’est un développeur applicatif avec une appétence pour l’administration des infrastructures informatiques.

Pour résumer, le Data Engineer est un profil tech qui s’est spécialisé dans la création de solutions logicielles autour du big data.

SOFT SKILLS

Rigueur, curiosité, communication et esprit d’équipe sont les éléments clefs pour être un bon Data Engineer.

LES TECHNOLOGIES

Python

Scala

Kafka

SQL

NoSQL

Spark

Map/Reduce

Hadoop

HiveData

Lake

Big Data

Airflow

Software Engineering

cloud

orchestration de workflows

LA FORMATION

La majorité des Data Engineers ont un parcours en école d’ingénieur spécialisée en informatique ou bien un Master Big Data à l’Université. Certains Data Engineers sont aussi d’anciens Software Engineers (Ingénieurs logiciel) ou Ingénieurs Big Data.

LE SALAIRE

EVOLUTIONS DE CARRIÈRE

Lead Data Engineer

Head of Data

ML Engineer

Data Scientist

December 8, 2020

Logo Facebook
Logo Instagram
Logo LinkedIn