CV Data Engineer : comment montrer pipelines, scale et fiabilité sur une seule page
Les CV de data engineering échouent de deux façons prévisibles. Soit ils listent chaque outil du modern data stack sans contexte, soit ils décrivent des résultats vagues du genre amélioration de la qualité des données qui pourraient vouloir tout dire. Les deux flinguent le taux de rappel.
Ce guide montre la structure exacte, les bullets et le layout de la section compétences pour un CV de data engineer qui passe l'ATS et capte l'attention du recruteur.
Ce que cherche un recruteur en data engineering
Dans les 25 premières secondes, un recruteur ou hiring manager scanne :
- La stack : ingestion, stockage, transformation, orchestration, BI. Les outils nommés sont-ils actuels et pertinents ?
- L'échelle : volumes par jour, latence, coût économisé, uptime
- L'esprit fiabilité : SLA, monitoring, on-call, data contracts
- Le contexte d'équipe : solo, petite équipe, grosse équipe plateforme
- Le langage des résultats : impact business, pas juste des pipelines livrés
Si ces signaux ne sont pas visibles dans la moitié haute de la première page, vous n'aurez pas le second regard.
La structure qui marche
```
Nom | Titre | Email | Téléphone | LinkedIn | GitHub | Localisation
Résumé (3 lignes)
Compétences (catégorisées, scannables en 5 secondes)
Expérience (plus récent d'abord, 3 à 5 bullets par poste avec résultats mesurables)
Projets (1 ou 2 seulement si début de carrière ou reconversion)
Formation
Certifications et open source (si pertinent)
```
Une page si vous avez moins de 8 ans d'expérience, deux pages au-delà. Jamais trois.
Le résumé qui marque
Trois lignes max. Chaque ligne mérite sa place.
Faible : Data engineer expérimenté avec de solides compétences en big data et cloud, à la recherche d'un poste challengeant.
Fort :
```
Data Engineer avec 6 ans d'expérience en pipelines batch et streaming sur AWS et GCP. Owner de la plateforme data d'une fintech de 300 personnes, traitant 4 milliards d'événements/jour avec 99,95 % d'uptime. Ouvert à un poste senior IC ou tech lead en B2B SaaS.
```
La seconde version répond à trois questions en 30 mots : ce que vous faites, la preuve d'échelle, et ce que vous voulez après.
Le format de la section compétences
Catégorisez. Les recruteurs scannent, ils ne lisent pas.
```
Compétences
Langages : Python (avancé), SQL (avancé), Scala (intermédiaire), Go (basique)
Ingestion : Kafka, Kinesis, Fivetran, Airbyte, CDC custom
Stockage : Snowflake, BigQuery, Redshift, Postgres, Iceberg sur S3
Transformation : dbt, Spark (Databricks), Flink, Beam
Orchestration : Airflow, Dagster, Prefect
Infra : AWS (Lambda, ECS, RDS, S3), GCP (BigQuery, Dataflow, Pub/Sub), Terraform, Docker
Observabilité : Datadog, Monte Carlo, Soda, tests dbt custom
BI : Looker, Mode, Metabase
```
Ne listez pas chaque outil que vous avez effleuré. Choisissez-en 25 à 35 qui matchent les postes que vous visez. Le reste dilue le signal.
Étiquettes de niveau (avancé, intermédiaire, basique) sur les deux lignes du haut seulement. Au-delà, les niveaux deviennent du bruit.
Comment écrire les bullets data engineering
La formule : ce que vous avez construit ou possédé, l'échelle, le choix technique, le résultat business.
Bullets faibles :
Construit des pipelines ETL en AirflowTravaillé avec Spark et KafkaResponsable de la qualité des données
Bullets forts :
Migré 80+ DAGs Airflow de cron vers Dagster event-driven, réduisant la latence moyenne des pipelines de 4h à 35 min et les pages on-call de 60 % par moisConçu la couche streaming (Kafka + Flink + Iceberg) qui a remplacé un batch nocturne, permettant le scoring de fraude en temps réel et réduisant les pertes de fraude de 1,8 M$ annualisésConstruit le framework de data contracts adopté par 14 équipes sources, faisant chuter les incidents de bris de schéma de 9 par trimestre à 1
Chaque bullet montre scope, échelle, choix technique et impact business. Le recruteur n'a pas à interpréter.
Bullets par séniorité
Junior (0 à 2 ans)
Concentrez-vous sur ce que vous avez possédé, même petit. Citez le projet.
Construit et livré les modèles dbt pour le dataset d'attribution marketing (40 modèles, 200+ tests), utilisé par l'équipe growth pour l'analyse hebdomadaire des campagnesMigré trois jobs batch de Pandas vers Spark, faisant passer le runtime quotidien de 6h à 22 min
Mid (3 à 6 ans)
Pilotage de petites initiatives, mentorat de juniors, travail cross-équipe.
Piloté la migration de Redshift vers BigQuery pour 1,2 Po de données sur 9 systèmes sources, livrée en 8 mois sans downtimeEncadré deux ingénieurs juniors lors de leurs premières astreintes ; les deux mènent désormais leurs propres post-mortems
Senior et staff (7+ ans)
Vision plateforme, impact cross-fonctionnel, recrutement et architecture.
Conçu la plateforme data company-wide supportant 60 analystes, 12 équipes ML et 4 milliards d'événements/jour ; coût moyen des requêtes passé de 0,14 à 0,04 $ en 18 moisRecruté 5 data engineers sur deux équipes en 14 mois ; rétention à 100 % au dernier trimestre
Section projets : quand l'inclure
Incluez une section projets si :
- Vous êtes en début de carrière et voulez montrer du concret
- Vous reconvertissez depuis un autre domaine (backend, analytics, ML)
- Vous contribuez à des outils data open source
Gardez à 1 ou 2 projets avec la même structure de bullets que l'expérience. Liez le repo GitHub. Sans lien, le projet pèse moins.
Sautez la section projets si vous avez 5+ ans d'expérience pertinente. Elle pousse le vrai boulot vers le bas.
Outils à manier avec précaution
- Spark vs Pandas : listez les deux si pertinent, mais précisez à quelle échelle vous avez vraiment utilisé Spark (10 Go n'est pas du Spark, 5 To oui)
- `Big data` : évitez l'expression. Donnez le volume
- `Cloud` : nommez le cloud et les services (
AWS Lambda, S3, RDS), pas justeAWS - `ETL/ELT` : choisissez ce que vous faites vraiment. Les deux si vous les avez sérieusement faits
- `Machine learning` : ne mentionnez que si vous avez vraiment livré des pipelines alimentant du ML en prod, avec le framework
Erreurs fréquentes
- Inflation de stack. 60 outils signale que vous êtes intermédiaire dans la plupart. 25 à 35 est le sweet spot.
- Résultats génériques.
Amélioration de la qualité des donnéesne dit rien.Taux de null passé de 4,3 % à 0,2 % sur la table commandes au Q3oui. - Pas d'échelle. Volume, latence, coût, uptime — au moins trois de ces métriques doivent apparaître dans les deux premiers bullets par poste.
- On-call oublié. Le travail de fiabilité, c'est la moitié du job. Si vous l'avez fait, dites-le.
- Leadership tech caché. Mentorat, recrutement, revues d'architecture, RFCs — ça appartient au CV à partir du mid-level.
- Buzzwords sans preuve.
Streaming-first,cloud-native,data mesh— chacun a besoin d'une phrase de preuve, sinon c'est du papier peint.
La checklist format ATS-friendly
- Mise en page une seule colonne
- Polices standard : Calibri, Helvetica, Inter, Source Sans, Arial
- Pas de tableaux, ni de zones de texte, ni d'infographies, ni de photo
- Nom de fichier :
Prenom-Nom-DataEngineer-CV.pdf - Exporter en PDF, pas en Word, mais garder un backup
.docx - Tester en téléversant dans Greenhouse ou Lever et vérifier la sortie parsée
Section compétences par cible de poste
Postes streaming-heavy
Mettez en tête Kafka, Flink, Kinesis, Spark Structured Streaming. Diminuez l'ETL classique.
Postes plateforme analytics
Mettez en tête dbt, Snowflake ou BigQuery, Looker. Montrez l'ownership de la couche sémantique.
Postes infra-leaning
Mettez en tête Terraform, Kubernetes, tooling d'observabilité, ownership on-call.
Postes proches ML
Feature stores (Feast, Tecton), pipelines de training data, bases vectorielles si pertinent.
N'envoyez jamais un seul CV aux quatre. Adaptez la moitié haute au poste visé cette semaine-là.
Passage QA rapide avant envoi
- [ ] Les 6 premières lignes racontent clairement : ce que vous faites, échelle, ce que vous visez ensuite
- [ ] Les 3 hard skills du haut matchent l'offre mot pour mot
- [ ] Chaque poste a au moins une bullet avec un chiffre (lignes, temps gagné, coût, uptime)
- [ ] Vous pouvez défendre chaque outil de votre section compétences dans une conversation de 15 minutes
- [ ] Le CV se parse proprement dans un aperçu ATS gratuit (Resume Worded, Jobscan, ou téléversement réel)
C'est ce qui sépare un CV qui décroche le call de screening d'un CV qui disparaît dans la pile.