Airflow: 9 bonnes pratiques incontournables
🎁 On a demandé à un contributeur Apache Airflow de dévoiler 9 pratiques incontournables pour optimiser ses pipelines de données 🚀
Et on a compilé tout ça dans un Notion.
🚀 En plus de ses activités Open Source, Raphael Auvert est Lead Data Engineer & ML Ops, passé par chez Leboncoin.fr, ManoMano, Turo etc… et aujourd’hui à l’INA. C’est en collaboration avec Simon Maurin, CTO de next-level.run( ), qu’on vous livre un dossier complet sur Apache Airflow et ses bonnes pratiques pour optimiser ses pipelines de données.
💼 Que tu sois data engineer junior ou expérimenté, découvre des conseils concrets, avec exemples de code (bad vs. good) sur des sujets comme :
🔹 Utiliser des workflows d’exécution externes
🔹 Documenter efficacement
🔹 Ecrire des tâches atomiques et idempotentes
🔹 Bien utiliser XCom et les Operators (Python et Bash)
🔹 Choisir l’Executor adapté à ton échelle