Aller au contenu

NYC Taxi Data Pipeline

Ce workflow GitHub Actions automatise le pipeline de données de bout en bout, depuis l'initialisation de l'infrastructure Snowflake jusqu'à la production de tables et vues analytiques en utilisant python et dbt.

💻 Code source du projet
📚 Documentation dbt en ligne

📊 Source des Données

TLC Trip Record Data - Commission des Taxis et Limousines de NYC

Les données incluent :

  • Dates/heures de prise en charge et dépose
  • Zones de prise en charge et de dépose
  • Distances, tarifs détaillés, types de paiement
  • Nombre de passagers rapporté par le chauffeur

Les données sont collectées par les fournisseurs technologiques autorisés et fournies à la TLC. La TLC ne garantit pas l'exactitude de ces données.

📄 Licence

Ce projet est sous licence MIT. Les données source sont fournies par la NYC TLC et soumises à leurs conditions d'utilisation.