NYC Taxi Data Pipeline
Ce workflow GitHub Actions automatise le pipeline de données de bout en bout, depuis l'initialisation de l'infrastructure Snowflake jusqu'à la production de tables et vues analytiques en utilisant python et dbt.
💻 Code source du projet
📚 Documentation dbt en ligne
📊 Source des Données
TLC Trip Record Data - Commission des Taxis et Limousines de NYC
Les données incluent :
- Dates/heures de prise en charge et dépose
- Zones de prise en charge et de dépose
- Distances, tarifs détaillés, types de paiement
- Nombre de passagers rapporté par le chauffeur
Les données sont collectées par les fournisseurs technologiques autorisés et fournies à la TLC. La TLC ne garantit pas l'exactitude de ces données.
📄 Licence
Ce projet est sous licence MIT. Les données source sont fournies par la NYC TLC et soumises à leurs conditions d'utilisation.