Saltar a contenido

NYC Taxi Data Pipeline

Este flujo de trabajo de GitHub Actions automatiza la canalización de datos de extremo a extremo, desde la inicialización de la infraestructura de Snowflake hasta la producción de tablas y vistas analíticas utilizando Python y dbt.


💻 Código fuente del proyecto
📚 Documentación dbt en línea

📊 Fuente de Datos

Datos de Registro de Viajes de la TLC - Comisión de Taxis y Limusinas de Nueva York

Los datos incluyen:

  • Fechas/horas de recogida y entrega
  • Zonas de origen y destino
  • Distancias, tarifas detalladas, tipos de pago
  • Número de pasajeros reportado por el conductor

Los datos son recopilados por proveedores de tecnología autorizados y proporcionados a la TLC. La TLC no garantiza la precisión de estos datos.

📄 Licencia

Este proyecto está bajo la licencia MIT. Los datos de origen son proporcionados por la NYC TLC y sujetos a sus términos de uso.