NYC Taxi Data Pipeline
Este flujo de trabajo de GitHub Actions automatiza la canalización de datos de extremo a extremo, desde la inicialización de la infraestructura de Snowflake hasta la producción de tablas y vistas analíticas utilizando Python y dbt.
💻 Código fuente del proyecto
📚 Documentación dbt en línea
📊 Fuente de Datos
Datos de Registro de Viajes de la TLC - Comisión de Taxis y Limusinas de Nueva York
Los datos incluyen:
- Fechas/horas de recogida y entrega
- Zonas de origen y destino
- Distancias, tarifas detalladas, tipos de pago
- Número de pasajeros reportado por el conductor
Los datos son recopilados por proveedores de tecnología autorizados y proporcionados a la TLC. La TLC no garantiza la precisión de estos datos.
📄 Licencia
Este proyecto está bajo la licencia MIT. Los datos de origen son proporcionados por la NYC TLC y sujetos a sus términos de uso.