API Consumer - Extraccion de Datos Judiciales
Rama Judicial API Consumer es un sistema ETL (Extract, Transform, Load) que consume la API REST publica de la Rama Judicial de Colombia para extraer informacion de procesos judiciales, incluyendo documentos PDF, y transformarla a formato de texto estructurado para analisis.
Caracteristicas Principales
- Consumo de API REST: Integracion con la API publica de la Rama Judicial
- Extraccion de PDFs: Descarga y parsing automatico de documentos procesales
- Rate Limiting: Control de velocidad de peticiones para respetar limites de la API
- Transformacion a Texto: Conversion de PDFs a texto plano estructurado
- Manejo de Errores: Reintentos automaticos y logging de fallos
- Caching: Almacenamiento local de respuestas para evitar peticiones redundantes
Tecnologias Utilizadas
- Lenguaje: TypeScript
- Runtime: Node.js
- HTTP Client: axios
- Rate Limiting: p-limit
- PDF Parsing: pdf-parse
- Output: Archivos TXT estructurados
Impacto
Este sistema permite la extraccion automatizada de datos judiciales para analisis estadistico y mineria de datos, facilitando la investigacion sobre patrones procesales y la generacion de reportes basados en informacion publica de la Rama Judicial.
Proyecto desarrollado como pipeline de datos para alimentar analisis estadisticos y herramientas de inteligencia sobre procesos judiciales colombianos, demostrando capacidades de integracion con APIs gubernamentales y procesamiento de documentos.