Especialista en datos con background en Machine Learning. Trabaje en el diseño, optimización y carga de información en bases de datos transaccionales, Dashboards y Data Warehouses, combinando habilidades técnicas con un enfoque estadístico. Cuento con experiencia en Big Data, Transformers, LLM y NLP. Tengo habilidades sólidas en estructura y modelado de datos, desarrollo de pipelines ETL,ELT y EL, así como en migración y optimización de datos en la nube, Especializado en Google Cloud Platform(GCP) con conocimientos en AWS y Azure. Poseo experiencia en orquestación de datos con Airflow, Scraping y generación de reportes estadísticos con herramientas como Power BI, Looker Studio y Tableau. Además, domino SQL, Python y Pandas, con más de 3 años de experiencia práctica.
Destaco por mi capacidad de resolución de problemas complejos, aprender rápidamente nuevas tecnologías, y comunicación efectiva para traducir resultados técnicos en insights claros para la toma de decisiones.
Proyectos recientes
DataPulse: Reseñas y Recomendaciones.
Consultoría de análisis de sentimiento para negocios gastronómicos, diseñando y gestionando un Data Warehouse, Pipelines ETL automatizados y Data Marts para visualización y Machine Learning.
Automatización de procesos en Airflow con Cloud Functions transformando un proceso manual en un flujo completamente automatizado, reduciendo errores humanos y optimizando los tiempos de procesamiento.
Integración de múltiples fuentes de datos al DW, incluyendo Google Maps y Yelp, para estructurar y enriquecer la información de reseñas, dividiendo luego la información en distintos datamarts.
Visualización de datos en Power BI, para destacar métricas y mejorar la claridad de los datos.Modelado de datos utilizando un modelo copo de nieve para el DW y optimizar el almacenamiento, y un modelo estrella para los datamarts de reporting y ML optando por la velocidad de consultas.
Monitoreo de rendimiento con BigQuery Execution Plan evaluando métricas de rendimiento como el tiempo de ejecución, bytes procesados, complejidad de la consulta, particiones y clustering de tablas.
#Airflow #BigQuery #CloudFunctions #SentimentAnalysis #StorytellingVisual #PowerBI #DAX #CloudStorage #ETL #EDA #KPIs
ENACOM Internet Argentina
Análisis del comportamiento de servicios de internet en Argentina a nivel nacional. con el objetivo de identificar tendencias clave y oportunidades de mejora.
Integre múltiples fuentes de datos, incluyendo INDEC y ENACOM, para estructurar y enriquecer la información.
Realicé un ETL para transformar faltantes y errores de datos en el uso de tecnologías y velocidades de conexión, mejorando la unicidad del análisis en un 70% en términos de duplicidad, claves primarias, foráneas y consultas.
Creación de stored procedures para automatizar procesos y mejorar la eficiencia en la manipulación y transformación de los datos dentro de la base de datos.
Optimizar el rendimiento de las consultas en SQL Server mediante el uso de índices DBCC y Execution Plan para el análisis de la base de datos y el ajuste de rendimiento.
Visualización de datos en Power BI, para medir KPIs accionables de los datos.
#EDA #StorytellingVisual #ETL #PowerBI #DAX #Pandas #Python #PowerQuERY #DBCC #Excel #KPIs
API Modelo de recomendación de peliculas
Desarrolle una API para recomendar películas basada en similitudes del coseno y técnicas avanzadas de procesamiento de lenguaje natural (NLP).
Implemente un ETL para mejorar la unicidad y claridad de los datos hacia la API. Tratando valores faltantes con técnicas de ML. Procesamiento de texto con normalización, lematización, expresiones regulares y vectores TF-IDF para preparar los datos textuales de las películas y mejorar la calidad de las recomendaciones.
Desplegué una API en FastAPI, consumida por una interfaz web, para ofrecer recomendaciones en tiempo real con información detallada de películas y actores.
Optimice el almacenamiento con almacenamiento columnar, mejorando la velocidad de consultas de la API.
#NLP #TFIDF #FastAPI #Scikit-Learn #TruncatedSVD #Render #RecomendadorDePelículas #Parquet #MachineLearning
Analisis de Atención y Servicio en Call Centers.
Medición de rendimiento en empleados de un Call Center. con el objetivo de identificar cuellos de botella y tiempos de espera.
Implemente un ETL para mejorar la unicidad y claridad de los datos hacia los reportes. Tratando valores faltantes con técnicas de ML.
Identifique cuellos de botella y mejoras en tiempos de espera. Para medir el rendimiento de los empleados
Entregué un reporte de conclusiones para que la gerencia pueda tomar decisiones basadas en datos.
#PowerBI #KPIs #DataVisualization #CallCenter #Scikit-learn #KNN
Certificaciones
Data Science - Henry - Nov24
#SQL #GCP #PowerBI #MachineLearning #Python #BigData #NoSQL
Data Analysis with Python - FreeCodeCamp - Feb24
#EDA #Python #NumPy #Seaborn #MatplotLib #Scikit-Learn
Data Analytics - Informatorio Chaco - Dic23
#DataLakes #DataWarehouses #SQL #Flask #API #Python #BigData
Desarrollo Web con Python - Informatorio Chaco -
#Python #Django #SQL #Git #POO #Backend
Contactame y hagamos la diferencia.
¿Tienes un proyecto en mente o necesitas ayuda para convertir tus datos en decisiones accionables?
¡Hablemos! Estoy disponible para colaborar en proyectos desafiantes y crear soluciones basadas en datos que marquen la diferencia.