Data Engineer- Databricks
hace 3 días
En Derevoempoderamos a las empresas y a las personas, liberando el valor de los datos de nuestros clientes y potenciando el talento de quienes los transforman.
Con más de 15 años de experiencia, diseñamos soluciones de datos e IA de punta a punta: desde la integración en arquitecturas modernas hasta la implementación de modelos inteligentes en procesos clave de negocio.
Si te apasiona el mundo de los datos la innovación, este puede ser tu momento
Buscamos tu talento Sr Data Engineer (Databricks)
¿Cual será tu misión?
Serás pieza clave para crear e implementar arquitecturas modernas de datos con alta calidad, impulsando soluciones analíticas basadas en tecnologías de Big Data. Diseñarás, mantendrás y optimizarás sistemas de multiprocesamiento paralelo, aplicando las mejores prácticas de almacenamiento y gestión en data warehouses, data lakes y lakehouses. Serás el apasionado que recolecta, procesa, limpia y orquesta grandes volúmenes de datos, entendiendo modelos estructurados y semi–estructurados, para integrar y transformar múltiples fuentes con eficacia. Definirás la estrategia óptima según objetivos de negocio y requerimientos técnicos, convirtiendo problemas complejos en soluciones alcanzables que ayuden a nuestros clientes a tomar decisiones basadas en datos.
¿Como lo harás?
- Te integrarás al proyecto, sus sprints y ejecutarás las actividades de desarrollo aplicando siempre las mejores prácticas de datos y las tecnologías que implementamos.
- Identificarás requerimientos y definirás el alcance, participando en sprint planning y sesiones de ingeniería con una visión de consultor que aporte valor extra.
- Colaborarás proactivamente en workshops y reuniones con el equipo interno y con el cliente.
- Clasificarás y estimarás actividades bajo metodologías ágiles (épicas, features, historias técnicas/usuario) y darás seguimiento diario para mantener el ritmo del sprint.
- Cumplirás las fechas de entrega comprometidas y gestionarás riesgos comunicando desviaciones a tiempo.
Qué beneficios tendrás?
- WELLNESS: Impulsaremos tu bienestar integral a través del equilibrio personal, profesional y económico, Nuestros beneficios de ley y adicionales te ayudarán a lograrlo.
- LET´S RELEASE YOUR POWER: Tendrás la oportunidad de especializarte de manera integral en diferentes áreas y tecnologías, logrando así un desarrollo interdisciplinario. Te impulsaremos a plantearte nuevos retos y superarte a ti mismo.
- WE CREATE NEW THINGS: Nos gusta pensar fuera de la caja. Tendrás el espacio, confianza y libertad para crear y la capacitación que se requiera para lograrlo.
- WE GROW TOGETHER: Participarás en proyectos tecnológicos punteros, multinacionales y con equipos extranjeros.
Dónde lo harás?
Somos un gran equipo trabajando en un esquema remoto, somos flexibles y estructurados; proporcionando el equipo necesario para trabajar y herramientas de comunicación interna que faciliten nuestra operación y la de nuestros clientes.
¿Qué pedimos?
Para que te puedsas incorporar y sentirte como pez en el agua siendo un Data Engineer en Derevo, esto es lo que consideraremos:
- Manejo del idioma inglés a nivel intermedio/avanzado (Conversaciones técnicas y de negocios, B2+ o C1)
Experiencia en:
Lenguajes de Consulta y Programación:
T-SQL / Spark SQL:
- DDL y DML, consultas intermedias y avanzadas (subconsultas, CTEs, joins múltiples con reglas de negocio), agrupación y agregación (GROUP BY, funciones de ventana, métricas de negocio), procedimientos almacenados para ETL/ELT, optimización de índices, estadísticas y planes de ejecución para procesos masivos
Python (PySpark):
- Programación orientada a objetos (clases, módulos), gestión de estructuras y tipos de datos (variables, listas, tuplas, diccionarios), control de flujo mediante condicionales y bucles, ingestión de datos estructurados y semiestructurados, desarrollo de DataFrames y UDFs, ventanas temporales y particionado para optimización, buenas prácticas de código (PEP8, modularidad)
Databricks:
- Apache Spark & DataFrame API: Diseño de pipelines que aprovechan la API de DataFrames para transformaciones masivas; uso de funciones declarativas y expresiones vectorizadas.
- Delta Lake: Administración de tablas Delta con ACID transactions, time travel para auditoría y partition pruning para lecturas eficientes dentro de la medallion architecture.
- Autoloader & Data Ingestion: Configuración de ingesta incremental en OneLake o ADLS Gen2 con Auto Loader, captura de cambios de esquema (schema evolution) y checkpointing para garantizar exactly-once delivery sin código adicional.
- Structured Streaming: Orquestación de flujos en tiempo real con triggers event-time y processing-time, watermarking y operaciones stateful para baja latencia y tolerancia a fallos.
- Delta Live Tables (DLT): Declaración de pipelines ETL/ELT en SQL o Python con calidad de datos integrada (Expectations), manejo automático de dependencias y monitoreo continuo.
- Performance Optimization: Técnicas de caching, broadcast joins, shuffle optimizations y uso de formatos columnar (Parquet/Delta) con Z-Ordering y OPTIMIZE para reducir tiempos de procesamiento.
- Lakehouse Federation: Consulta unificada sobre fuentes externas a través de Unity Catalog;
- Jobs & Workflows: Creación de pipelines multietapa con dependencias, retries automáticos, scheduling o llegada de datos; integración con Azure Data Factory si es necesario.
- Repos & CI/CD: Versionado de notebooks y scripts en GitHub/Azure DevOps, configuración de pipelines de validación (unitarias y de esquema) y despliegue automatizado en entornos dev-test-prod.
- Monitoreo y Observabilidad: Alertas mediante notificaciones de jobs de Workflows ante eventos como fallos y generación de alertas proactivas automatizadas
Si cumples con la mayoría de los requisitos y te interesó el perfil no dudes en postularte, que nuestro equipo de Talent te contactará
Become derevian & develop your superpower
-
Data Engineer Databricks
hace 2 días
Desde casa, México VinkOS A tiempo completoEn **VinkOS** somos una empresa especializada en consultoría en **Big Data**, desde arquitecturas, administración de base de datos, pipelines de ingesta, modelos de análisis, hasta capacitación en herramientas de Big Data. Nuevamente nos encontramos en crecimiento, y en esta ocasión buscamos 2 nuevos perfiles **Data Engineer** para un proyecto con una...
-
Sr Data Engineer
hace 7 días
Desde casa, México Framework Science A tiempo completoFramework Science is on a MISSION that focuses on Exploring new technologies and building tomorrow’s Applications. This means we hire TOP Engineers and Designers by providing great benefits and pay so they can focus on solving what’s never been solved before. Our aim is to push the needle of innovation while enabling Technical staff to impact code or...
-
Azure Databricks Software Engineer
hace 7 días
Desde casa, México EPAM Systems A tiempo completo**DESCRIPTION**: Join EPAM as a **Senior Data Engineer specializing in Azure Databricks.** In this role, you'll focus on building a metadata-driven framework for the transformation layer in Azure Databricks and migrating existing jobs to it. If you have hands-on coding experience with Databricks Jobs using Python and PySpark, experience in Azure cloud data...
-
Lead Big Data Engineer with Databricks
hace 4 días
Desde casa, México EPAM Systems, Inc. A tiempo completoWe are looking for a skilled** remote Lead Big Data Engineer with Databricks** experience to join our team.Your primary responsibility will be to lead the development of our ETL pipelines on Databricks using Spark/Scala, Databricks, and AWS. You must have extremely strong experience with Databricks, AWS, Python, and Elastic.**Responsibilities**- Lead the...
-
Data Engineer
hace 1 semana
Desde casa, México CPIM Group A tiempo completoWe are looking for a Data Engineer to join our team. This role requires:**Skills**:- Transforming & moving the data- ETL- PowerBI- Data factory- Azure Synapse- Azure Databricks- Data lake**Requirements**:- Education: Bachelor’s Degree- Advanced English- 5 years of experienceWe offer- Competitive salary and benefits- RemoteTipo de puesto: Tiempo...
-
API / Databricks Test Engineer - REMOTE
hace 2 semanas
Desde casa, México U-hi A tiempo completoWe are looking for a QA Engineer with solid experience in API testing, Databricks, and data validation to join our remote team. The ideal candidate will have a strong background in functional and database testing, hands-on API testing experience (preferably with Postman), and familiarity with automation tools and cloud-based data environments.Experience in...
-
Data Engineer- Azure Data Bricks
hace 3 días
Desde casa, México NEORIS DE MEXICO A tiempo completoThe union of EPAM and NEORIS marks a significant turning point. Combining the English greeting 'Hello' with the Spanish greeting 'Hola', we reflect both companies' multicultural and global nature and a new way of collaborating, where EPAM leads globally, and NEORIS brings its client experience and regional knowledge in Latin America.Estamos en búsqueda de...
-
Data Engineer con Azure
hace 3 semanas
Desde casa, México Talent Accelerator A tiempo completoUna compañía mexicana líder en Software as a Service y Estudios de Mercado está buscando a un Azure Data Engineer.Tu responsabilidad principal será el desarrollo de pipelines para la extracción, transformación y carga de datos **(ETL)** en la nube mediante **Azure**. Esto implica utilizar herramientas como:- Azure SQL Server- Azure Blob Storage- Azure...
-
Data Engineer con Azure
hace 2 semanas
Desde casa, México Talent Accelerator A tiempo completoUna compañía mexicana líder en Software as a Service y Estudios de Mercado está buscando a un Azure Data Engineer.Tu responsabilidad principal será el desarrollo de pipelines para la extracción, transformación y carga de datos **(ETL)** en la nube mediante **Azure**. Esto implica utilizar herramientas como:- Azure SQL Server- Azure Blob Storage- Azure...
-
Databricks Developer
hace 7 días
Desde casa, México Head Hunter A tiempo completoEmpresa lider en TI anda en busca de un Databricks Developer. **Requisitos**: - **Ingles avanzado.**: - **Mas de 4 años de experiência en el puesto.**: - Python. - **Databricks.**: - ADF, Databricks y Python alojado en AWS también es aplicable. - Desarrollo de Azure Cloud (ADF + DataBricks). - Azure SQL, Synapse / Analytics, Ágil y familiarizado con...