Data Engineer Jr

hace 3 días


Puebla, México Tadministro A tiempo completo

FAVOR DE ENVIAR TU CV Y RESPONDER LAS PREGUNTAS

**Puesto**:Data Engineer Jr.**

**Funciones**: Gestión, procesamiento y transformación de datos para facilitar su uso y explotación por parte del equipo de Business intelligence y clientes.

1. Ingesta y Extracción de Datos Extracción de datos desde fuentes diversas: Asegurar que los datos de ejecución del punto de venta (como ventas, productos, inventarios, transacciones, entre otros) se extraigan de las bases de datos o sistemas de origen (como bases de datos SQL, APIs, archivos planos, etc.). Conexión con sistemas POS y otras fuentes: Trabajar con herramientas de integración para extraer datos de sistemas POS, como bases de datos de SQL Server, MySQL, MongoDB, o incluso servicios en la nube (AWS, Azure, etc.).

2. Transformación de Datos (ETL) Procesamiento de datos (ETL): Transformar, limpiar y enriquecer los datos de acuerdo con las necesidades del negocio. Esto incluye la normalización de datos, la eliminación de registros duplicados, la conversión de tipos de datos y la validación de integridad. Transformaciones específicas para Power BI: Crear vistas optimizadas o tablas intermedias que faciliten la carga de los datos en Power BI, asegurándose de que el modelo de datos esté preparado de forma eficiente. Automatización de procesos de ETL: Usar herramientas de integración de datos como SQL Server Integration Services (SSIS), Apache NiFi, o incluso lenguajes como Python para crear procesos automáticos de ingesta y transformación.

3. Diseño y Optimización de Modelos de Datos Modelado de datos eficiente: Diseñar modelos de datos adecuados para Power BI, considerando tablas de hechos (como ventas y transacciones) y dimensiones (como productos, clientes, tiempo, etc.). Optimización de consultas: Asegurarse de que las consultas y transformaciones se ejecuten de manera eficiente, minimizando el tiempo de carga en Power BI. Esto podría implicar la creación de índices, particionamiento de tablas, o el uso de técnicas de data warehousing (como star schema o snowflake schema). Normalización y desnormalización: Implementar estrategias de normalización para reducir redundancia o desnormalización cuando se necesite mejorar el rendimiento de las consultas en Power BI.

4. Automatización de Carga y Actualización de Datos Programar tareas de carga: Configurar y automatizar los procesos de carga de datos en Power BI, ya sea a través de DirectQuery, Dataflows o API de Power BI, asegurando que los datos estén siempre actualizados. Manejo de pipelines de datos: Implementar pipelines de datos (por ejemplo, usando Azure Data Factory, Talend, o scripts en Python) para la actualización y transformación continua de los datos en un proceso automatizado.

5. Calidad y Gobernanza de Datos Monitoreo de la calidad de los datos: Asegurar que los datos sean precisos, completos y consistentes. Implementar procedimientos de monitoreo de calidad de datos para detectar errores o datos incompletos. Validación y pruebas: Verificar la precisión de las transformaciones y las métricas generadas antes de que los datos sean utilizados por los analistas o en Power BI.

6. Colaboración con Equipos de Análisis y Visualización Apoyo al equipo de BI: Trabajar estrechamente con los analistas de datos y diseñadores de dashboards para asegurarse de que los datos estén estructurados y preparados para la visualización en Power BI. Generación de métricas: Definir y calcular las métricas clave que los usuarios de Power BI necesitarán, como ventas por región, por tipo de producto, por hora, etc. Documentación de modelos de datos: Proporcionar documentación técnica que explique el modelo de datos, los procesos ETL y las relaciones entre tablas para los analistas y otros miembros del equipo.

7. Optimización del Rendimiento Mejorar la performance de Power BI: Asegurarse de que el modelo de datos cargado en Power BI sea eficiente, especialmente si se maneja una gran cantidad de transacciones de punto de venta. Esto incluye la creación de vistas materializadas, agregaciones o el uso de modelos tabulares de Power BI. Optimización de recursos: Utilizar técnicas de optimización, como reducir el tamaño de los conjuntos de datos o la implementación de particiones de datos, para mejorar el tiempo de respuesta y la carga de los dashboards.

8. Mantenimiento y Actualización de Infraestructura de Datos Mantenimiento de bases de datos y servidores: Asegurar que las bases de datos y los servidores de datos estén funcionando correctamente, realizando copias de seguridad regulares y actualizando las infraestructuras según sea necesario. Gestión de versiones: Usar herramientas de control de versiones para el código ETL, lo que permite tener un seguimiento adecuado de los cambios en los procesos de datos.

9. Investigación y Mejora Continua Aprender nuevas herramientas y tecnologías: Mantenerse al tanto de las nuevas tecnologías y herramientas en el ecosiste


  • Data Engineer Jr

    hace 1 semana


    Puebla, México Tadministro A tiempo completo

    FAVOR DE ENVIAR TU CV Y RESPONDER LAS PREGUNTAS**Puesto**:Data Engineer Jr.**1. Procesamiento y Limpieza de Datos:Procesar los datos extraídos para asegurar su calidad e integridad.Aplicar transformaciones básicas usando Python (Pandas) y SQL.2. Automatización de Procesos:Colaborar en la creación de scripts para automatizar tareas repetitivas...

  • Data Engineer Jr

    hace 1 semana


    Puebla, México Tadministro A tiempo completo

    FAVOR DE ENVIAR TU CV Y RESPONDER LAS PREGUNTAS **Puesto**:Data Engineer Jr.** 1. Monitoreo de Servicios en AWS 2. Seguridad en la Nube, revisar y mantener actualizadas las políticas de acceso (IAM) para usuarios, roles y servicios. 3. Automatización y Scripting 4. Documentación y Reportes, documentar incidentes, hallazgos de seguridad y ctividades...

  • Data Engineer

    hace 1 día


    Puebla, México Schaeffler Technologies AG & Co. KG A tiempo completo

    Goal of Position Data Engineering covers the collection, modeling, storage, processing and evaluation of extremely large (e.g. social media), rapidly changing (e.g. sensor data) and complex (e.g. ecological systems) data sets. ETL: Extract, Transform, Load (data). Data sets may origin and/or concern all information processes in business. The term complex...

  • Data Engineer

    hace 2 semanas


    Puebla, México Schaeffler Technologies AG & Co. KG A tiempo completo

    Goal of Position Data Engineering covers the collection, modeling, storage, processing and evaluation of extremely large (e.g. social media), rapidly changing (e.g. sensor data) and complex (e.g. ecological systems) data sets. ETL: Extract, Transform, Load (data). Data sets may origin and/or concern all information processes in business. The term complex...


  • Puebla, México Provident México A tiempo completo

    FOR EXPANSION PROVIDENT IS LOOKING: DATA OPERATIONS ENGINEER Location: Puebla The Challenge: It is to act as the single point of accountability for all data initiatives in the market, ensuring alignment with Global Data Operations strategies, frameworks, and standards. The role will coordinate all local data activities, embed governance and quality...


  • Puebla, México Launch Potato A tiempo completo

    A data-driven technology company is seeking a Data Engineer to lead scalable data engineering efforts that empower teams with reliable data. This role requires 5+ years of experience in data engineering, with expertise in AWS, Python, SQL, and Docker. You will be responsible for building efficient ETL processes and collaborating with BI teams to ensure data...


  • Puebla, México Selection Book A tiempo completo

    Una consultora de recursos humanos busca un Data Engineer apasionado por diseñar y mantener infraestructuras de datos. El candidato ideal tendrá al menos 4 años de experiencia en el campo, así como sólidos conocimientos en bases de datos y herramientas ETL. Las responsabilidades incluyen asegurar la calidad de los datos y colaborar con diversos equipos...

  • Data Engineer

    hace 1 día


    Puebla, México AgileEngine A tiempo completo

    Data Engineer (Senior) – AgileEngine Join the AgileEngine team as a Senior Data Engineer (ID43916). AgileEngine is an Inc. 5000 company that creates award‑winning software for Fortune 500 brands and trailblazing startups across 17+ industries. WHY JOIN USWe’re a people‑first culture, recognized with multiple Best Place to Work awards. We value...

  • Data Engineer

    hace 2 semanas


    Puebla, México AgileEngine A tiempo completo

    Data Engineer (Senior) – AgileEngine Join the AgileEngine team as a Senior Data Engineer (ID43916). AgileEngine is an Inc. 5000 company that creates award‑winning software for Fortune 500 brands and trailblazing startups across 17+ industries. WHY JOIN USWe’re a people‑first culture, recognized with multiple Best Place to Work awards. We value...

  • Automotive Product

    hace 1 semana


    Puebla, México EDAG Group A tiempo completo

    A global development company in Puebla is seeking a Process and Product Data Management Engineer. The role involves analyzing technical information, conducting document reviews, and validating data against client systems. Candidates should possess a Bachelor’s degree in Industrial or Mechanical Engineering and at least one year of experience in the...