Site Reliability Engineer

hace 2 días


Guadalajara, México Careers at SunDevs A tiempo completo

**Descripción del puesto**:
Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.

Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.

Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.

**Lo que buscamos**:
En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nível de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.

En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.

Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.

**Responsabilidades clave**:

- Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
- Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
- Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
- Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
- Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
- Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
- Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
- Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
- Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
- Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
- Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
- Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
- Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
- Participar en una reunión 1:1 con el resto de tu equipo.
- Proporcionar retroalimentación oportuna a tu equipo.
- Participar en la definición de los OKR del producto para tu equipo.
- Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.

**Requisitos**:

- Inglés B1 como mínimo
- Excelentes habilidades de comunicación con partes interesadas de alto nível y de negocios
- Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiência práctica equivalente en un campo relacionado con el software.
- Más de 2 años manejando sistemas operativos Linux
- Más de 3 años de experiência escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
- Amplia experiência con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
- Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
- Comprensión de los sistemas de bases de datos y experiência en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Conocimie


  • Site Reliability Engineer

    hace 3 semanas


    Guadalajara, México Finastra USA Corporation A tiempo completo

    **Responsibilities**:**What will you contribute?**As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra’s Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You’ll be treating operations as a software...


  • Guadalajara, México f5 A tiempo completo

    Everything we do centers around people. That means we obsess over how to make the lives of our customers, and their customers, better. And it means we prioritize a diverse F5 community where each individual can thrive.Business/Job Title: Senior Site Reliability EngineerPosition SummarySoftware engineering is a core discipline at F5 for many roles. As a...


  • Guadalajara, México f5 A tiempo completo

    Everything we do centers around people. That means we obsess over how to make the lives of our customers, and their customers, better. And it means we prioritize a diverse F5 community where each individual can thrive.Software engineering is a core discipline at F5 for many roles. As a software engineer specializing in site reliability, you will bring a...

  • Site Reliability Engineer

    hace 4 semanas


    Guadalajara, México Careers at SunDevs A tiempo completo

    **Descripción del puesto**:Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.Brindarás asesoramiento y guía a nuestros ingenieros de...


  • Guadalajara, México f5 A tiempo completo

    Everything we do centers around people. That means we obsess over how to make the lives of our customers, and their customers, better. And it means we prioritize a diverse F5 community where each individual can thrive. Business/Job Title: Site Reliability Engineer - IAM - III Position Summary: Software engineering is a core discipline at F5 for many...


  • Guadalajara, México f5 A tiempo completo

    Everything we do centers around people. That means we obsess over how to make the lives of our customers, and their customers, better. And it means we prioritize a diverse F5 community where each individual can thrive.Position SummarySoftware engineering is a core discipline at F5 for many roles. As a software engineer specializing in site reliability, you...


  • Guadalajara, México Finastra A tiempo completo

    Your deliverables as a Site Reliability Engineer will include, but are not limited to, the following:- Work with containers and container orchestration systems such as Kubernetes- Capacity Planning to determine resource requirements of your service for it to be scalable, efficient, and reliable- Collaborate with other engineers to implement operational...

  • Site Reliability Engineer

    hace 3 semanas


    Guadalajara, México Wizeline A tiempo completo

    **The Company**:Wizeline is a global digital services company helping mid-size to Fortune 500 companies build, scale, and deliver high-quality digital products and services. We thrive in solving our customer’s challenges through human-centered experiences, digital core modernization, and intelligence everywhere (AI/ML and data). We help them succeed in...


  • Guadalajara, Jalisco, México ValorH A tiempo completo

    Conceivable Life Sciencesis pioneering the world's first AI-powered, automated IVF laboratory, revolutionizing reproductive healthcare through cutting-edge robotics and artificial intelligence. We are seeking a passionate and dedicatedSite Reliability Cloud Engineerto design, implement, and maintain the entire cloud infrastructure of our growing company (~60...


  • Guadalajara, México Arrive Logistics A tiempo completo

    **Who We Are****Who We Want**As a Senior Site Reliability Engineer for Arrive Logistics, you will be responsible for building a purposeful, proactive, and sustainable approach to reliability based on core SRE principles and practices. Your role covers the entire life-cycle of a product: from helping engineering teams with architecture and delivery to on-call...