Site Reliability Engineer

hace 3 días


Guadalajara, México SunDevs A tiempo completo
Descripción del puesto

Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.

Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.

Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.

Lo que buscamos

En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nivel de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.

En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.

Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.

Responsabilidades clave

  • Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
  • Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
  • Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
  • Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
  • Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
  • Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
  • Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
  • Participar en la rotación de guardia y responder a emergencias para garantizar la disponibilidad del sistema 24/7.
  • Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
  • Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
  • Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
  • Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
  • Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
  • Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
  • Participar en una reunión 1:1 con el resto de tu equipo.
  • Proporcionar retroalimentación oportuna a tu equipo.
  • Participar en la definición de los OKR del producto para tu equipo.
  • Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.

Requisitos

  • Inglés B1 como mínimo
  • Excelentes habilidades de comunicación con partes interesadas de alto nivel y de negocios
  • Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiencia práctica equivalente en un campo relacionado con el software.
  • Más de 2 años manejando sistemas operativos Linux
  • Más de 3 años de experiencia escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
  • Amplia experiencia con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
  • Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
  • Comprensión de los sistemas de bases de datos y experiencia en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
  • Conocimiento de los principios de DevOps y experiencia con herramientas de DevOps (por ejemplo, Jenkins, AWS Code Pipeline, Bit


  • Guadalajara, México Finastra USA Corporation A tiempo completo

    **Responsibilities**: **What will you contribute?** As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra’s Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You’ll be treating operations as a software...


  • Guadalajara, México Finastra USA Corporation A tiempo completo

    **Responsibilities**: **What will you contribute?** As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra’s Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You’ll be treating operations as a software...


  • Guadalajara, Jalisco, México Finastra Usa Corporation A tiempo completo

    Responsibilities:What will you contribute?As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra's Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You'll be treating operations as a software engineering...

  • Site Reliability Engineer

    hace 4 semanas


    Guadalajara, Jalisco, México Finastra A tiempo completo

    ResponsibilitiesWhat will you contribute?As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra's Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You'll be treating operations as a software engineering problem...


  • Guadalajara, Jalisco, México Finastra A tiempo completo

    ResponsibilitiesWhat will you contribute?As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra's Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You'll be treating operations as a software engineering problem...


  • Guadalajara, Jalisco, México myGwork - LGBTQ+ Business Community A tiempo completo

    This inclusive employer is a member of myGwork – the largest global platform for the LGBTQ+ business community. ResponsibilitiesWhat will you contribute?As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra's Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture...

  • Site Reliability Engineer

    hace 4 semanas


    Guadalajara, Jalisco, México myGwork - LGBTQ+ Business Community A tiempo completo

    This inclusive employer is a member of myGwork – the largest global platform for the LGBTQ+ business community. ResponsibilitiesWhat will you contribute?As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra's Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture...

  • Site Reliability Engineer

    hace 2 semanas


    Guadalajara, México Finastra A tiempo completo

    Your deliverables as a Site Reliability Engineer will include, but are not limited to, the following: - Work with containers and container orchestration systems such as Kubernetes - Capacity Planning to determine resource requirements of your service for it to be scalable, efficient, and reliable - Collaborate with other engineers to implement operational...

  • Site Reliability Engineer

    hace 4 semanas


    Guadalajara, México FreshBooks A tiempo completo

    The Opportunity - Site Reliability Engineer The Infrastructure team at FreshBooks is looking for talented and experienced engineers to help us build and support our cloud-native infrastructure. Join our growing organization and you will get a chance to be in the driving seat of innovation and change at FreshBooks. As a Site Reliability Engineer, you’ll...


  • Guadalajara, Jalisco, México SunDevs A tiempo completo

    del puestoComo Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para...


  • Guadalajara, México f5 A tiempo completo

    Everything we do centers around people. That means we obsess over how to make the lives of our customers, and their customers, better. And it means we prioritize a diverse F5 community where each individual can thrive. Position Summary Software engineering is a core discipline at F5 for many roles. As a software engineer specializing in site reliability,...


  • Guadalajara, Jalisco, México Arrive Logistics A tiempo completo

    Who We AreWho We WantAs a Senior Site Reliability Engineer for Arrive Logistics, you will be responsible for building a purposeful, proactive, and sustainable approach to reliability based on core SRE principles and practices. Your role covers the entire life-cycle of a product: from helping engineering teams with architecture and delivery to on-call...

  • Site Reliability Engineer

    hace 2 semanas


    Guadalajara, México Finastra USA Corporation A tiempo completo

    **Responsibilities**: **What will you contribute?** As a Site Reliability Engineer your mission is to protect and advance the software & systems behind Finastra’s Cloud hosted services running on Fusion Operate. Finastra believes in a blameless culture where the primary objective is continuous improvement. You’ll be treating operations as a software...


  • Guadalajara, Jalisco, México BMC Software A tiempo completo

    Basic Information:CountryMexicoStateJaliscoCityGuadalajaraDate Published15-May-2023Job ID37236Travel AmountNoneDescription and Requirements:LI-LH1BMC helps customers run and reinvent their businesses in the digital age by tackling their IT management challenges, championing their innovation, and celebrating their success.Every BMC employee has the potential...


  • Guadalajara, México F5 A tiempo completo

    **The systems reliability **engineer will be responsible to incorporate aspects of software engineeringand applies them to infrastructure and operationsproblems. This position will focus on the engineering and support for single sign on (SSO) and Azure cloud-based infrastructure. The main goal of a systems reliability engineer is to create scalableand highly...


  • Guadalajara, México Oracle A tiempo completo

    Site Reliability Developer-2300008Z **Applicants are required to read, write, and speak the following languages***: English **Preferred Qualifications** We're looking for a Site Reliability Engineer (SRE) to join our team and develop automated software solutions for the operational aspects of an organization. - Incorporate SRE and DevOps practices, to...


  • Guadalajara, México Grid Dynamics A tiempo completo

    We are seeking a strong Site Reliability Engineer with good technical expertise. Our client is the world's largest American retail chain sells supplying tools, construction products, and services with over 90 distribution centers throughout the United States to serve over 2,000 stores. As of 2020, this company is ranked in the Fortune 500 rankings of the...

  • Site Reliability Engineer

    hace 3 semanas


    Guadalajara, México Grid Dynamics A tiempo completo

    We are seeking a strong Site Reliability Engineer with good technical expertise. Our client is the world's largest American retail chain sells supplying tools, construction products, and services with over 90 distribution centers throughout the United States to serve over 2,000 stores. As of 2020, this company is ranked in the Fortune 500 rankings of the...


  • Guadalajara, México F5 A tiempo completo

    At F5, we strive to bring a better digital world to life. Our teams empower organizations across the globe to create, secure, and run applications that enhance how we experience our evolving digital world. We are passionate about cybersecurity, from protecting consumers from fraud to enabling companies to focus on innovation.    Everything we do centers...


  • Guadalajara, México Tech Holding A tiempo completo

    **About us**: Working at Tech Holding isn't just a job, it's an opportunity to be a part of something bigger. We are a full-service consulting firm that was founded on the premise of delivering predictable outcomes and high-quality solutions to our clients. Our founders and team members have industry experience and have held senior positions in a wide...