Ter uma compreensão abrangente das tarefas necessárias para concluir a instalação e a manutenção de equipamentos SITA e de terceiros e ser capaz de direcionar trabalhadores individuais que estão ajudando ou se reportando a eles.
Aplicar automação e software a quaisquer tarefas ou partes do sistema que se beneficiariam disso ou são executadas manualmente;
Capaz de solucionar problemas complicados de plataforma cruzada, lidar com SO, rede, banco de dados em um ambiente SaaS baseado em nuvem e lidar com incidentes de produção ao vivo, depurar/solucionar problemas de aplicativos e infraestrutura, seguir e implementar as melhores práticas de SRE;
Experiência com ferramentas de gerenciamento de automação/configuração como Salt/Puppet/Chef/Ansible;
Experiência em solucionar problemas de produção e coordenar com a equipe de desenvolvimento para agilizar a implantação do código;
Monitorar o desempenho do aplicativo, tomar medidas para melhorar o desempenho geral e a estabilidade do aplicativo e acompanhar a implementação;
Documentar seu conhecimento do sistema conforme você o adquire ao longo do tempo, criar runbooks e garantir que as informações críticas do sistema estejam prontamente disponíveis para aqueles que precisam;
Manter e monitorar a implantação, orquestração dos servidores, contêineres docker, bancos de dados e infraestrutura geral de back-end;
Experiência com CI/CD em ambientes de nuvem e tecnologia de contêiner, Docker e Kubernetes, Docker Swarm;
Experiência como administrador de sistemas Linux (por exemplo, CentOS, RedHat) e administração de sistemas de linha de comando, como Bash, VIM, SSH;
Capacidade de trabalhar e dar suporte a operações 24 horas por dia, 7 dias por semana;
Cobrir todas as tarefas listadas na vaga de Help Desk Manager quando necessário;
Cobrir todas as tarefas listadas na vaga de Field support Team Leader2 quando necessário.
Requisitos:
Bacharelado em TI, Telecom ou Negócios, ou equivalente (de preferência Ciência da
Computação/Engenharia), BE/BTech com CS ou disciplina relacionada;
Mais de 5 anos de experiência como DevOps, Site Reliability Engineer (SRE) ou Systems Engineer com conhecimento avançado de administração Linux e tecnologia de nuvem (de preferência no Azure);
Experiência em escrever scripts de automação, criar painéis de aplicativos para monitoramento proativo usando Ruby, PowerShell, script Python ou tecnologias semelhantes, capacidade de depurar e otimizar código e automatizar tarefas de rotina;
Forte conhecimento de tecnologia de microsserviços;
Engenheiro de Sistemas Certificado pela Microsoft;
Habilidades avançadas de comunicação em inglês, tanto escrita quanto verbal, incluindo habilidades avançadas de escrita comercial (serão testadas);
Administração do Kubernetes, Docker, Harbor, controlador de entrada, Helm, ForgeRock, Cert