Para entender as melhores práticas de gestão de TI, precisamos falar primeiro sobre o serviço de TI, que é responsável por se preocupar com a entrega de hardware, software e documentação, com o objetivo de resolver um problema ou criar novas funcionalidades para o negócio. Uma empresa cuja gestão não considera todo o ciclo de vida da TI corre uma série de riscos, como: baixa segurança de dados, falta de visibilidade do ambiente, dificuldade na resolução de incidentes e atrasos nas entregas. Por não existir processos mapeados ou um planejamento prévio, o esforço para solucionar problemas acaba sendo maior, impactando na entrega de SLA (Service Level Agreement).
Se você quer entender mais a fundo sobre como uma gestão eficiente pode ajudar o seu time a cumprir com o acordo de nível de serviço, continue lendo este resumo da live apresentada pelo nosso especialista em cloud computing, Ariel Carvalho. Se preferir, ao final desse resumo você também poderá conferir a gravação na íntegra.
ITSM - (IT Service Management, ou Gerenciamento de Serviços de TI) consiste em um processo de gestão que se preocupa em entregar soluções sempre alinhadas ao negócio, visando a governança de todo o ciclo de vida da TI e reduções de custos a longo prazo.
Medindo a eficiência da gestão de TI
Existem KPIs (Indicadores de Desempenho) que devemos considerar na gestão da TI com base em melhores práticas e que podemos implantar com auxílio de ferramentas. Para citar alguns:
Error budget é uma métrica mais utilizada na tomada de decisões sobre atualizações nos serviços de TI. Como o mal gerenciamento desse orçamento pode deixar seus serviços em freeze, utiliza-se error budget quando há necessidade de atualizar serviços de TI. Já quando se trata de serviços de infra, a métrica pode ser utilizada em casos mais críticos, nos quais é preciso justificar o tempo de indisponibilidade.
O gerenciamento das operações de TI e a atenção a estes KPIs impacta na entrega de SLA, uma vez que este é um fator diretamente relacionado aos requisitos do negócio.
SLA é o acordo de nível de serviço estabelecido entre cliente e prestador, que descreve, de maneira contratual, os serviços e nível de atendimento que o contratante pode esperar receber e em quanto tempo, bem como as metas de entrega mensuráveis. O SLA deve mensurar a possibilidade dessa entrega dos serviços definidos pelo negócio, bem como o esforço que deve ser aplicado.
Como quantificar o SLA de atendimento?
Diferenciar incidentes de problemas
Incidente é uma falha em algum item de configuração dos serviços de TI prestados ou a degradação da qualidade, ou seja, incidente é algo que indica uma anormalidade nos serviços. Incidentes podem ser resolvidos com soluções de contorno. Já o problema, apesar de diferente do incidente, via de regra é gerado por um incidente. Problema é a causa desconhecida de um incidente e exige a investigação da causa raiz.
Quando falamos em incidentes, o foco deve ser resolver o sintoma o mais rápido possível e não necessariamente a causa. Já o propósito do gerenciamento de problemas é identificar, investigar e remover as causas. Sempre que uma causa raiz de incidentes não é identificada, um problema deve ser aberto.
Ciclo de gerenciamento de incidentes
O ciclo de gerenciamento de incidentes deve ser realizado da seguinte forma:
Ciclo de gerenciamento de problemas
Já o ciclo de gerenciamento de problemas deve ser feito da seguinte maneira:
Catálogo de serviços e ferramentas de gerenciamento
É importante termos bem mapeado todos os serviços que a operação deve entregar com um catálogo de serviços, que deve conter as seguintes informações:
Com o catálogo definido, é importante criar procedimentos operacionais para cada tipo de serviço para categorizá-los em níveis de atendimento. O objetivo é criar uma base de conhecimento e atender o máximo de chamados no primeiro nível, diminuindo a escala. O processo de criação de procedimentos deve ser contínuo: sempre que houver a necessidade de escalar, deve ser aberta uma requisição de procedimento, garantindo que no próximo chamado deste tipo o primeiro nível já tenha base para atender.
Com tudo mapeado, é importante adotar uma ferramenta para gerenciamento e automação de chamados. Por meio da ferramenta, tanto cliente como atendente podem acompanhar o status da solicitação, bem como validar se o SLA está sendo atendido. Agora que você chegou até aqui, que tal se aprofundar no assunto e conferir os exemplos e aplicações práticas desses conhecimentos na gravação da live?