Governança não é papel: é poder. ITSM, do board ao backlog
ITSM na Prática: como organizar, padronizar e medir Serviços de TI que entregam valor
Você não precisa de mais reuniões. Precisa de serviço que funciona, toda vez. É disso que trata ITSM (IT Service Management): transformar TI de “apagadora de incêndio” em máquina previsível de entrega. ITSM não é um manual na gaveta; é um jeito de operar — do catálogo ao pós-atendimento, do incidente à mudança — com processos claros, papéis definidos, métricas vivas e melhoria contínua.
O que é — e o que muda na prática
ITSM é a disciplina que projeta, entrega, opera e melhora serviços de TI com foco em valor ao negócio. Vai além do suporte: define como a TI atende, o que promete (SLAs/OLAs) e como comprova (KPIs). Na prática, isso significa:
• Catálogo de Serviços como vitrine do que a TI entrega.
• Fluxos padronizados para Incidentes, Requisições, Mudanças e Problemas.
• Governança para decidir com dados e priorizar o que importa.
• Automação para tirar gente de tarefas repetitivas e acelerar o ciclo.
Resultado? Menos variação, menos retrabalho, menos ruído. Mais previsibilidade, mais confiança, mais velocidade.
Por que padronizar importa
Desorganização custa caro: tickets que somem, soluções improvisadas, heróis exaustos e usuários irritados. Padronizar reduz o tempo de resolução, evita reaberturas e cria transparência. Todo mundo sabe o que pedir, como pedir e o que esperar. A TI ganha governança; as áreas de negócio ganham serviço confiável.
Frameworks que dão lastro (sem engessar)
• ITIL 4: linguagem comum de práticas (incidentes, problemas, mudanças etc.) e um sistema de valor que conecta estratégia a operação.
• ISO/IEC 20000-1: padrão de gestão de serviços; ótimo para maturidade, auditoria e disciplina.
• COBIT: governança e gestão; ajuda a ligar TI ao risco, ao controle e aos objetivos corporativos.
Adapte à sua realidade. Framework não é grilhão; é trilho.
KPIs que importam (e como usá-los de verdade)
Métrica não é enfeite de dashboard. É alavanca de decisão. Eis o kit essencial — com interpretação e uso:
• MTTR (Mean Time to Resolve): tempo médio para resolver incidentes.
Uso: defina metas por criticidade (P1, P2...). Reduza variabilidade via base de conhecimento e automação no roteamento.
• MTTA/MTTD: tempo para começar o atendimento / detectar falhas.
Uso: ataque gargalos de monitoramento e plantão. Quanto menor, mais cedo você limita o impacto.
• FCR (First Contact Resolution): % resolvido no primeiro contato.
Uso: treine L1, enriqueça a base de soluções e habilite automações de baixa complexidade no portal.
• Cumprimento de SLA: % de chamados dentro do prazo acordado.
Uso: combine com aging do backlog; priorize riscos de vencimento com alertas e filas inteligentes.
• Backlog envelhecido: chamados com X dias sem avanço.
Uso: indicador de saúde do processo; cobre donos de serviço e revise capacidade/turnos.
• Taxa de reabertura: voltou, é porque não fechou direito.
Uso: sinal de qualidade. Faça análise de causa e ajuste playbooks.
• CSAT/NPS por serviço: satisfação por tipo de demanda e por canal.
Uso: não olhe só geral — ataque jornadas com notas baixas.
• Custo por atendimento (CPA): humano vs. automatizado.
Uso: construa business case de automação e mostre ROI por fila/categoria.
• XLA (Experience Level Agreement): acordos orientados à experiência (ex.: “voltei a trabalhar em 15 min”).
Uso: equilibre SLA técnico com o que realmente importa ao usuário.
Exemplo de metas trimestrais
MTTR P2 ≤ 8h | FCR ≥ 70% | SLA ≥ 92% | Reabertura ≤ 7% | CSAT ≥ 4,5/5 | Backlog envelhecido ≤ 3%
Catálogo, SLAs e papéis — a tríade da previsibilidade
• Catálogo de Serviços: descreva o que é, para quem, como pedir, SLA, pré-requisitos e responsáveis.
• SLAs/OLAs: prazos, janelas, critérios de prioridade e condições de exceção. Nada de promessas vagas.
• Papéis: Service Owner (dono do serviço), Service Manager (operação e melhoria), Process Owners (Incidente, Mudança, etc.). Responsável não é aquele “quem sabe” — é quem responde.
Processos essenciais (com toque de prática)
• Incidentes: registrar, classificar, priorizar, diagnosticar, resolver, aprender. Sinais vitais: MTTR, SLA, reabertura.
• Requisições: padronize formulários e automatize aprovações simples. Sinais: tempo de ciclo por tipo, CSAT.
• Mudanças: fluxo leve para mudanças padrão; CAB para as críticas. Sinais: taxa de sucesso da mudança, falhas pós-implementação.
• Problemas: análise de causa raiz (5 Porquês, Ishikawa), ações corretivas e preventivas. Sinais: redução de incidentes repetitivos.
CMDB e inventário: contexto é rei
Sem CMDB e inventário confiável, resolver incidente vira adivinhação. Mapeie relacionamentos (aplicação → servidor → rede → dependências). Isso acelera diagnóstico, qualifica mudança e reduz risco. Comece pelo que dói mais (serviços críticos) e expanda.
Automação: de buzzword a produtividade real
Automatize onde há volume, regra clara e baixo risco:
• Classificação/roteamento de tickets.
• Reinicializações, resets, provisionamentos frequentes.
• Aprovações com critérios objetivos.
• Notificações proativas de status e vencimento.
Automação boa tira fricção do usuário e libera analistas para o que exige pensamento.
Dashboards que o board entende
Tenha dois níveis:
• Executivo: MTTR por criticidade, cumprimento de SLA, top 5 serviços por volume/impacto, CSAT/NPS, custo por atendimento, tendência de backlog.
• Tático: fila por analista, aging, reaberturas por categoria, mudanças por risco/sucesso, problemas abertos/fechados.
Sem floreio: tendência, meta, status. E revisão semanal.
Roadmap de implantação (enxuto, escalável)
1. Diagnóstico e baseline: mapeie serviços, volumes, gargalos, KPIs atuais. Sem espelho retrovisor, não há evolução.
2. Catálogo + SLAs/OLAs: publique o essencial; mexa no restante por sprints.
3. Processos core (Incidente, Requisição, Mudança, Problema) com playbooks e papéis.
4. Automação quick wins: 3 a 5 casos de alto volume (ex.: reset de senha, criação de acesso, reinstalação padrão).
5. CMDB crítico: comece pelos serviços de maior impacto.
6. Dashboards e rituais: dailies táticas, semanal de performance, mensal executivo.
7. Escala + melhoria contínua: incorporar PDCA e backlog de evolução (inclua XLAs).
Governança e mudança cultural
Ferramenta não muda cultura. Rituais mudam. Institua:
• Comitê de Serviços mensal (TI + negócio): prioridades, SLAs, problemas crônicos e orçamento.
• CAB para mudanças críticas.
• Comunicação simples com usuários: o que mudou, como pedir, onde acompanhar.
• Treinamento contínuo para analistas e donos de serviço.
Governança boa não engessa; dá velocidade com segurança.
Armadilhas para evitar
• Catálogo enciclopédico: ninguém lê. Comece pequeno e relevante.
• Indicadores demais: escolha os que movem comportamento.
• Automação sem critério: automatizar bagunça escala a bagunça.
• CAB para tudo: mudanças padrão precisam de via rápida.
• Foco só em SLA: complemente com XLA e CSAT por jornada.
Business case que convence
• Custos: hora dos analistas, volume de chamados por tipo, CPA humano vs. automatizado, licenças/ferramentas.
• Benefícios: redução de MTTR, de reaberturas e de backlog envelhecido; aumento de FCR e cumprimento de SLA; CSAT em alta.
• ROI: some economia direta (menos horas, menos indisponibilidade) + indireta (produtividade dos usuários). Mostre payback por onda (ex.: 4–8 meses nos quick wins é comum quando o baseline está ruim).
Board aprova quando enxerga números e marcos.
Em uma linha: o que fica
Processo manda. Caos obedece. ITSM bem implementado transforma atendimento em plataforma de valor: previsível, mensurável e amada pelo usuário — porque simplesmente funciona.