Um caso concreto: como uma empresa reduziu 67% o tempo de resolução de tickets L1 em 4 semanas com um agente de IA open source. Aqui o stack, o processo e os números reais.
O problema
Empresa de serviços financeiros, 600 colaboradores, mesa de ajuda interna com 8 agentes humanos resolvendo ~400 tickets por dia. 65% dos tickets eram perguntas repetitivas: VPN, senhas, acessos, configurações. Tempo médio de resolução: 45 minutos. Custo estimado por ticket: $150 MXN.
O stack tecnológico
- LLM: Llama 3.1 70B rodando local com Ollama (sem envio de dados para fora).
- Orquestração: LangGraph para o fluxo de raciocínio.
- Base vetorial: ChromaDB com os últimos 5 anos de documentação técnica.
- Interface: Integração com o sistema de tickets existente (não havia que aprender nada novo).
- Monitoramento: Langfuse para ver o que responde bem e onde falha.
O processo de 4 semanas
Semana 1 — Descoberta: classificamos 2.000 tickets históricos para entender quais tipos resolver primeiro.
Semana 2 — RAG e scaffolding: ingerimos a documentação, ajustamos system prompts.
Semana 3 — Integração: conectamos o agente ao sistema de tickets, evals com tickets reais.
Semana 4 — Piloto controlado: 10% do tráfego para o agente, supervisionado por agentes humanos. Ajustes diários.
Os resultados
Após 4 semanas em produção:
- Tempo de resolução: 45 min → 15 min (-67%)
- Custo por ticket: $150 → $25 (-83%)
- Disponibilidade: de 8x5 para 24/7
- Taxa de resolução autônoma: 62% dos tickets resolvidos sem humano
- Satisfação: 4,3/5 (vs 4,1/5 da equipe humana)
O que não foi tão fácil
Para ser honesto: nas primeiras duas semanas o agente respondia mal 40% das vezes. O problema não era o modelo: era a documentação inconsistente (procedimentos duplicados, versões obsoletas). Investimos tempo limpando-a — e esse trabalho valeu o dobro porque também ajudou a equipe humana.
O que aprendemos
70% do sucesso de um agente de IA não está no modelo nem no código: está na qualidade dos dados e na clareza dos processos. A IA amplifica o que você já tem, bom ou ruim.
Esse caso se aplica à sua empresa?
Se você tem uma equipe de suporte (interno ou para clientes) respondendo perguntas repetitivas com informação que já existe escrita, muito provavelmente sim. Agende uma chamada e damos uma estimativa honesta em 30 minutos.
Quer saber mais? Agende sua sessão gratuita →