Strato AI
Clínicas • WhatsApp • Operação

Multiatendimento para clínicas com IA + equipe (vários atendentes): arquitetura, filas, templates, auditoria e como evitar bagunça no WhatsApp

Publicado em 07/04/2026 • Por Strato AI
Resposta direta: multiatendimento no WhatsApp não quebra porque “tem muita mensagem”. Ele quebra porque falta um sistema operacional: (1) uma fonte da verdade (ticket/CRM), (2) filas com objetivo + SLA, (3) templates versionados e (4) auditoria. A IA entra como roteador e copiloto (triagem, qualificação mínima, resumo e handoff), não como “atendente freestyle”.
Diagrama: Multiatendimento para clínicas com IA + equipe no WhatsApp — roteador, ticket/CRM, filas com SLA, templates, lock e auditoria
Imagem CC0 (criada pela Strato AI) • uso livre.
O que causa a “bagunça” (e por que só treinar a equipe não resolve)
Os sintomas são conhecidos:
Resposta duplicadaDois atendentes respondem o mesmo lead. O paciente perde confiança, e a clínica perde tempo.
Lead no limboNinguém assume o caso. A conversa “fica ali” e morre por falta de próximo passo.
Agendamento sem contextoAgenda marcada sem procedimento/urgência → remarcação e retrabalho.
Sem rastreabilidadeNão dá para explicar “por que ofereceram isso”, “quem prometeu aquilo” ou “onde falhou”.
Diagnóstico: o WhatsApp é o canal. O problema é processo + dados + governança.
Arquitetura mínima (o que precisa existir)
Se você tem vários atendentes (e IA), use essa ordem:
  1. Entrada única (número oficial) → evita dispersão por números pessoais.
  2. Roteador (IA + regras) → entende objetivo e cria/atualiza um ticket.
  3. Ticket/CRM como fonte da verdade → status, dono, fila, SLA, tags, histórico.
  4. Fila por objetivo (triagem / agendamento / pós / financeiro / reclamações).
  5. Lock de dono (1 responsável por vez) → reduz resposta duplicada.
  6. Auditoria por eventos → o que foi feito, por quem, quando e por quê.
Regra prática: se uma decisão impacta o paciente (ex.: “agendei”, “tem valor X”, “vamos devolver”), ela precisa virar evento no ticket.
Filas que funcionam: 5 filas, 5 SLAs (e 1 definição de pronto)
Evite filas “genéricas”. Filas boas têm objetivo, SLA e definição de pronto.
1) Triagem / 1ª resposta (SLA 2–5 min)Pronto quando: paciente recebeu acolhimento + 1 pergunta objetiva (procedimento/objetivo).
2) Qualificação mínima (SLA 10–20 min)Pronto quando: procedimento + timing + particular/convênio (se necessário) estão definidos.
3) Agendamento (SLA 10–30 min)Pronto quando: horário fechado + nome + confirmação + política simples de cancelamento.
4) Financeiro (SLA 30–60 min)Pronto quando: condição explicada com clareza e registrada (sem promessa fora de regra).
5) Exceções / Reclamações (SLA 30–60 min)Pronto quando: humano assumiu + registrou causa + resolveu ou escalou.
Dica: o paciente não precisa ver suas filas — mas sua operação precisa.
Templates: o que padronizar (e como evitar “cada um escreve de um jeito”)
Você não precisa de 200 mensagens. Precisa de 12–20 templates bem feitos, com dono e versão.
Templates essenciais1ª resposta • triagem • qualificação • oferta A/B de horário • confirmação • reengajamento • handoff • pós-consulta • no-show.
VersionamentoGuarde: nome, texto, data, motivo da mudança. Template muda = muda a operação.
Campos (placeholders){nome}, {procedimento}, {unidade}, {data}, {hora1}, {hora2}, {atendente}, {linkAgenda}.
Regras de escritaUma pergunta por mensagem • sem parágrafo longo • sem áudio como padrão • sem termos clínicos quando não precisa.
Exemplos práticos (copiar/colar): triagem → qualificação → handoff
Abaixo estão exemplos curtos (o objetivo é manter o funil andando).
1) Triagem (1 pergunta)
IA (ou atendente):
Oi, {nome}! 👋 Sou a assistente da {clinica}.
Pra eu te encaminhar certinho: você quer atendimento de qual especialidade/procedimento?
2) Qualificação mínima (timing + particular/convênio)
Perfeito. Você quer fazer isso para quando (hoje/essa semana/mais pra frente)?
E só pra eu te passar as opções certas: é particular ou convênio?
3) Oferta A/B de horário (evita “qual horário?”)
Consigo te atender com {profissional}:
1) {data1} às {hora1}
2) {data1} às {hora2}
Qual dessas duas opções é melhor?
4) Confirmação (fecha o ciclo)
Fechado ✅ Vou confirmar aqui:
• Nome: {nomeCompleto}
• Procedimento: {procedimento}
• Data/horário: {dataHora}

Se precisar remarcar, me avise por aqui, tudo bem?
5) Handoff para humano (com resumo e pendências)
Quando cair em exceção (desconto, reclamação, caso complexo), a IA não “debate”. Ela encaminha com resumo.
Vou te colocar com uma pessoa do nosso time pra te ajudar melhor ✅

Resumo do seu pedido:
• Objetivo: {objetivo}
• Procedimento/especialidade: {procedimento}
• Timing: {timing}
• Particular/convênio: {pagamento}
• Observações: {observacoes}

Só um instante 🙂
Para o atendente (interno): ticket deve receber um evento “handoff” com contexto + próximo passo sugerido.
Lock de dono: como parar resposta duplicada sem burocracia
Um lock simples resolve 80% do caos:
  • Quando alguém responde, o ticket vira “Em atendimento” e ganha um dono por X minutos.
  • Se o paciente responde, o lock renova (ex.: +10 min).
  • Se o dono não responde dentro do SLA, o ticket volta para a fila.
Por que isso importa: sem lock, você escala volume “contratando” duplicação.
Auditoria: o que registrar (para operar e melhorar)
Auditoria não é só compliance. É gestão.
Eventos mínimosPrimeira resposta • mudança de fila • mudança de dono • tentativa de agendamento • agendamento confirmado • handoff • reabertura • perda (motivo).
Métricas úteisT1ª resposta • tempo até agendar • taxa de handoff • no-show • perdas por “sem resposta” • reaberturas.
QualidadeChecklist por amostra: tom, clareza, 1 pergunta por vez, próximo passo definido.
RegrasDesconto/reclamação/convênio raro → sempre humano + registro do motivo.
Checklist de implementação (1 semana, sem reescrever sua clínica)
  1. Mapeie suas filas (5 a 7 no máximo) + SLA + definição de pronto.
  2. Padronize 12–20 templates e defina dono + versão.
  3. Crie regras de handoff (exceções) e um formato de resumo.
  4. Implemente lock de dono e requeue por SLA.
  5. Ative auditoria por eventos e acompanhe 4 métricas: T1ª resposta, tempo até agendar, taxa de no-show, perdas por limbo.
Onde a Strato AI entra (sem prometer milagre)
A Strato AI implementa a operação de multiatendimento com IA como sistema: integra WhatsApp oficial, cria roteamento/filas, define templates e handoff, instrumenta auditoria e conecta com seu CRM/agenda. Na prática: menos retrabalho, menos lead perdido e mais previsibilidade.
© Strato AI • Blog