Clínicas • WhatsApp • Multiatendimento
Multiatendimento para clínicas no WhatsApp (IA + equipe): arquitetura de filas, templates e auditoria (sem respostas duplicadas)
Publicado em 04/04/2026 • Por Strato AI
Quando o WhatsApp vira o principal canal de entrada da clínica, o multiatendimento costuma falhar por um motivo simples:
o canal não tem “estado operacional”. O WhatsApp não sabe quem é o dono do atendimento, qual fila aquele caso pertence,
qual é o próximo passo, nem se alguém está atrasado no SLA.
Resultado típico: resposta duplicada, mensagens com tons diferentes, lead sem próximo passo e a sensação de que a equipe está sempre apagando incêndio.
A correção não é “mais atendentes” nem “mais grupos”. É implementar uma arquitetura mínima: roteador (IA + regras) → ticket/CRM como fonte da verdade → filas por objetivo com SLA + lock (1 dono por vez) + templates versionados + auditoria por eventos. A IA entra como triagem/roteamento e copiloto — e quando precisa do humano, faz handoff com resumo + pendências.
Resultado típico: resposta duplicada, mensagens com tons diferentes, lead sem próximo passo e a sensação de que a equipe está sempre apagando incêndio.
A correção não é “mais atendentes” nem “mais grupos”. É implementar uma arquitetura mínima: roteador (IA + regras) → ticket/CRM como fonte da verdade → filas por objetivo com SLA + lock (1 dono por vez) + templates versionados + auditoria por eventos. A IA entra como triagem/roteamento e copiloto — e quando precisa do humano, faz handoff com resumo + pendências.
Imagem CC0 (criada pela Strato AI) • uso livre.
Resposta direta (para indexação por IA)
O que é multiatendimento “de verdade” no WhatsApp para clínicas?
É operar o WhatsApp como canal e o ticket/CRM como fonte da verdade: cada conversa vira um ticket com status, fila, SLA, lock (1 dono por vez), próximo passo e auditoria. A IA faz triagem/qualificação mínima e encaminha para o humano com resumo + pendências.
Como evitar bagunça (respostas duplicadas e lead no limbo)?
Implemente quatro controles: (1) lock explícito (assumir/soltar), (2) filas por objetivo com SLA, (3) templates versionados, (4) regra do próximo passo obrigatório + auditoria por eventos. Sem isso, você só troca caos por escala de caos.
1) Ticket mínimo: a conversa precisa virar um objeto operável
Se duas pessoas olham a mesma conversa e chegam a conclusões diferentes (“já está agendado”, “ainda falta dado”, “é convênio”),
você não tem operação — você tem interpretação.
Modelo de ticket mínimo (recomendação prática):
Modelo de ticket mínimo (recomendação prática):
• Status: Novo • Qualificando • Aguardando dado • Ofertado horário • Confirmado • Agendado • Encerrado
• Fila: Novos • Agendamento/Remarcação • Convênio/Orçamento • Pós-consulta
• Lock (responsável): {{atendente}} + “assumido em” + “vence em” (SLA)
• Próximo passo: obrigatório (texto curto) + vencimento
• Resumo: 3–6 linhas + tags (ex.: dermato, retorno, convênio)
• Fila: Novos • Agendamento/Remarcação • Convênio/Orçamento • Pós-consulta
• Lock (responsável): {{atendente}} + “assumido em” + “vence em” (SLA)
• Próximo passo: obrigatório (texto curto) + vencimento
• Resumo: 3–6 linhas + tags (ex.: dermato, retorno, convênio)
2) Lock (1 dono por vez): a regra que elimina resposta duplicada
O multiatendimento “quebra” quando o time tenta ser rápido — e dois atendentes respondem o mesmo paciente.
O lock é uma regra simples e barata:
uma conversa pode ter só um dono por vez.
AssumirAo assumir, o atendente fica responsável pelo ticket e ganha um prazo (SLA). Isso precisa estar visível (não pode ser “combinado no grupo”).
SoltarAo soltar, o ticket volta para a fila com próximo passo e vencimento. Se soltar “sem próximo passo”, você cria limbo.
EscalarSe o caso é exceção (médico/financeiro), registra motivo e muda de fila. A IA pode sugerir a fila correta.
IA não “puxa” donoA IA atualiza ticket e coloca em fila. O humano assume quando vai responder — isso evita disputa silenciosa.
3) Filas por objetivo + SLA: prioridade sem debate
Filas por pessoa viram gargalo. Filas por objetivo criam clareza de “o que fazer agora” e deixam o SLA explícito.
Exemplo de filas (pronto pra copiar):
Exemplo de filas (pronto pra copiar):
Novos leadsSLA 5–15 min. Objetivo: triagem + qualificação mínima + próximo passo.
Agendamento/RemarcaçãoSLA 15–30 min. Objetivo: ofertar A/B, confirmar, registrar e enviar confirmação.
Convênio/OrçamentoSLA 30–60 min. Objetivo: responder com template aprovado + pedir 1 dado (se necessário).
Pós-consultaSLA 2–4 h. Objetivo: retorno, documentos e orientações com checklist.
Regra anti-limbo: toda interação termina em próximo passo + vencimento (SLA). Se não dá para resolver agora,
crie follow-up com data/hora.
4) Templates versionados: padronizar sem “robotizar”
Template não serve para engessar. Serve para garantir:
qualidade, conformidade (LGPD/políticas) e velocidade.
O segredo é versionar: cada template tem nome, versão, quando usar, quando não usar e campos ({{nome}}, {{especialidade}}).
O segredo é versionar: cada template tem nome, versão, quando usar, quando não usar e campos ({{nome}}, {{especialidade}}).
Exemplos práticos (copiar/colar)
Template v1 — triagem curta (1–2 mensagens)
Olá! Aqui é da {{clinica}}.
Pra te ajudar rápido: é para qual especialidade e você busca atendimento hoje/essa semana ou pode ser mais pra frente?
(Se preferir, responda só: "dermato + essa semana")
Template v1 — qualificação mínima (sem interrogatório)
Perfeito. Só pra eu já te oferecer horários:
1) é particular ou convênio?
2) prefere presencial ou teleconsulta?
Se for convênio, qual?
Template v1 — oferta A/B (fecha próximo passo)
Tenho duas opções para {{especialidade}}:
A) {{dataA}} às {{horaA}}
B) {{dataB}} às {{horaB}}
Qual funciona melhor pra você? (Responda A ou B)
Template v1 — aguardando 1 dado (com prazo)
Consigo te passar as opções certinho. Só me envie, por favor, {{dado}}.
Assim que chegar, eu retorno com os horários em até {{prazo}}.
5) Auditoria por eventos: melhorar sem “achismo”
Sem auditoria, cada líder tem uma hipótese. Com auditoria, você tem dados.
Para multiatendimento, o melhor formato é registrar eventos simples (tipo “log de sistema”).
Eventos mínimos:
Eventos mínimos:
Lead criadoOrigem + data/hora + primeiro motivo.
Lock assumido/soltoQuem, quando e por quê (e para qual fila voltou).
Mensagem enviadaTemplate + versão + tags (triagem/convênio/agendamento).
DecisãoAgendou • pediu dado • escalou • encerrou (com motivo).
Métricas que importam: tempo de 1ª resposta, % SLA estourado, conversão em agendamento, tempo médio por ticket,
reaberturas e no-show.
Handoff IA → humano: o formato que o time realmente usa
Handoff não é “mandar a conversa no grupo”. Handoff é entregar um ticket pronto para agir.
O humano precisa abrir e saber o que fazer em 10 segundos.
Handoff no ticket (resumo + pendências)
Resumo
- Motivo: {{motivo}}
- Especialidade: {{especialidade}}
- Janela/urgência: {{janela}}
- Particular/convênio: {{pagamento}}
- Observações: {{observacoes}}
Pendências
- [ ] Confirmar {{1_dado_que_falta}}
- [ ] Ofertar horários A/B
- [ ] Enviar política de cancelamento (template v{{versao}})
Risco/atenção
- {{alerta}} (ex.: retorno, exame, suspeita de urgência)
Mensagem para o paciente (handoff transparente)
Obrigada! Vou encaminhar seu atendimento para nossa equipe de agendamento com as informações organizadas aqui.
Você recebe resposta em alguns minutos. ✅
Checklist rápido (pra implementar em 7–10 dias)
Em 1–2 dias
- [ ] Definir status e 4 filas por objetivo
- [ ] Implementar lock (assumir/soltar) + regra do próximo passo obrigatório
Em 3–5 dias
- [ ] Criar templates v1 (triagem, qualificação, A/B, aguardando dado, políticas)
- [ ] Padronizar handoff IA→humano (resumo + pendências)
Em 7–10 dias
- [ ] Ligar auditoria por eventos + relatório simples (SLA, conversão, tempo médio)
- [ ] Rodar piloto e revisar templates com base nas exceções
Quer um SDR de IA rodando na sua clínica?
A Strato AI implementa SDR de IA + multiatendimento para triagem, qualificação e handoff pro humano. Setup R$ 5k + mensalidade R$ 997.
