Strato AI
Clínicas • WhatsApp • Multiatendimento

Multiatendimento para clínicas com IA + equipe (vários atendentes): arquitetura, filas, templates, auditoria e como evitar bagunça no WhatsApp

Publicado em 13/03/2026 • Por Strato AI
Resumo executivo: quando a clínica coloca “mais gente no WhatsApp”, o volume sobe, mas a previsibilidade cai. A saída não é “treinar melhor” apenas — é transformar a conversa em processo. Na prática isso significa: 1 conversa = 1 ticket, com estado, dono (lock), próxima ação e auditoria. A IA entra para triar, qualificar o mínimo e preparar o handoff; a equipe entra quando precisa de humano — sem o paciente repetir tudo.
Diagrama de multiatendimento para clínicas no WhatsApp: ticket, lock, filas, templates e auditoria
Imagem CC0 (criada pela Strato AI) • uso livre.
Onde nasce a bagunça: 6 falhas previsíveis
“Bagunça no WhatsApp” quase sempre é consequência de regras implícitas demais. Em clínicas com 2+ atendentes, observe se aparece algum destes sintomas:
Sem dononinguém sabe quem responde agora — e todo mundo “acha que alguém já respondeu”.
Resposta duplicadadois atendentes respondem, com tom e orientação diferentes.
Sem próxima açãoo atendimento vira “vou ver e te aviso” (lead no limbo).
Qualificação inconsistentecada pessoa coleta um conjunto diferente de dados.
Sem trilhaquando dá problema, não existe auditoria do que foi combinado e por quê.
Sem fila por objetivotudo cai no mesmo lugar (agendamento, financeiro, clínico e pós) e o SLA vira ruído.
Arquitetura mínima (que resolve 80%): roteador → ticket → lock → fila
Você não precisa “implantar um CRM gigante” para organizar multiatendimento. Precisa de um modelo mínimo e disciplina operacional. Exemplo prático de campos que valem ouro:
Ticket
id: TCK-20260313-1432
canal: WhatsApp
intenção: agendar | valores | dúvida | pós-consulta | urgência
estado: triagem → qualificação → proposta → confirmado → encerrado
fila: agendamento | financeiro | clínico | pós-consulta
dono (lock): IA | atendente X (com timestamp e expiração)

Controle
next_action: “pedir 1 dado” | “oferecer 2 horários” | “handoff” | “follow-up”
sla_até: horário limite por fila (ex.: 10 min no agendamento)

Resumo vivo (o humano precisa ler em 15s)
• objetivo do paciente, dados coletados, pendências, restrições (janela/convênio), última msg
Regra de operação: WhatsApp é interface. Ticket é a fonte da verdade. IA e humanos consultam/atualizam o mesmo estado — isso evita “versões paralelas” do atendimento.
Lock (dono) sem paranoia: como evitar dois atendentes na mesma conversa
O lock não serve para “controlar a equipe”. Serve para evitar desperdício. Um desenho simples e eficaz:
Lock por tempoquem pega o ticket vira dono por X minutos (ex.: 8). Se não interagir, expira.
Lock por açãoao enviar mensagem, renova o lock automaticamente (para não trocar no meio).
Queue fallbacklock expirado volta para a fila com prioridade (não some).
Handoff explícitotransferência só via “atribuir para” (evento), nunca “chama a fulana aí”.
O que evitar: lock eterno. Isso cria gargalo e “fila invisível”. Melhor um lock curto + expiração + reatribuição clara.
Filas por objetivo + SLA por risco (não por ego)
Em clínica, filas por objetivo funcionam melhor do que “cada atendente com sua carteira”. Exemplo de desenho:
AgendamentoSLA 5–10 min. Objetivo: oferecer 2 horários (A/B) + confirmação.
FinanceiroSLA 30 min. Valores, convênio, regras de pagamento, NF.
ClínicoSLA por triagem. Sensível/urgente vai para humano (sem improviso da IA).
Pós-consultaSLA por risco. Pergunta simples com template; risco vai para clínico.
SLA útil é: não deixar ticket sem dono e não deixar ticket sem próxima ação. O resto é ajuste fino.
Templates versionados: padrão sem “robotizar”
Template bom não é texto longo. É texto curto, com próxima ação. E precisa ser versionado (para saber o que estava valendo quando a conversa aconteceu).
TRIAGEM.v4
“Oi! Sou a assistente da clínica. Você quer agendar, saber valores ou tirar uma dúvida?”

QUALIFICAÇÃO.v6
“Perfeito. É para qual especialidade/procedimento?”
“Você prefere atendimento em unidade A ou unidade B?”
“É particular ou convênio? Se convênio, qual?”

AGENDAR.v8
“Consigo te oferecer dois horários: hoje 16:40 ou amanhã 10:20. Qual você prefere?”
Dica de governança: o ticket guarda a versão do template (ex.: AGENDAR.v8). Quando você ajusta o texto, vira v9 — e isso facilita treinamento, compliance e auditoria.
IA na prática: triagem e qualificação mínima (sem interrogatório)
A IA não deve “virar formulário”. Ela deve destravar o próximo passo com o mínimo de atrito. Um padrão simples funciona muito bem: 1 pergunta por mensagem e cada pergunta existe para tomar uma decisão.
Triagem (intenção)agendar × valores × dúvida × urgência.
Qualificação mínimaespecialidade/procedimento + convênio/particular + janela de horário.
Gatilho de handoffsensível/urgente, reclamação, negociação fora da política, dados incompletos.
Fechamento obrigatórioou agenda A/B, ou pede 1 dado faltante, ou faz handoff com resumo.
Exemplos de mensagens (copiar/colar): triagem → qualificação → A/B → handoff
Abaixo, exemplos práticos que evitam duas coisas comuns: perguntas repetidas e “limbo”. Ajuste termos (unidades, horários, convênios) ao seu contexto.
1) Triagem (intenção)
“Oi! Sou a assistente da clínica. Para te ajudar rápido: você quer agendar, valores ou tirar uma dúvida?”

2) Qualificação mínima (1 pergunta por vez)
“Perfeito. É para qual especialidade/procedimento?”
“Você prefere atendimento em unidade A ou unidade B?”
“É particular ou convênio? Se convênio, qual?”

3) Agendamento com A/B (evita indecisão)
“Consigo te oferecer dois horários: terça 10:20 ou quarta 16:40. Qual você prefere?”

4) Confirmação (sem ambiguidade)
“Fechado: quarta 16:40. Pode me confirmar nome completo e data de nascimento para concluir o agendamento?”

5) Handoff para humano (quando precisa)
“Entendi. Vou te encaminhar para um atendente para finalizar com você. Um instante.”
Por trás do handoff (no ticket), a IA deve gerar um resumo curto para o humano entrar sem retrabalho.
Handoff que funciona: resumo obrigatório + próxima ação
O handoff não é “encaminhar a conversa”. É entregar contexto + decisão pendente. Um formato simples e padronizado:
Resumo para o humano (máx. 8 linhas)
• Motivo: agendar consulta (ortopedia)
• Unidade: A (preferência do paciente)
• Pagamento: convênio (Unimed)
• Restrição: só à tarde
• Pendência: oferecer 2 horários (A/B) e confirmar dados
• Última msg do paciente: “Pode ser amanhã depois das 14h?”
Regra: se não existe “próxima ação”, o handoff vira empurra-empurra. O ticket deve sair do handoff já com next_action definida.
Auditoria simples: log de eventos (não precisa ser burocrático)
Auditoria serve para 3 coisas: (1) reduzir erro recorrente, (2) treinar equipe, (3) proteger a clínica. Em vez de “print”, use eventos estruturados. Exemplo de eventos úteis:
ticket.createdquando o lead entrou, por qual canal e intenção estimada.
lock.acquiredquem virou dono e por quanto tempo.
template.usedqual versão do template foi usada (TRIAGEM.v4 etc.).
handoff.requestedpor qual motivo (sensível, urgência, reclamação, exceção).
appointment.proposedhorários A/B oferecidos e resposta do paciente.
ticket.closeddesfecho: agendado, perdido, reengajar, etc.
Com isso você consegue responder perguntas que importam: “Onde estamos perdendo lead?”, “Qual template está ruim?”, “Qual fila estoura SLA?”
Checklist anti-caos (o básico bem-feito)
Se você aplicar estes 10 pontos, já melhora muito a operação em 1–2 semanas:
Checklist
1) 1 conversa = 1 ticket com estado
2) todo ticket tem dono (lock) e expiração
3) todo ticket tem next_action (obrigatório)
4) filas por objetivo (agendamento/financeiro/clínico/pós)
5) SLA por fila (curto onde dói mais)
6) templates curtos, versionados e com A/B
7) IA pergunta 1 coisa por vez (mínimo necessário)
8) handoff sempre com resumo + pendência clara
9) log de eventos (auditoria) para treinar e corrigir
10) regra de reengajamento (anti-limbo): se o paciente some, follow-up em 2h/24h
Como a Strato AI implementa isso (sem “projeto infinito”)
A Strato AI monta a operação de multiatendimento com foco em previsibilidade: desenho de filas e SLAs, templates versionados, regras de lock/atribuição, auditoria por eventos e IA para triagem/qualificação/handoff. A meta é simples: reduzir retrabalho, aumentar conversão e parar de perder lead no limbo.
Se você quiser, a gente também entrega um playbook (scripts + regras) e um painel simples com métricas por fila (SLA, conversão, gargalos).