A análise de sentimento real-time captura o áudio do cliente em chunks de 15 segundos, classifica via IA em 5 categorias emocionais e mostra só pra você (dono) durante a chamada. Cliente nunca vê. Após a chamada, a timeline persiste e fica sincronizada com o vídeo no replay.
⚠️ Privacidade total do cliente (RN-V02): ele não vê toast, não vê sidebar, não tem ideia que você tem essa visão. Use com responsabilidade — esse é o tipo de feature que gera confiança quando bem usada e desconfiança quando mal usada.
As 5 categorias
| Categoria | Quando classifica assim | Indicador visual |
|---|---|---|
| 🟢 Positivo | Cliente fala animado, tom alegre, palavras de satisfação | Verde |
| 🔵 Animado | Energia alta, entusiasmo, fala rápida | Azul |
| ⚪ Neutro | Conversa normal, sem tom emocional marcado | Cinza |
| 🟡 Preocupado | Hesitação, voz baixa, dúvida, ansiedade | Amarelo |
| 🔴 Negativo | Frustração, raiva, desânimo, queixas | Vermelho |
A classificação é probabilística — IA escolhe a categoria mais provável a cada chunk, não há certeza absoluta.
Como ligar
Em Configurações → Vídeo atendimento (/configuracoes/video), toggle "Análise de sentimento ao vivo" = ON.
A partir do momento em que a chamada começa:
- Cliente envia áudio em chunks de 15 segundos (silenciosamente, sem feedback visual pra ele)
- Servidor envia chunk pro OpenAI Whisper (transcreve trecho)
- Trecho transcrito é enviado pro OpenRouter (modelo de classificação)
- Classificação chega de volta em ~2-5 segundos
- Você vê toast + sidebar atualizados
O que você (dono) vê
Toast efêmero (no canto superior direito)
Quando o sentimento muda de categoria, aparece toast com:
- Ícone colorido da nova categoria
- Texto: "Cliente parece preocupado" / "Cliente está animado" / etc
- Some em ~5 segundos
- Não interrompe nada — só sinal sutil
Sidebar lateral (lado direito da sala — só dono)
Aparece automaticamente quando sentimento real-time está ativo:
- Lista cronológica dos últimos chunks (ícone colorido + minuto:segundo + categoria)
- Atualiza em tempo real
- Pode rolar pra ver histórico do começo
Cliente não vê NADA
Privacidade total:
- ❌ Sem toast do lado dele
- ❌ Sem sidebar dele
- ❌ Sem indicador de qualquer tipo
- ❌ Sem áudio diferente (captura é silenciosa, mesmo stream do mic já enviado pro Daily)
- ❌ Sem aviso "esta chamada está sendo analisada"
O termo de consentimento da FASE 2.5 cobre gravação e transcrição. Se você liga sentimento, recomendo incluir menção no termo (ex: "...análise automatizada pra fins de qualidade do atendimento"). Não é obrigatório legalmente mas é boa prática.
Persistência e replay
A timeline de sentimento é persistida em video_sentimento_eventos. Sobrevive mesmo após a gravação MP4 expirar (30d).
No PlayerModal (botão Assistir):
- Barra horizontal abaixo do vídeo com cores por minuto (positivo verde, neutro cinza, etc)
- Hover em qualquer ponto mostra "minuto X: cliente preocupado"
- Click num ponto pula o vídeo pra esse momento
- Sync com transcrição: ler trecho da fala + ver tom dela ao mesmo tempo
Custo
Sentimento consome créditos OpenAI/OpenRouter — cobrança incluída no preço do add-on de vídeo (R$ 0,30/min) sem extra. Por chamada de 30min:
- 120 chunks (8 chunks × 15s × 30 min, mas filtrados — só envia quando há áudio detectável)
- Custo aproximado: ~R$ 0,30 por chamada de 30min
- Já incluso nos R$ 9,00 do add-on
Se você ativa sentimento mas as chamadas tiverem muito silêncio ou uma fala só sua, custo cai (sistema só processa chunks com áudio do cliente acima de threshold).
Pra economizar, desligue sentimento e mantenha só gravação + transcrição — você ainda tem a transcrição pós-call pra revisar.
Casos de uso reais
🧠 Psicologia / terapia
O melhor caso. Cliente fala sobre tema sensível, terapeuta percebe pelo toast que algo despertou ansiedade ("preocupado") e ajusta abordagem em tempo real. Replay mostra exatamente o trecho onde mudou — material pra supervisão clínica.
⚖️ Advocacia
Cliente conta caso. Quando aparece toast "preocupado" perto de tópico específico, advogado nota ponto sensível. Útil pra preparar argumentos.
💼 Atendimento ao cliente / suporte
Detectar escalada emocional antes do cliente explodir. Toast "negativo" sustentado por 2-3 chunks = sinal pra desviar pra resolução proativa.
📊 Pesquisa de UX (entrevistas qualitativas)
Após a entrevista, replay mostra exatamente em quais momentos o usuário ficou preocupado/animado. Mais rico que só assistir o vídeo.
🎨 Vendas consultivas
CUIDADO ÉTICO: detectar quando cliente está "animado" e fechar venda nessa janela é manipulação. Não recomendado.
Limites éticos
A feature foi desenhada pra ajudar o dono a atender melhor, não pra:
- ❌ Forçar venda agressiva quando cliente está "animado" (manipulação)
- ❌ Pressionar cliente "preocupado" pra fechar contrato sob estresse
- ❌ Usar como prova legal contra o cliente (classificação é probabilística, não factual)
- ❌ Compartilhar timeline com terceiros sem autorização
Boa prática: usar pra calibrar a sua própria entrega (você falou rápido demais? cliente parece confuso?). Não pra "ler a mente" do cliente.
Edge cases
Silêncio prolongado
Se cliente fica calado, sistema não envia chunk (não há áudio pra classificar). Sidebar para de atualizar. Toast não aparece. Volta normal quando ele falar de novo.
Áudio ruim do cliente
Mic com chiado, banda ruim, eco — chunk pode ser classificado errado (Whisper falha em transcrever, OpenRouter recebe texto pobre). Confie no sentimento mais quando áudio está nítido.
Múltiplos clientes
Sistema captura áudio de todos os participantes não-locais. Se há 2 clientes na chamada, classifica os 2 misturados. Em chamadas com acompanhante (médico + paciente + filho), pode confundir.
Detecção de sarcasmo / ironia
IA não capta sarcasmo bem. Cliente falar "ah que ÓTIMO" com tom irônico pode virar "positivo" no toast.
Latência
Toast aparece 2-5 segundos depois do cliente falar (tempo de captura + Whisper + classificação). Não é literalmente "real-time", é "quase-tempo-real".
Ligar/desligar mid-call
Hoje, a flag de sentimento é global por sessão — se você ligou na config antes da chamada, ela está ativa. Não há toggle pra ligar/desligar durante a chamada.
Roadmap futuro pode incluir esse toggle, especialmente pra cenários onde o terapeuta quer monitorar só uma parte específica.
Próximos artigos
- Transcrição e resumo IA — texto pós-call
- Gravação — base do replay
- Pesquisa de qualidade — feedback do cliente pós-call