Pular para o conteúdo

Sentimento real-time

Análise contínua do tom de voz do cliente durante a chamada — visível só pra você. Útil pra captar nuances emocionais que o vídeo não mostra. Cliente não vê nada. Persiste pra replay sincronizado depois.

5 minAtualizado em 06/05/2026

A análise de sentimento real-time captura o áudio do cliente em chunks de 15 segundos, classifica via IA em 5 categorias emocionais e mostra só pra você (dono) durante a chamada. Cliente nunca vê. Após a chamada, a timeline persiste e fica sincronizada com o vídeo no replay.

⚠️ Privacidade total do cliente (RN-V02): ele não vê toast, não vê sidebar, não tem ideia que você tem essa visão. Use com responsabilidade — esse é o tipo de feature que gera confiança quando bem usada e desconfiança quando mal usada.

As 5 categorias

CategoriaQuando classifica assimIndicador visual
🟢 PositivoCliente fala animado, tom alegre, palavras de satisfaçãoVerde
🔵 AnimadoEnergia alta, entusiasmo, fala rápidaAzul
NeutroConversa normal, sem tom emocional marcadoCinza
🟡 PreocupadoHesitação, voz baixa, dúvida, ansiedadeAmarelo
🔴 NegativoFrustração, raiva, desânimo, queixasVermelho

A classificação é probabilística — IA escolhe a categoria mais provável a cada chunk, não há certeza absoluta.

Como ligar

Em Configurações → Vídeo atendimento (/configuracoes/video), toggle "Análise de sentimento ao vivo" = ON.

A partir do momento em que a chamada começa:

  • Cliente envia áudio em chunks de 15 segundos (silenciosamente, sem feedback visual pra ele)
  • Servidor envia chunk pro OpenAI Whisper (transcreve trecho)
  • Trecho transcrito é enviado pro OpenRouter (modelo de classificação)
  • Classificação chega de volta em ~2-5 segundos
  • Você vê toast + sidebar atualizados

O que você (dono) vê

Toast efêmero (no canto superior direito)

Quando o sentimento muda de categoria, aparece toast com:

  • Ícone colorido da nova categoria
  • Texto: "Cliente parece preocupado" / "Cliente está animado" / etc
  • Some em ~5 segundos
  • Não interrompe nada — só sinal sutil

Aparece automaticamente quando sentimento real-time está ativo:

  • Lista cronológica dos últimos chunks (ícone colorido + minuto:segundo + categoria)
  • Atualiza em tempo real
  • Pode rolar pra ver histórico do começo

Cliente não vê NADA

Privacidade total:

  • Sem toast do lado dele
  • Sem sidebar dele
  • Sem indicador de qualquer tipo
  • Sem áudio diferente (captura é silenciosa, mesmo stream do mic já enviado pro Daily)
  • Sem aviso "esta chamada está sendo analisada"

O termo de consentimento da FASE 2.5 cobre gravação e transcrição. Se você liga sentimento, recomendo incluir menção no termo (ex: "...análise automatizada pra fins de qualidade do atendimento"). Não é obrigatório legalmente mas é boa prática.

Persistência e replay

A timeline de sentimento é persistida em video_sentimento_eventos. Sobrevive mesmo após a gravação MP4 expirar (30d).

No PlayerModal (botão Assistir):

  • Barra horizontal abaixo do vídeo com cores por minuto (positivo verde, neutro cinza, etc)
  • Hover em qualquer ponto mostra "minuto X: cliente preocupado"
  • Click num ponto pula o vídeo pra esse momento
  • Sync com transcrição: ler trecho da fala + ver tom dela ao mesmo tempo

Custo

Sentimento consome créditos OpenAI/OpenRouter — cobrança incluída no preço do add-on de vídeo (R$ 0,30/min) sem extra. Por chamada de 30min:

  • 120 chunks (8 chunks × 15s × 30 min, mas filtrados — só envia quando há áudio detectável)
  • Custo aproximado: ~R$ 0,30 por chamada de 30min
  • Já incluso nos R$ 9,00 do add-on

Se você ativa sentimento mas as chamadas tiverem muito silêncio ou uma fala só sua, custo cai (sistema só processa chunks com áudio do cliente acima de threshold).

Pra economizar, desligue sentimento e mantenha só gravação + transcrição — você ainda tem a transcrição pós-call pra revisar.

Casos de uso reais

🧠 Psicologia / terapia

O melhor caso. Cliente fala sobre tema sensível, terapeuta percebe pelo toast que algo despertou ansiedade ("preocupado") e ajusta abordagem em tempo real. Replay mostra exatamente o trecho onde mudou — material pra supervisão clínica.

⚖️ Advocacia

Cliente conta caso. Quando aparece toast "preocupado" perto de tópico específico, advogado nota ponto sensível. Útil pra preparar argumentos.

💼 Atendimento ao cliente / suporte

Detectar escalada emocional antes do cliente explodir. Toast "negativo" sustentado por 2-3 chunks = sinal pra desviar pra resolução proativa.

📊 Pesquisa de UX (entrevistas qualitativas)

Após a entrevista, replay mostra exatamente em quais momentos o usuário ficou preocupado/animado. Mais rico que só assistir o vídeo.

🎨 Vendas consultivas

CUIDADO ÉTICO: detectar quando cliente está "animado" e fechar venda nessa janela é manipulação. Não recomendado.

Limites éticos

A feature foi desenhada pra ajudar o dono a atender melhor, não pra:

  • ❌ Forçar venda agressiva quando cliente está "animado" (manipulação)
  • ❌ Pressionar cliente "preocupado" pra fechar contrato sob estresse
  • ❌ Usar como prova legal contra o cliente (classificação é probabilística, não factual)
  • ❌ Compartilhar timeline com terceiros sem autorização

Boa prática: usar pra calibrar a sua própria entrega (você falou rápido demais? cliente parece confuso?). Não pra "ler a mente" do cliente.

Edge cases

Silêncio prolongado

Se cliente fica calado, sistema não envia chunk (não há áudio pra classificar). Sidebar para de atualizar. Toast não aparece. Volta normal quando ele falar de novo.

Áudio ruim do cliente

Mic com chiado, banda ruim, eco — chunk pode ser classificado errado (Whisper falha em transcrever, OpenRouter recebe texto pobre). Confie no sentimento mais quando áudio está nítido.

Múltiplos clientes

Sistema captura áudio de todos os participantes não-locais. Se há 2 clientes na chamada, classifica os 2 misturados. Em chamadas com acompanhante (médico + paciente + filho), pode confundir.

Detecção de sarcasmo / ironia

IA não capta sarcasmo bem. Cliente falar "ah que ÓTIMO" com tom irônico pode virar "positivo" no toast.

Latência

Toast aparece 2-5 segundos depois do cliente falar (tempo de captura + Whisper + classificação). Não é literalmente "real-time", é "quase-tempo-real".

Ligar/desligar mid-call

Hoje, a flag de sentimento é global por sessão — se você ligou na config antes da chamada, ela está ativa. Não há toggle pra ligar/desligar durante a chamada.

Roadmap futuro pode incluir esse toggle, especialmente pra cenários onde o terapeuta quer monitorar só uma parte específica.

Próximos artigos

Esse artigo foi útil?

Ainda não usa a Kontato?

Trial grátis · sem cartão de crédito · cancele quando quiser.

Criar conta grátis