Pular para o conteúdo

Áudios e mídias

Como a Kontato lida com áudios (Whisper transcreve automaticamente) e mídias (imagens, documentos). Limites: imagem 10MB, áudio 5MB, documento 20MB. Vídeo recebido não é armazenado.

4 minAtualizado em 13/05/2026

WhatsApp não é só texto — clientes mandam áudio, foto, vídeo, PDF. A Kontato lida com tudo, e o bot entende áudios automaticamente.

Áudios do cliente

Quando o cliente envia um áudio no WhatsApp, a Kontato:

  1. Recebe o arquivo via WhatsApp
  2. Transcreve com Whisper (OpenAI) em português
  3. Mostra player no balão pra você ouvir
  4. Manda o texto pro bot — IA responde como se fosse texto

Isso significa que o bot funciona 100% em conversas por áudio, sem o cliente precisar digitar nada.

Etiqueta 'áudio transcrito'

No card de mensagem aparece um marcador discreto "áudio transcrito" com ícone Play. Isso indica que o que o bot leu foi a transcrição, não o texto literal.

Áudio do dono / bot

Você (dono) também pode mandar áudio direto pelo input da Kontato:

  1. Click no ícone de microfone no input da conversa
  2. Fala o que quer enviar
  3. Click pra parar
  4. Whisper transcreve, mostra preview, você revisa
  5. Envia como mensagem de texto pro cliente

Útil pra responder rápido enquanto está dirigindo, cozinhando, etc.

Limites de upload

TipoTamanho máxFormatos aceitos
Imagem10 MBJPG, PNG, WebP, GIF
Áudio5 MBMP3, OGG, WebM, MP4, WAV
Documento20 MBPDF, Word (.doc/.docx), Excel (.xls/.xlsx), TXT

Validação roda no front-end antes do upload — se passar do limite, mostra erro claro: "Esse arquivo tem 12.3 MB. O limite para imagem (JPG, PNG, WebP, GIF) é 10 MB. Tente comprimir."

Vídeo não é armazenado

A Kontato não armazena vídeos recebidos por WhatsApp. Cliente que manda vídeo aparece na conversa apenas com o aviso "[vídeo recebido — não armazenado]". Motivo: vídeo ocupa muito espaço e raramente é necessário pro atendimento. Se precisar de conteúdo visual do cliente, peça foto.

Como anexar mídia

No input da conversa, ao lado esquerdo, tem 3 botões:

  • Câmera — abre câmera traseira do celular (capture="environment"), tira foto e manda
  • Galeria — picker de galeria, aceita imagem
  • Documento — picker de arquivo, aceita PDF, Word, Excel, TXT

Cada um passa por validarArquivo() e mostra preview antes de enviar.

O que o cliente recebe

Mídia que você manda da Kontato vai pro WhatsApp do cliente como mídia nativa do WhatsApp — não link. O cliente vê a foto, ouve o áudio, baixa o PDF como faria com qualquer mensagem normal.

O que aparece na timeline

Cada tipo tem visual próprio:

  • Imagem — thumbnail clicável (abre fullsize)
  • Áudio — player <audio> HTML5 com controles play/pause/scrubbing
  • Vídeo recebido — placeholder [vídeo recebido — não armazenado] (vídeos não são salvos)
  • Documento — card com ícone, nome do arquivo, botão de download

Quando bot não entende mídia

O bot só entende áudio (via Whisper). Para imagem e documento, o bot vê só [imagem] e [documento] no histórico.

Se o cliente manda foto do comprovante de Pix, por exemplo, o bot não lê — você precisa intervir manualmente. Por isso conversas com mídias são candidatas naturais a serem assumidas pelo dono.

Próximo passo

Respostas fixas →

Esse artigo foi útil?

Ainda não usa a Kontato?

Trial grátis · sem cartão de crédito · cancele quando quiser.

Criar conta grátis