WhatsApp não é só texto — clientes mandam áudio, foto, vídeo, PDF. A Kontato lida com tudo, e o bot entende áudios automaticamente.
Áudios do cliente
Quando o cliente envia um áudio no WhatsApp, a Kontato:
- Recebe o arquivo via WhatsApp
- Transcreve com Whisper (OpenAI) em português
- Mostra player no balão pra você ouvir
- Manda o texto pro bot — IA responde como se fosse texto
Isso significa que o bot funciona 100% em conversas por áudio, sem o cliente precisar digitar nada.
Etiqueta 'áudio transcrito'
No card de mensagem aparece um marcador discreto "áudio transcrito" com ícone Play. Isso indica que o que o bot leu foi a transcrição, não o texto literal.
Áudio do dono / bot
Você (dono) também pode mandar áudio direto pelo input da Kontato:
- Click no ícone de microfone no input da conversa
- Fala o que quer enviar
- Click pra parar
- Whisper transcreve, mostra preview, você revisa
- Envia como mensagem de texto pro cliente
Útil pra responder rápido enquanto está dirigindo, cozinhando, etc.
Limites de upload
| Tipo | Tamanho máx | Formatos aceitos |
|---|---|---|
| Imagem | 10 MB | JPG, PNG, WebP, GIF |
| Áudio | 5 MB | MP3, OGG, WebM, MP4, WAV |
| Documento | 20 MB | PDF, Word (.doc/.docx), Excel (.xls/.xlsx), TXT |
Validação roda no front-end antes do upload — se passar do limite, mostra erro claro: "Esse arquivo tem 12.3 MB. O limite para imagem (JPG, PNG, WebP, GIF) é 10 MB. Tente comprimir."
Vídeo não é armazenado
A Kontato não armazena vídeos recebidos por WhatsApp. Cliente que manda vídeo aparece na conversa apenas com o aviso "[vídeo recebido — não armazenado]". Motivo: vídeo ocupa muito espaço e raramente é necessário pro atendimento. Se precisar de conteúdo visual do cliente, peça foto.
Como anexar mídia
No input da conversa, ao lado esquerdo, tem 3 botões:
- Câmera — abre câmera traseira do celular (
capture="environment"), tira foto e manda - Galeria — picker de galeria, aceita imagem
- Documento — picker de arquivo, aceita PDF, Word, Excel, TXT
Cada um passa por validarArquivo() e mostra preview antes de enviar.
O que o cliente recebe
Mídia que você manda da Kontato vai pro WhatsApp do cliente como mídia nativa do WhatsApp — não link. O cliente vê a foto, ouve o áudio, baixa o PDF como faria com qualquer mensagem normal.
O que aparece na timeline
Cada tipo tem visual próprio:
- Imagem — thumbnail clicável (abre fullsize)
- Áudio — player
<audio>HTML5 com controles play/pause/scrubbing - Vídeo recebido — placeholder
[vídeo recebido — não armazenado](vídeos não são salvos) - Documento — card com ícone, nome do arquivo, botão de download
Quando bot não entende mídia
O bot só entende áudio (via Whisper). Para imagem e documento, o bot vê só [imagem] e [documento] no histórico.
Se o cliente manda foto do comprovante de Pix, por exemplo, o bot não lê — você precisa intervir manualmente. Por isso conversas com mídias são candidatas naturais a serem assumidas pelo dono.