mic Documentación · 10

Mensajes de voz

Habla en lugar de teclear. Aprieta el botón del micrófono, di lo que necesitas y suéltalo. Nalo transcribe y lo procesa como si lo hubieras escrito.

Habla en lugar de teclear. Aprieta el botón del micrófono, di lo que necesitas y suéltalo. Nalo transcribe y lo procesa como si lo hubieras escrito.


Cómo funciona

  1. En WhatsApp/SMS: mantén el botón del micrófono, habla, suéltalo. Igual que mandar una nota de voz a cualquiera.
  2. En Nalito web: icono de micrófono en el input del chat, toca para empezar, toca otra vez para parar.

Nalo transcribe el audio con OpenAI Whisper, luego pasa el texto transcrito por el pipeline normal del chat. Todo lo que funciona por texto funciona por voz.


Cuando la voz le gana al teclado

En la bomba de gasolina

“Ochenta y cinco dólares de gasolina en Chevron”Gasto de combustible registrado

Tienes las manos ocupadas. La bomba todavía está corriendo. La voz es la única opción sensata.

Caminando entre obras

“Cotización para el Sr. Patel, cambio de triturador de basura, $320 más instalación $80, su dirección es 4415 Pine Ridge Drive”

30 segundos de nota de voz → cotización generada + PDF listo + datos del cliente guardados, todo antes de que llegues a la siguiente casa.

Fin del día en la troca

“Registra gasto 400 en Home Depot, 85 de gasolina, y 12 de comida, la Sra. Lewis pagó en efectivo, y agenda al Sr. Chen para mañana a las 9”

5 cosas en una nota de voz. Nalo las separa y las ejecuta una por una.


Flujos soportados

Todas las capacidades de Nalo funcionan por voz:

  • Crear cotización
  • Crear factura
  • Agendar cita
  • Registrar gasto
  • Marcar como pagado
  • Planear ruta
  • Renombrar cuadrilla
  • Agregar empleado
  • Editar cliente
  • Enviar al cliente
  • Actualizar perfil del negocio
  • Obtener reportes / hacer preguntas

Tips para mejor precisión

Whisper es muy bueno, pero estos son los patrones que fallan:

Fallas comunes

  • Ruido de fondo en obras — taladro, tráfico, viento. Acerca más el teléfono.
  • Habla muy rápida — baja un poco el ritmo. Whisper prefiere un paso natural.
  • Nombres vs. palabras parecidas — “Mrs Lewis” a veces se vuelve “Mrs Louis”. Corrige una vez; Nalo aprende por memoria.
  • Números pronunciados raro — “dos setenta y cinco” sale como “275”. “Dos siete cinco” tal vez no.
  • Mezclar idiomas a media oración — funciona, pero de vez en cuando agarra una palabra del idioma equivocado. Habla en un solo idioma por mensaje.

Dónde funciona mejor

  • 5–30 segundos de voz
  • Hablar en dirección al micrófono del teléfono
  • Pensamientos completos con pausas claras entre cosas
  • Un solo idioma por mensaje

Qué transcribe Nalo

Lo que tú ves

Cuando mandas un mensaje de voz, Nalo te muestra la transcripción de regreso en el chat para que confirmes que agarró las palabras correctas:

🎤 “Cotización para la Sra. Lewis taza rota dos setenta y cinco”

✅ Cotización Q-ABC12345 para la Sra. Lewis — Reparación de taza rota: $275.00

Si la transcripción está mal, tócala para reenviar o di “no, era doscientos cincuenta”. Nalo ajusta.

Lo que se guarda

Los mensajes de voz en sí no se guardan — solo el texto transcrito se queda en tu historial de conversación. Después de 24 horas, el audio se borra del almacenamiento temporal.


Voz en varios idiomas

Whisper detecta el idioma automáticamente. Así:

  • Voz en inglés → transcrita en inglés → procesada en inglés
  • Voz en español → transcrita en español → procesada en español
  • Oración mezclada → mejor esfuerzo de transcripción, normalmente bien

Si el idioma de los documentos del negocio está fijo (digamos, inglés), y mandas mensaje de voz en español, Nalo chatea en español pero genera el PDF en inglés. Mismas reglas que al teclear.


Solución de problemas

“La nota de voz no se transcribió”

Posibles causas:

  • Se cortó el internet a medio envío — intenta otra vez
  • El audio fue muy corto (<1s) — mantén el botón más tiempo
  • El servicio de OpenAI Whisper se cayó un momento — reintenta

Nalo siempre confirma de vuelta: si no ves el eco de la transcripción en 10 segundos, reenvía.

“La transcripción salió enredada”

  • Graba en un lugar más silencioso
  • Acércate al teléfono
  • Baja un poco el ritmo

“Las palabras están bien pero Nalo entendió mal la intención”

Esto es raro. Lee la transcripción, luego reescribe con texto el detalle crítico. Después: “Recuerda que cuando digo X, me refiero a Y” — Nalo lo guarda en memoria.


Nota sobre costos

La transcripción usa OpenAI Whisper, cobrada por duración de audio. Incluido en todos los planes. No vas a ver un cargo extra.


Privacidad

  • Los archivos de audio van HeyNalo → OpenAI Whisper → transcripción
  • OpenAI no entrena con datos que pasan por su API
  • Las transcripciones se guardan en tu historial de conversación (igual que los mensajes de texto)
  • Los archivos de audio se borran dentro de las 24h después de la transcripción

Tips para días ocupados

  • Junta varias en una nota de voz — una nota de 60 segundos en la comida cubriendo 5 tareas > 5 mensajes de texto repartidos durante la mañana
  • Voz + corrección por texto — manda la voz, luego teclea una sola corrección (“el precio era 275, no 225”)
  • Nombres difíciles — deletréalos por voz la primera vez (“M-R-S L-E-W-I-S”), luego Nalo se acuerda

Siguiente

  • Preguntas frecuentesFAQ
  • Volver al índiceOverview
WhatsApp sms SMS