/02 Work
SmartDentalBot
Una clínica dental pierde entre el 20 y el 30% de sus llamadas entrantes porque en ese momento nadie puede coger el teléfono. No es un problema tecnológico sofisticado: es que el teléfono suena y no hay nadie. Esas llamadas perdidas son citas que no se agendan, pacientes que llaman a la competencia, ingresos que no existen.
La tolerancia al silencio en una llamada telefónica es radicalmente más baja que en cualquier otro canal. En un chat, tres segundos de espera son normales. En una llamada, son señal de que algo va mal. El problema técnico que define toda la arquitectura es el endpointing: detectar con precisión cuándo el paciente ha terminado de hablar para que el agente responda sin interrumpir y sin hacer esperar.
Pipeline de procesamiento de voz en tiempo real con endpointing ajustado para conversaciones de citas médicas —vocabulario acotado, pausas naturales más largas que en conversación informal, confirmaciones frecuentes. El agente mantiene contexto de la conversación a través de n8n para orquestar las integraciones con el sistema de citas de la clínica.
En beta cerrada con las primeras clínicas. El sistema captura el 100% de las llamadas entrantes fuera de horario. El tiempo de respuesta del agente está dentro del umbral de naturalidad percibida.
El problema real
Cuando hablas con dueños de clínicas dentales sobre sus problemas operativos, el software de gestión de citas aparece pronto. Pero el problema más frecuente y más inmediato es anterior a cualquier software: el teléfono que nadie coge.
Las recepcionistas están atendiendo a un paciente presencial, o son las tres de la tarde de un viernes, o simplemente hay demasiadas llamadas simultáneas. El paciente que llama en ese momento —con dolor, o intentando cancelar una cita, o simplemente preguntando el precio de una limpieza— cuelga. Y llama a otra clínica.
SmartDentalBot no intenta reemplazar a la recepcionista. Intenta que ninguna llamada quede sin respuesta.
Por qué el endpointing es el problema central
La idea de “un bot que coge el teléfono” suena simple. La implementación no lo es, y el punto de fricción más crítico es detectar cuándo el hablante ha terminado.
Los sistemas de endpointing estándar están calibrados para conversaciones generales. En una llamada a una clínica dental, los patrones son distintos:
- Los pacientes hacen pausas más largas mientras buscan su número de DNI o comprueban su calendario.
- Las confirmaciones (“sí, el martes”) son respuestas muy cortas con silencios después.
- El vocabulario es acotado: nombres de tratamientos, días de la semana, horas.
Si el endpointing es demasiado agresivo, el agente interrumpe al paciente. Si es demasiado conservador, el silencio se hace incómodo y el paciente asume que el sistema no funciona. La ventana de tolerancia es de menos de un segundo.
La calibración del endpointing para este dominio específico fue el problema técnico que más tiempo y más iteraciones consumió.
La orquestación con n8n
El agente de voz es la capa de conversación, pero lo que hace útil al sistema es lo que ocurre después de la conversación: crear la cita en el software de la clínica, enviar la confirmación por SMS, marcar en el CRM que la llamada fue atendida por el bot.
n8n orquesta esas integraciones. Cada clínica tiene su propio software de gestión (Gesden, Dentix, sistemas propios), y n8n permite conectar el output de la conversación con esos sistemas sin reescribir el pipeline de voz cada vez.
La separación también tiene ventajas de mantenimiento: el pipeline de voz puede actualizarse sin tocar las integraciones, y las integraciones pueden reconfigurarse sin tocar el pipeline.
Estado actual
Beta cerrada. El sistema funciona. Las primeras conversaciones con clínicas están en marcha.
Lo que busco es la primera clínica dispuesta a usarlo en producción real —no en demo, no en prueba controlada, sino con sus pacientes reales y sus llamadas reales. Ese primer cliente convierte un producto que funciona en un producto probado.