Lo que Lovable hizo con las apps, Melo lo hace con los agentes de voz

Lo que Lovable hizo con las apps, Melo lo hace con los agentes de voz

Agentes de voz con IA: Créalos hablando
Agentes de voz con IA: Créalos hablando

Cómo la IA está cambiando la forma de crear agentes de voz, automatizar llamadas y construir atención al cliente telefónica sin configuraciones técnicas.

Hace dos años, convertir una idea de software en algo real significaba una de dos cosas: aprender a programar o pagar a alguien que supiera. Hoy entras en Lovable, escribes "quiero una app para gestionar las reservas de mi gimnasio" y al rato tienes una aplicación funcionando. No has tocado una línea de código, simplemente has descrito lo que querías y la IA lo ha construido.

En Diga hemos llevado esa misma idea a los agentes de voz. En este artículo explicamos cómo se construían los agentes de voz hasta ahora, qué cambia cuando los creas hablando con un copiloto en lugar de configurándolos a mano, hasta dónde llega ese enfoque, qué problemas siguen abiertos y por qué creemos que así es como se construirán los agentes de voz de la próxima generación.

El cambio de fondo: ya no se programa, se describe

Muchos conoceréis el vibe coding, la idea de programar simplemente mandando prompts a una IA. En cuestión de meses dejó de ser un meme de Twitter para convertirse en el método que mucha gente sigue cuando está creando o desarrollando un producto.

Lovable se convirtió en una de las startups de software de más rápido crecimiento de la historia, de cero a 100 millones de dólares de ingresos recurrentes en ocho meses y una valoración de 6.600 millones a finales de 2025, porque derrumbó un requisito que llevaba décadas en pie: para hacer software, había que ser programador. Hoy se levantan cientos de miles de proyectos al día en su plataforma, muchos de gente que jamás ha escrito una línea de código. Y no es el único ejemplo, podemos encontrar otras plataformas similares como Cursor, v0 o Replit.

Pero el cambio importante no es Lovable, Cursor o v0. Es el cambio de interfaz. Durante cincuenta años, pedirle a un ordenador algo nuevo expdigía un idioma intermedio, el código. La IA volvió ese idioma innecesario, ahora describes la intención y la máquina se encarga de la ejecución.

Las apps fueron solo el primer dominio en caer, el siguiente son los agentes de voz.

Cómo se construían agentes de voz con IA hasta ahora

Montar un agente de voz que atienda el teléfono de tu negocio nunca ha sido una tarde de trabajo. Hay que configurar la telefonía y conectar un número. Hay que redactar el prompt que define cómo habla y qué hace el agente. Hay que conectar las integraciones, ya que queremos que pueda editar el CRM o mandar un correo. Si queremos que tenga información de nuestro negocio, hay que seleccionar los documentos que necesita tener en su contexto. Y luego probar, escuchar llamadas, ajustar y repetir.

Nada de eso es imposible, pero actualmente para tener un agente de voz hace falta una persona que sepa montar los prompts, la telefonía y las integraciones.

Melo, describes el agente y se construye

Entonces, ¿quién es Melo? Melo es nuestro copiloto, y es lo que pasa cuando le aplicas a los agentes de voz la misma idea que Lovable le aplicó a las aplicaciones.

"Necesito un agente que atienda las llamadas de mi clínica y agende citas". Dile simplemente esto a Melo y él elige la voz, redacta las instrucciones del agente, monta el flujo de la llamada y lo deja a punto en un número de teléfono. Tú simplemente describes, revisas y confirmas. Sigue siendo necesario lo que describíamos en la sección anterior, solo que ahora Melo se encarga de todo.

Qué le puedes pedir a Melo

Crear el agente de voz IA es solo el principio. A partir de ahí, ampliarlo es seguir hablando de las capacidades que necesita tu agente.

"Quiero que conozca nuestros horarios y la información relevante de la clínica." Le pasas el PDF, o le sueltas la web entera, y a partir de ahí el agente responde con tu información real en vez de improvisar. Esto es posible gracias a sistemas RAG.

"Necesito que durante la llamada mire el pedido del cliente en nuestro sistema." Melo lo conecta a tu CRM o a tu base de datos, y el agente consulta, crea o actualiza datos en mitad de la conversación, y le indica al cliente su número de pedido sin que nadie tenga que colgar y volver a llamar.

"Al termina la llamada, me debe mandar una transcripción por email y apuntar la información en un excel" Melo arma esa automatización con los servicios que ya usas Gmail, Slack, tu hoja de cálculo, tu calendario o tu CRM.

Y cuando algo no sale como esperabas, puedes preguntarle a Melo: "¿Por qué ha fallado esta llamada?" Él te abre el registro de lo que ocurrió, qué decidió el agente, qué herramienta usó, dónde se atascó y que dice la transcripción.

Hasta la parte aburrida va por chat: comprar un número, ver cuántos minutos te quedan este mes, invitar a alguien de tu equipo. Lo que en otra herramienta son cinco pantallas, aquí es una pregunta.

Lo que Melo todavía no sabe hacer

Melo todavía no es capaz de hacerlo todo, conforme aumentas la complejidad de lo que le pides, puedes ir comprobando dónde encuentra su límite.

Pídele un agente que coja llamadas y agende citas y lo tienes en minutos. Pídele un flujo de soporte de tres niveles, con escalado según el tipo de incidencia, validación de la garantía contra dos sistemas y reglas distintas por país, y la cosa cambia radicalmente. Melo te monta el esqueleto, pero te va a hacer falta ir afinando cada rama del flujo de la conversación. Definir el tono exacto de una marca o manejar conversaciones delicadas y complejas sigue siendo trabajo de iteración donde debes hacer pruebas, escuchar las llamadas y corregir.

Con las integraciones pasa parecido. Conectar Gmail, un calendario o un CRM conocido es sencillo. Conectar el ERP propio sigue necesitando a una persona que conozca ese sistema por dentro. Melo prepara el terreno; los casos de verdad a medida todavía piden manos expertas.

Hay un tramo de problemas complejos que hoy Melo no resuelve solo. Lo que sí hace es servir de base para poder construir agentes en Diga.

Por qué creemos que éste es el camino

El patrón es el mismo en todas partes y ya no tiene marcha atrás: crear dejó de ser cuestión de saber construir y pasó a ser cuestión de saber qué quieres construir. Pasó con el software, está pasando con los agentes de voz, y la consecuencia para un negocio es que la ventaja deja de ser "tener a alguien que sepa montarlo" y pasa a ser "saber qué quieres que haga tu agente".

Para eso construimos Melo. Para la agencia que levanta agentes para veinte clientes sin un equipo técnico detrás. Para el restaurante, la clínica o la inmobiliaria que sabe perfectamente cómo quiere atender el teléfono, pero no tiene por qué saber de prompts ni de telefonía. Preferimos que esa parte la lleve un copiloto y que tú te dediques a tu negocio, que es de lo que sí sabes.

El futuro de Melo

Hoy le pides a Melo y construye. Hacia donde va es a hacer cada vez más sin que se lo tengas que pedir con tanto detalle.

Lo primero, lograr lo que hemos comentado, es decir, que los flujos enrevesados y las integraciones a medida dejen de necesitarte tanto. Cada versión del copiloto intenta mejorar un poco en ese aspecto.

Lo segundo, y lo que más nos importa, es que Melo no se quede en crear el agente, sino que lo acompañe. Que mire cómo van las llamadas reales y te diga "este agente cuelga mucho en el paso de pago, ¿lo ajustamos?" o "la mitad de la gente pregunta por el horario y no lo tienes en la base de conocimiento". Pasar de un copiloto que construye cuando se lo pides a uno que observa, propone y mejora contigo.

Y al final, que cada vez más del producto quepa en la conversación. Que lo que hoy son menús, pestañas y formularios sea, sin más, decirle a Melo lo que quieres: crear, publicar, revisar y mejorar un agente, todo hablando.

Para todo eso aún queda camino, y lo estamos recorriendo. Pero el cambio de fondo ya ha pasado. Antes, para tener un agente de voz, necesitabas a alguien que supiera montarlo. Hoy solo necesitas saber qué quieres que haga.

Suscríbete a la newsletter de Diga

Recibe nuestra newsletter con aprendizajes reales, estrategias prácticas y novedades sobre agentes de voz.

Suscríbete a la newsletter de Diga

Recibe nuestra newsletter con aprendizajes reales, estrategias prácticas y novedades sobre agentes de voz.

Suscríbete a la newsletter de Diga

Recibe nuestra newsletter con aprendizajes reales, estrategias prácticas y novedades sobre agentes de voz.