Cómo empezar con HeyGen paso a paso: tu primer vídeo en 15 minutos
Tutorial real y práctico para generar tu primer vídeo con HeyGen en menos de 15 minutos. Desde el registro gratuito hasta el MP4 descargado, paso a paso, con los errores comunes que comete todo el mundo en el primer intento y cómo evitarlos.
Para empezar con HeyGen necesitas: una cuenta gratuita (creas con email o Google en 30 segundos), un guion escrito de 100-200 palabras y unos 15 minutos para registrarte, elegir avatar, configurar voz y generar tu primer vídeo. No necesitas tarjeta de crédito para el plan Free, ni instalación de software (todo es web), ni conocimientos técnicos. El plan gratuito incluye 3 vídeos al mes con marca de agua y 720p — suficiente para validar si la plataforma encaja con tu flujo antes de pagar.
Este post es el tutorial real, paso a paso, con captura de los errores comunes en cada fase. Si todavía no tienes claro qué es la plataforma o qué casos cubre, lee primero qué es HeyGen y para qué sirve. Si lo que buscas es comparar el coste del plan que necesitas, los precios de HeyGen en 2026 desglosan Creador vs Pro vs Business. Vamos al tutorial.
Antes de empezar: qué necesitas
Antes de tocar HeyGen necesitas tener listos cuatro elementos. Tener esto preparado evita que abras la plataforma y te quedes mirando la pantalla sin saber qué hacer.
- Email válido (mejor Google account, así también puedes loguearte con un click).
- Un guion escrito de 100-200 palabras (texto en el idioma que vas a generar). Si no tienes, pídeselo a ChatGPT o Claude: "escribe un guion de 30 segundos hablando sobre [tu tema] dirigido a [tu audiencia]". Para flujos avanzados de guiones, escribir guiones de reels con ChatGPT y ejemplos reales tiene plantillas concretas.
- Decisión sobre el avatar: ¿vas a usar uno del catálogo stock (gratis y rápido) o tu propia cara clonada (plan de pago + grabación previa de 2-3 minutos)?
- Idioma claro: español castellano, español latino, inglés, etc. HeyGen tiene voces diferenciadas por variante regional.
Paso 1: registrarte gratis en HeyGen
Entras a heygen.com y haces click en "Sign up" en la esquina superior derecha. Te ofrece tres opciones: continuar con Google, con Apple ID o con email + contraseña. La recomendación es continuar con Google: tarda 5 segundos, no necesitas verificar email y queda enlazado a tu cuenta principal para futuros logins.
Tras el registro, HeyGen te pregunta por tu caso de uso (creador, marketing, ventas, formación, otros) y por tu volumen estimado de vídeos al mes. Esto solo sirve para personalizarte el dashboard, no te encasilla en ningún plan. Selecciona lo más cercano y pasa. Llegas al dashboard principal con un tutorial inicial flotante que puedes cerrar o seguir — recomendación: ciérralo y aprende explorando, es más rápido.
Paso 2: elegir tu primer avatar
En el dashboard haces click en "Create Video" (botón principal). Te lleva al editor con una pantalla en blanco y la primera decisión: elegir avatar. Para tu primer vídeo, usa un avatar stock (no intentes Custom Avatar todavía — necesita plan de pago y proceso de subida que se cubre en otro tutorial).
En la barra lateral izquierda tienes "Avatars" con el catálogo completo (más de 500 stock). Los filtros te ayudan: género, edad, etnia, vestimenta (casual, profesional, sport), entorno (oficina, fondo blanco, exterior). Para un vídeo de prueba elige uno con fondo neutro y vestimenta acorde a tu nicho. Si haces contenido B2B, profesional con traje o blusa. Si haces lifestyle, casual.
Doble click sobre el avatar elegido y se añade al lienzo del editor. Verás al avatar centrado en pantalla con la pose por defecto. Puedes redimensionarlo, moverlo, recortarlo o cambiar el fondo (color sólido, imagen subida o fondo verde para chroma).
Paso 3: escribir el guion (o pegarlo)
En el panel derecho del editor hay una caja de texto grande etiquetada como "Script". Aquí pegas el guion que tenías preparado. Recomendación crítica para primer vídeo: máximo 100 palabras (unos 30-40 segundos de vídeo). Si es la primera vez, no te pongas con un guion de 5 minutos — el plan Free tiene cap de 3 minutos por vídeo y, además, quieres validar la plataforma rápido.
Kit operativo gratuito
El kit completo para captar más clientes desde redes.
Plantillas, prompts y guías probados con marcas reales. Más de 40 recursos listos para duplicar y aplicar desde la primera semana. Acceso gratuito.
Consejos para que el guion suene natural en boca del avatar:
- Frases cortas (máximo 15-18 palabras). Las frases largas suenan robotizadas porque el TTS no respira igual que tú.
- Puntuación visible: usa comas, puntos y signos de interrogación generosamente. El TTS las interpreta como pausas reales.
- Evita abreviaturas: escribe "por ejemplo" en vez de "ej.", "versus" en vez de "vs". El TTS las lee literal.
- Números escritos en letra cuando importan: "trescientos cincuenta" suena mejor que "350" en algunos casos. HeyGen interpreta números pero pierde naturalidad.
- Saltos de línea entre ideas: el TTS hace pausa natural en cada salto. Aprovecha para marcar ritmo.
Paso 4: configurar voz e idioma
Justo encima de la caja de guion tienes el selector de voz. HeyGen detecta automáticamente el idioma del texto, pero conviene confirmar manualmente la variante: "Spanish (Spain)" o "Spanish (Latin America)" según tu audiencia. La diferencia de acento es notable y un castellano hablando a audiencia mexicana suena raro (y al revés).
Dentro de cada idioma tienes 5-15 voces a elegir. Cada una tiene un botón de "Preview" que reproduce 5 segundos de muestra leyendo tu guion real. Prueba 3-4 voces antes de decidir. Las recomendaciones según caso de uso:
- Contenido informativo/B2B: voces graves, ritmo medio (transmiten autoridad).
- Contenido lifestyle/casual: voces medias, ritmo más rápido y cálido.
- Storytelling: voces con más rango emocional (ojo: no todas tienen).
- Tutoriales: voces claras, articulación marcada, ritmo lento.
Si el resultado de la voz por defecto no te convence, en plan Creador y superiores puedes usar Voice Cloning para clonar tu propia voz: subes 30 segundos a 5 minutos de audio limpio tuyo y HeyGen genera tu voz sintética. La calidad es indistinguible de la real para la mayoría de oyentes. Esto es lo que conecta con entrenar a la IA con tu tono de voz: voice cloning es la versión audiovisual de ese mismo principio.
Paso 5: generar y revisar el vídeo
Una vez tienes avatar + guion + voz, haces click en el botón "Submit" o "Generate" en la esquina superior derecha del editor. HeyGen abre un modal con resumen del vídeo (duración estimada, créditos consumidos si aplica, idioma, voz, avatar) y un botón final de confirmación.
Tras confirmar, HeyGen empieza la generación. Tiempo real:
- Vídeo de 30 segundos con avatar stock + voz estándar: 1-2 minutos en cola + generación.
- Vídeo de 60-90 segundos con Avatar IV o Custom Avatar: 3-5 minutos.
- Vídeo de 3 minutos: 5-10 minutos.
- Vídeo con Translation lipsync: 5-15 minutos según idioma destino.
Mientras se genera puedes cerrar la pestaña sin perder nada: el vídeo se procesa en servidor y queda esperándote en tu dashboard cuando vuelves. HeyGen también te manda email cuando está listo (si activaste notificaciones en el registro). Cuando termina, lo ves en la lista de "Recent Videos" con miniatura y botón de reproducir.
Revisa el vídeo a velocidad normal (1x) la primera vez. No lo pongas en 0.25x ni 0.5x: a velocidad lenta cualquier micro-desincronización del lipsync se hace visible y vas a juzgar mal la calidad. La audiencia real lo ve a 1x. Si a 1x suena natural y el sync es invisible, está bien.
Paso 6: exportar y descargar tu vídeo
Si el resultado te convence, haces click en "Download" sobre el vídeo. HeyGen exporta en MP4 con códec H.264, compatible con cualquier plataforma. En plan Free la resolución es 720p y lleva marca de agua de HeyGen en la esquina inferior derecha. En Creador y superiores es 1080p sin marca; en Business puedes subir a 4K.
El MP4 descargado está listo para subir directamente a Instagram Reels, TikTok, YouTube Shorts, LinkedIn, X o tu newsletter sin necesidad de re-edición. Si quieres añadir subtítulos quemados (open captions), HeyGen los genera automáticamente desde el propio editor antes de exportar: activas el toggle "Captions" y elige posición y estilo. Esto encaja con el stack de IA para creadores de contenido donde HeyGen ocupa la capa de generación de vídeo dentro de un workflow más amplio.
Errores comunes en tu primer vídeo (y cómo evitarlos)
Estos son los cinco errores que comete todo el mundo en su primer vídeo con HeyGen, y la solución concreta para cada uno.
Error 1 — Guion demasiado largo
Meter un guion de 500 palabras en el primer intento. Resultado: vídeo de 2-3 minutos donde el avatar se vuelve repetitivo y, peor, gastas tu primer vídeo del plan Free en algo que no vas a publicar. Solución: primer vídeo siempre con guion de 50-100 palabras (15-30 segundos). Cuando domines el flujo, escala.
Error 2 — Voz mal seleccionada
Quedarte con la primera voz que sale por defecto. Resultado: el vídeo suena raro y no sabes por qué. Solución: prueba 3-4 voces con el botón Preview leyendo tu guion real antes de generar. La elección de voz es el 40% de la percepción de calidad.
Error 3 — No usar puntuación generosa
Escribir el guion como un párrafo corrido sin comas ni puntos. Resultado: el TTS lee todo seguido sin respirar, suena agresivo y robotizado. Solución: una coma cada 7-8 palabras, punto cada 12-15. Lee tu guion en voz alta antes de generar: donde tú respiras, pon coma o punto.
Error 4 — Avatar incoherente con el mensaje
Elegir un avatar en traje de oficina para hablar de fitness o un avatar en chándal para hablar de inversión patrimonial. Resultado: la audiencia percibe disonancia inconsciente y la confianza cae. Solución: avatar coherente con el nicho. Profesional para B2B, casual para lifestyle, sport para fitness.
Error 5 — Juzgar el lipsync a cámara lenta
Reproducir el vídeo en 0.25x o 0.5x para "ver bien el lipsync". Resultado: ves desincronizaciones que ningún humano real verá en visualización normal y rechazas un vídeo que estaba perfectamente bien. Solución: juzga siempre a velocidad 1x. Es la velocidad real a la que lo ve la audiencia.
Preguntas frecuentes
+¿Necesito tarjeta de crédito para registrarme?
No. El plan Free de HeyGen NO requiere tarjeta de crédito. Te registras con email o Google en 30 segundos, accedes al dashboard y empiezas a generar vídeos directamente con tus 3 créditos gratuitos al mes. Solo te pide tarjeta si decides activamente saltar a un plan de pago (Creador, Pro o Business). Si en algún punto del flujo te aparece una pantalla pidiendo método de pago, es porque has clicado en una funcionalidad premium (Custom Avatar, Voice Cloning, créditos extra) — basta con volver atrás y seguir en Free. El registro gratuito te da acceso real a la plataforma sin compromiso: editor completo, catálogo de avatares stock, voces multilingües y exportación MP4 con marca de agua y a 720p.
+¿Cuánto tarda HeyGen en generar un vídeo?
Depende del tipo de vídeo y del plan. Para un vídeo estándar de 30 segundos con avatar stock y voz estándar tarda entre 1 y 2 minutos en plan Free y Creador. Para vídeos de 60-90 segundos con Avatar IV (el avatar más realista lanzado en 2025) o con tu Custom Avatar clonado, sube a 3-5 minutos por vídeo. Vídeos largos de 3 minutos tardan 5-10 minutos. La función de Translation con lipsync es la más pesada y puede tardar entre 5 y 15 minutos según el idioma destino y la complejidad del vídeo original. El proceso se hace en servidor: puedes cerrar la pestaña sin perder nada y recibirás un email cuando esté listo. Los planes Pro y Business tienen cola prioritaria, lo que acelera tiempos en horas pico (mañanas EE.UU. coinciden con tarde Europa, ahí Free y Creador pueden tener esperas adicionales).
+¿Puedo usar HeyGen en español desde el principio?
Sí, completamente. HeyGen soporta español castellano (España) y español latinoamericano de forma nativa desde el plan Free. Tienes voces diferenciadas para ambas variantes (varias masculinas y femeninas en cada una), con acento natural y prosodia coherente con cada región. Escribes el guion en español, eliges la variante y la voz, y HeyGen genera el vídeo con lipsync sincronizado al español. Lo único que está exclusivamente en inglés es la interfaz del panel de administración (los menús, botones y configuración general), pero el contenido que tú generas puede estar al 100% en español. La curva de aprendizaje de la interfaz en inglés es mínima porque todo es visual e intuitivo: en 15-20 minutos te manejas sin problema aunque tu nivel de inglés sea básico. El catálogo de avatares stock también incluye avatares de aspecto latinoamericano y europeo para que el visual encaje con tu audiencia.
+¿Cómo evito la marca de agua en el plan gratuito?
No se puede evitar en plan Free: la marca de agua de HeyGen aparece automáticamente en la esquina inferior derecha de todos los vídeos generados en plan gratuito, y no hay configuración ni truco para quitarla manteniendo el plan Free. Esa es la principal diferencia del Free vs los planes pagos. Para eliminar la marca de agua necesitas pasar al plan Creador ($29/mes mensual o aproximadamente $24/mes pagando anual), que también desbloquea resolución 1080p (vs 720p del Free) y vídeos ilimitados (vs 3 al mes del Free). Si solo necesitas validar la plataforma para decidir si pagas, los vídeos con marca de agua son perfectamente usables para uso interno (revisión de equipo, testing, prototipos) — solo no los publiques con marca a tu audiencia porque resta profesionalidad. Para publicación en redes y a clientes, plan Creador mínimo.
+¿Qué pasa si me equivoco en el guion después de generar?
Tienes dos opciones según la magnitud del error. Si el error es pequeño (una palabra, una frase corta), HeyGen permite editar solo ese fragmento del guion y regenerar únicamente la parte afectada, no el vídeo entero: esto ahorra tiempo y, en planes de pago, créditos. Si el error es grande (cambio de guion completo, cambio de avatar, cambio de voz), tienes que generar el vídeo de nuevo desde cero: eso consume otro de tus créditos mensuales (1 de tus 3 en Free, o un crédito de tu pool si usas Avatar IV en planes superiores). Por eso es crítico revisar bien el guion antes de pulsar Generate: leerlo en voz alta, comprobar puntuación, verificar nombres propios y números. Es muy común gastar 2 de los 3 créditos Free del mes en correcciones por no revisar antes — error que se evita con 30 segundos de relectura previa.
En Content Society compartimos los flujos completos de producción con HeyGen que aplicamos en Grouthers: guiones reutilizables por nicho, checklists de Custom Avatar paso a paso, plantillas de Voice Cloning y workflows de traducción multilingüe que usamos con marcas personales reales. [Accede a los recursos](/recursos-gratis).

Sobre el autor
Adrián García
@AdrianGarmeFundador de Grouthers, agencia especializada en creación de contenido para marcas personales. He ayudado a más de 50 marcas personales en España, Estados Unidos y Latinoamérica a crecer en redes sociales. Ahora estoy construyendo Content Society, la comunidad para marcas personales que quieren captar más clientes desde redes.
Capta más clientes desde redes
Capta más clientes desde redes sin reinventar la rueda.
Más de 40 recursos: plantillas para duplicar, prompts probados y guías paso a paso. Acceso gratuito al acceder a los recursos.
Sigue leyendo
Otros posts del blog que conectan con este tema.
Qué es HeyGen y para qué sirve: guía completa en 2026
Descubre qué es HeyGen, cómo funciona y por qué creadores y empresas la usan para generar vídeos con avatares IA sin grabar nada. Guía completa.
Precios de HeyGen en 2026: Free, Creador, Pro y Business comparados
Comparativa actualizada de los planes de HeyGen en 2026: Free, Creador $29, Pro $99 y Business $149. Qué incluye cada uno y cuál te conviene según tu uso.
HeyGen opiniones en 2026: lo bueno, lo malo y lo que nadie cuenta
Análisis honesto de HeyGen en 2026: pros, contras, casos de éxito reales y problemas comunes. Lo que las reseñas oficiales no cuentan sobre el sistema de créditos.