Google acaba de efectuar un cambio significativo: ha reducido el límite de rastreo de las páginas HTML a 2 MB, es decir, aquellas que superen este umbral no serán rastreadas ni indexadas por Googlebot al completo.

Aunque en la mayoría de los casos analizados por Seobility, los archivos HTML se mantienen por debajo de los 2 MB, algunas webs que se han visto afectadas, pudiendo llegar a sufrir un problema serio.

Con esta actualización Google está enviando una señal clara: la eficiencia técnica es una prioridad, pues los costes de computación han aumentado tremendamente tras la introducción de las IAs y una cantidad de contenidos en constante crecimiento. Por lo que no es de extrañar que Google esté gestionando sus recursos de forma más selectiva y pida a los sitios web que hagan lo mismo.

En este artículo aprenderás qué ha cambiado exactamente, qué implica para tu sitio web, cómo comprobar si tus páginas se han visto afectadas con Seobility y qué puedes hacer para mantener tus archivos HTML ligeros y fácilmente rastreables.

¿Qué ha cambiado Google exactamente?

Hasta hace poco, Googlebot rastreaba páginas HTML de hasta 15 MB, mientras que ahora ese límite ha pasado a ser de máximo 2 MB por archivo.

En la práctica, esto significa que si un archivo HTML supera los 2 MB, Google solo rastrea la primera parte de la página, ignorando todo el contenido posterior y, por lo tanto, dejándolo fuera de su índice.

Además, esta restricción no se ha aplicado únicamente a los archivos HTML, ya que otros recursos basados en texto como los archivos CSS y JavaScript, también están sujetos al mismo límite de 2 MB (evaluándose cada archivo de forma individual). Siendo los archivos PDF la única excepción a esta regla, manteniendo un límite de rastreo de 64 MB.

Y aunque Google no ha anunciado oficialmente este cambio, ya aparece documentado en la versión inglesa de la documentación de Search Central:

El nuevo límite de Google en la documentación de Search Central de Google.

¿Por qué Google ha hecho este cambio?

Para variar, Google no ha proporcionado ninguna explicación oficial y ha introducido esta actualización discretamente, sin anuncios.

Posibles motivos

Es razonable asumir que Google está intentando ahorrar recursos. Rastrear, renderizar y procesar archivos grandes implica un alto coste y esto no ha hecho más que aumentar a medida que internet ha ido creciendo.

Al mismo tiempo, dado que Google está impulsando sus IAs (como las Vistas Creadas con IA) necesita procesar grandes volúmenes de datos de forma eficiente para generar sus respuestas, por lo que las páginas ligeras y bien estructuradas facilitan mucho este proceso.

Perspectiva SEO

Desde el punto de vista del SEO, este cambio se alinea con otras tendencias ya conocidas, como la introducción de las Core Web Vitals. Google ha premiado cada vez más a los sitios web que son técnicamente limpios, eficientes y fáciles de usar.

El código innecesariamente inflado, los scripts superfluos y las páginas excesivamente complejas aportan poco valor y se han vuelto menos aceptables. Contar con una base técnica sólida y contenidos claros empieza a ser crucial.

¿Qué tipo de archivos se ven afectados?

Google aplica este límite a todos aquellos archivos de texto que se obtengan al cargar una página. Eso sí, cada archivo se evalúa por separado y cuenta con su propio máximo de 2 MB.

Archivos HTML (los más críticos)

Los archivos HTML son los más afectados, ya que muestran el contenido real de las páginas: textos, encabezados, enlaces internos y datos estructurados.

Google puede dejar de rastrear contenido importante situado al final de una página que supere los 2 MB.

Archivos CSS

Los archivos CSS también están sujetos al nuevo límite. Las hojas de estilo grandes o no optimizadas pueden provocar que Google solo obtenga una parte del archivo y, aunque no afecta directamente al contenido, sí puede influir en cómo Google renderiza y comprende tus páginas.

Archivos JavaScript

Google también ha establecido los 2 MB máx. para rastrear archivos de JavaScript, lo cual es tremendamente relevante para todas aquellas páginas que trabajen con JavaScript para cargar contenidos dinámicos. Cuando Google corta un archivo JS, partes del contenido pueden no llegar a aparecer nunca para los buscadores.

Dicho esto, recuerda que un sitio web no debería depender únicamente de JavaScript para cargar contenido crítico.

¿Qué significa esto para tu sitio web?

Cuando un archivo HTML supera el límite de 2 MB, Google deja de procesar el contenido restante. Como resultado, Google puede:

  • Omitir texto importante.
  • Pasar por alto enlaces internos.
  • Ignorar datos estructurados.

Impacto potencial en el SEO

Si Google no puede procesar una página por completo, tampoco puede evaluarla correctamente. Esto puede derivar en varios problemas:

  • Google puede interpretar de forma incorrecta el tema o la intención de la página.
  • El contexto de las palabras clave puede quedar incompleto.
  • Tu posicionamiento puede caer porque Google subestima el valor real de la página.

¿Cuántos sitios web están siendo realmente afectados? Un análisis de Seobility

Para comprender mejor el impacto real de este cambio, en Seobility hemos analizado nuestra propia base de datos.

Para ello, hemos examinado los archivos HTML de aproximadamente 44,5 Millones de páginas rastreadas con Seobility y el resultado ha sido contundente:

Solo el 0,82% de todas las páginas analizadas supera los 2 MB.

Así pues, podemos decir que, en la gran mayoría de los casos, este límite de rastreo no supondrá un problema inmediato.

De hecho, fíjate en la distribución del tamaño de las páginas analizadas:

  • El 83,76% supera los 50 KB.
  • El 68,96% supera los 100 KB.
  • El 40,45% supera los 250 KB.
  • El 18,73% supera los 500 KB.
  • El 5,5% supera 1 MB.
  • Solo el 0,82% supera los 2 MB.

Los sitios web grandes pueden alcanzar este límite

Ahora bien, a pesar de que las cifras son bajas, este problema puede afectar tanto a sitios web pequeños o mal mantenidos, como a plataformas grandes y conocidas que cuentan con equipos de SEO experimentados.

En algunos experimentos puntuales, en Seobility hemos detectado páginas HTML que superan los 2 MB en plataformas de renombre como OMR Reviews (aprox. 3,4 MB) y Zalando (aprox. 2,6 MB).

Esto no refleja una mala calidad del sitio, sino todo lo contrario: se trata de webs muy complejas que generan archivos HTML más grandes de forma natural, pues incluyen filtros, herramientas de personalización, configuraciones de seguimiento y contenidos dinámicos.

Estos ejemplos demuestran que el nuevo límite de rastreo es un problema estructural, no un error de principiantes.

¿Cómo comprobar con Seobility si tus páginas se han visto afectadas?

Seobility te ayuda a identificar rápidamente si en tu dominio existen páginas con archivos HTML inusualmente grandes.

1. Para ello dirígete a tu proyecto y busca la pestaña «Subpáginas» en la sección de Auditoría Web.

(Si todavía no conoces la herramienta de Auditoría Web de Seobility, puedes probarla gratis aquí durante 14 días).

Abre la pestaña de subpáginas en Seobility.

2. Clica en el icono de engranaje y activa la columna «Tamaño de archivo»:

Activa la columna de tamaño de archivo.

3. Ordena la tabla por tamaño de archivo en orden descendente:

Tamaño de archivo descendente.

Finalmente, arrastra la pantalla hacia la izquierda para ver los tamaños de tus páginas. Así podrás hacerte una idea de cuánto pesan tus sites y si necesitas tomar medidas.

Informe de Seobility: «Páginas con gran tamaño de archivo»

Seobility también te ofrece un informe dedicado donde puedes consultar qué páginas HTML de tu sitio web son inusualmente grandes:

La auditoría de sitios web de Seobility tiene un informe específico para las páginas con tamaños de archivo grandes.

Aunque muy por debajo del umbral de Google, Seobility utiliza 0,5 MB (500 KB) como límite para elaborar este informe, ya que su objetivo es que tus sites sean ligeras y fácilmente rastreables.

Por lo tanto aquí verás todas aquellas páginas que superen los 0,5 MB, pues todavía puedes optimizarlas aún más.

¿Qué hacer si mis páginas superan los 2 MB?

No te alarmes. En la mayoría de los casos, puedes resolverlo con optimizaciones relativamente sencillas.

Reduce el tamaño del archivo HTML

Empieza por el propio archivo HTML, ya que ahí se encuentra el contenido real de tu página.

Los archivos HTML grandes suelen contener código innecesario o inflado, es decir, elementos presentes en el marcado que no aportan un valor real. Por lo que eliminar este código no debería afectar al aspecto visual de la página por lo general.

El CSS y el JavaScript inline también pueden aumentar el tamaño de tus archivos significativamente así que, siempre que sea posible, intenta trasladar este código a archivos externos que Google cargue por separado.

También puedes reducir los comentarios HTML, los espacios en blanco excesivos y las estructuras con demasiados niveles de anidación. Para ello puedes echar mano de herramientas de build que se encarguen de limpiarte el código automáticamente.

Además, si trabajas con un page builder como Elementor o WPBakery, ten en cuenta que estas herramientas suelen generar mucho código adicional. Intenta:

  • eliminar widgets o elementos de diseño innecesarios
  • simplificar estructuras demasiado complejas
  • trasladar el contenido no esencial a otras páginas

Optimiza los archivos CSS y JavaScript

Si aún no lo has hecho, deberías minificar tus archivos CSS y JavaScript para reducir su tamaño, ya que mediante este proceso se elimina todo lo que el navegador no necesita, como comentarios y espacios en blanco innecesarios.

Normalmente, esto lo puedes hacer fácilmente con:

En el caso de JavaScript, dividir los archivos grandes para que solo se cargue el código necesario para cada página específica (lo que se conoce en inglés como «code splitting») también puede serte de gran ayuda.

Por último, revisa todos los scripts de terceros (analítica, herramientas de marketing, banners de consentimiento) y valora si realmente los necesitas en cada una de tus páginas.

Revisa la estructura y el contenido de tus páginas

En ocasiones, el problema no está en el código, sino en la estructura de la páginas.

Las sites que son muy extensas con grandes cantidades de contenido pueden superar fácilmente el límite. Por eso, dividirlas en varias páginas más cortas y bien estructuradas suele resolver el problema.

Por otra parte, las sites con scroll infinito requieren de una atención especial, pues al añadir contenidos continuamente al hacer scroll, el tamaño de los archivos puede crecer rápidamente. Para solucionarlo, puedes combinar el scroll infinito con una paginación clásica para que Google acceda a todo el contenido sin inconvenientes.

De todos modos, independientemente de la estructura, asegúrate de que el contenido importante aparezca siempre al inicio de tus páginas para que Google lo pueda ver al toque, incluso si la página se acerca al límite de rastreo.

Mejores prácticas: cómo evitar problemas con el límite de rastreo de Google

Para garantizar que el nuevo límite de Google no se convierta en un problema para tu sitio web, conviene que sigas algunas prácticas básicas que no solo facilitan un rastreo más eficiente, sino que también mejoran el rendimiento de tu web y su experiencia de uso.

Tamaño recomendado para archivos HTML

Aunque Google permite archivos de hasta 2 MB, lo ideal es que apuntes a un tamaño bastante menor.

Una buena regla general: procura mantener tus archivos HTML por debajo de los 500 KB siempre que sea posible.

De esta forma, contarás con un margen suficiente para añadir nuevos contenidos, funciones o scripts en el futuro. Además, esto suele mejorar la velocidad de carga de la página, un factor clave en el posicionamiento de Google.

Supervisa el tamaño de tus archivos regularmente

Los archivos grandes suelen crecer de forma gradual. Nuevos plugins, herramientas de seguimiento o pequeños cambios de diseño pueden hacer que tus páginas aumenten su tamaño poco a poco.

Hacer auditorías web regularmente con Seobility te ayudará a detectar estos problemas desde el inicio y actuar antes de que se conviertan en algo serio.

Considera el rendimiento y la rastreabilidad como parte de la calidad del contenido

Un buen contenido no se limita solo al texto. La calidad técnica también es fundamental.

Incluso el mejor contenido puede perder visibilidad si queda enterrado bajo un código inflado. El rendimiento y la rastreabilidad no son únicamente cuestiones técnicas: son elementos centrales del SEO sostenible.

¿Por qué esto también es importante para las búsquedas con IA?

Mantener archivos HTML ligeros no solo beneficia a los motores de búsqueda tradicionales ya que las IA como ChatGPT o Gemini también requieren de contenidos web limpios y bien estructurados.

Cuanto más clara sea la estructura HTML de tus páginas, más sencillo será entenderlos para las inteligencias artificiales:

  • Pueden interpretar correctamente tu contenido
  • Resumirlo con precisión
  • Utilizarlo en respuestas generadas por IA

Reflexión final: el SEO técnico es cada vez más importante

Aunque actualmente solo un pequeño porcentaje de sitios web supera el límite de 2 MB, este cambio deja claro hacia dónde se dirige Google y cómo el SEO técnico está ganando aún más relevancia.

Google premia cada vez más a los sitios web eficientes, limpios y bien estructurados. El código inflado y la complejidad innecesaria se están convirtiendo en riesgos reales, no solo para los resultados clásicos de búsqueda, sino también para las nuevas experiencias de búsqueda impulsadas por IA.

Con Seobility puedes controlar todo esto, desde el tamaño de los archivos HTML y los problemas técnicos hasta oportunidades específicas de optimización on-page. Prueba Seobility gratis durante 14 días y asegúrate de que tu web siga siendo rastreable.