Problemas de indexación en sitios web sin solución server-side rendering (SSR)
Soft 404 provoca el error “Duplicate, Google chose different canonical than user”
En el vertiginoso mundo del SEO, la indexación y visibilidad en los motores de búsqueda son piedras angulares para el éxito online. En este artículo, ahondaremos en un desafío técnico al que nos hemos enfrentado con uno de nuestros clientes: la problemática de la indexación y la desindexación de un sitio web (SPA) basado en client side rendering (CSR) únicamente, y sin ninguna solución server-side.
Desde hace algunos meses, un fenómeno constante ha sido motivo de preocupación para los expertos SEO que trabajamos para este cliente. Esta situación, caracterizada por ocasionar en Google Search Console el error «Duplicate, Google chose different canonical than user,» ha provocado la desindexación de varias páginas de la web del cliente. Debido a la devolución de errores Soft-404 en ciertas páginas, Googlebot no ve el contenido y considera la página en blanco como un duplicado de otras páginas que nada tienen que ver entre sí. Esto deja claro que Google efectivamente no es capaz de renderizar la página completa, y termina realizando un renderizado parcial sin el contenido completo.
Tabla de contenidos
Client-Side Rendering (CSR) y problemas de indexación
La esencia del problema se encuentra en la técnica de renderización del lado del cliente (CSR) que, en principio, no debería presentar ningún problema para Google. En este enfoque, gran parte del procesamiento y la renderización ocurren en el navegador del usuario a través de JavaScript. A pesar de sus ventajas, en términos de experiencia de usuario y agilidad, esta técnica introduce cierta fragilidad en el proceso.
El desafío central radica en los momentos en los que los scripts esenciales, como los de las cookies, no se cargan correctamente durante el proceso de renderización. Esto da lugar a una renderización parcial o incluso a páginas en blanco. En el caso de nuestro cliente, esto ha llevado a la aparición de «soft-404s», páginas que Google cataloga como duplicadas y que se indexan de manera diferente a lo que el usuario percibe.
El hecho intrigante es que este problema comenzó a manifestarse alrededor de mediados de junio en varios sitios web, incluyendo nuestro cliente. Esta anomalía ha llevado a la comunidad SEO a buscar las causas subyacentes. Sin embargo, el único denominador común que se ha observado es que los sitios web afectados comparten su fuerte dependencia de la renderización del lado del cliente (CSR).
La renderización parcial y los problemas de indexación pueden derivar de diversas fuentes. La velocidad de carga de los archivos JavaScript, tanto del lado del servidor como del lado de Google, puede influir en la renderización exitosa. Puntos finales de API que bloquean contenido, recursos que interfieren con la renderización, como los scripts de consentimiento de cookies, también contribuyen a esta situación.
Frecuencia de rastreo y código 304 (Not Modified)
Otro de los problemas a los que este cliente se enfrenta es la disminución en la frecuencia de rastreo de Google-bot en las páginas. Esto se atribuye a la respuesta constante del servidor con el código 304 SC (No modificado), lo que indica que el contenido no ha cambiado recientemente. El Google-bot tiende a almacenar en caché páginas que considera vacías, agravando así el problema.
¿Posibles soluciones?
En resumen, el fenómeno de desindexación en sitios web basados en CSR revela una preocupación creciente en la comunidad SEO.
La falta de una solución en el lado del servidor y la renderización parcial de contenido esencial han dado lugar a problemas de indexación y duplicidad de contenido. Además, este problema se manifiesta en diversas páginas web con la misma arquitectura técnica.
Entre nuestras soluciones principales están: priorizar la carga de scripts esenciales y la posibilidad de implementar renderización del lado del servidor (SSR or Pre-rendering). En un entorno en constante evolución, es imperativo abordar los desafíos técnicos para asegurar visibilidad y un rendimiento óptimo en los resultados de búsqueda.
A medida que el panorama digital continúa evolucionando, los profesionales de SEO y desarrollo web deben estar preparados para enfrentar desafíos técnicos complejos. La renderización parcial en sitios web basados en CSR y sus efectos en la indexación y duplicidad de contenido resaltan la importancia de soluciones equilibradas que consideren tanto la experiencia del usuario como los requisitos de los motores de búsqueda, cuyas directrices, en ocasiones, no se corresponden con la realidad. Y es que, aunque Google prefiera el server-side rendering, sostiene que no tiene problemas con sitios que utilicen client-side rendering. Sin embargo, ante esta situación, eso no parece totalmente cierto.
SEO: una asignatura multidisciplinar
En resumen, el enigma de la indexación y desindexación en sitios web de última generación pone de manifiesto la complejidad que subyace en el mundo digital.
La técnica de renderización del lado del cliente, las políticas de cookies y la mecánica de almacenamiento en caché de Google convergen en este desafío. A medida que seguimos adelante en busca de soluciones, se vuelve vital abordar estos problemas de manera integral y colaborativa.
Este enigma no solo sirve como recordatorio de la complejidad inherente al mundo digital, sino también de la importancia de la colaboración entre expertos en SEO, desarrolladores y especialistas en UX. Juntos, estamos equipados para resolver los desafíos más arduos y asegurar que nuestros clientes alcancen un máximo rendimiento en los resultados de búsqueda.
Contáctame y planifiquemos tu estrategia digital!
Puedes contactarme por teléfono, WhatsApp, enviándome un correo electrónico, o esperar a que me ponga en contacto contigo rellenando este formulario.
* Los datos serán tratados por el responsable de la web con la finalidad de establecer contacto, enviar información y promociones y con la legitimación por parte del cliente. Ver política de privacidad.