Aunque todos los sitios web tienen que luchar contra el contenido duplicado en algún momento (sobre todo dentro de un mismo sitio), los sitios de e-Commerce están especialmente expuestos a este fenómeno. Aquí tienes un recordatorio de los principios fundamentales con algunas reflexiones sobre el contenido duplicado en los sitios de comercio electrónico y soluciones para evitarlo en la medida de lo posible.
Veremos la definición de contenido duplicado, por supuesto, pero también su impacto (y más particularmente en los sitios de comercio electrónico), así como los remedios y herramientas para luchar contra él. En resumen, un pequeño resumen de lo básico que necesitas saber sobre el tema.
Y si quieres saber mucho más te dejo un buen complemento para saber todo sobre el contenido duplicado con sus tipologías, algoritmos y métodos de optimización.
El virus del contenido duplicado
¿Qué es el contenido duplicado?
Son contenidos que son (demasiado) similares y accesibles en URLs diferentes. Puede ocurrir entre varias páginas de un mismo sitio o cuando un sitio copia tu contenido o viceversa.
Efectos nefastos para tu sitio web
- 1. Una dilución de su popularidad
Los beneficios de tus backlinks se va a diluir entre diferentes URLs.
- 2. Un desperdicio del Crawl Budget
Los robots de Google perderán el tiempo rastreando contenidos irrelevantes.
- 3. Una colosal pérdida de tiempo
La corrección de estos problemas lleva mucho tiempo.
El comercio electrónico resultó especialmente afectado.
El filtrado
Nuevas URLs generadas para cada color, tamaño, etc.
La paginación
Metadatos idénticos y URLs diferentes para un mismo contenido.
Las descripciones
Descripciones comunes entre sitios que utilizan los mismos proveedores.
La versión para imprimir o pdf
Otra versión de la página que es muy similar.
Las categorías
Contenido duplicado si el producto se encuentra en varias categorías.
Las sesiones ID
Identificadores de sesión asignados a cada nuevo visitante, presentes en las URL.
Posología contra el contenido duplicado
Herramientas para detectar el contenido duplicado
- Screaming Frog para las metas duplicadas.
- Siteliner para el contenido interno duplicado.
- Copyscape o Plagium para el contenido duplicado externo.
¿Qué remedios?
- La etiqueta canónica para definir qué página es la oficial y qué páginas son “duplicadas”.
- Las redirecciones 301 para dirigir las antiguas URLs indexadas a las nuevas.
- El dominio preferencial – Elegir y configurar correctamente las variantes de dominios (http, https, con o sin www) para evitar el contenido duplicado.
- El NoIndex para evitar que los motores indexen los contenidos duplicados.