Porqué el thin content puede arruinar tu proyecto

Google no deja de ser una máquina, un software que necesita contenido, datos para poder procesar, sin esos datos no hace nada. Y lo que es peor, sin contenido tu web no podrá posicionar en los buscadores.

El rastreador de Google (Googlebot) procesa a diario una ingente (para los de la LOGSE, enorme, mi pequeño tributo al humorista Goyo Jimenez) cantidad de datos, tiene información más que suficiente para detectar contenido de buena calidad y contenido de mala calidad, además se ayuda de métricas que nosotros desde Google Analytics le facilitamos.

Estas métricas que miden la experiencia de usuario en nuestra web pueden hacer saltar las alarmas a Google sobre la mala calidad de nuestro contenido.

  • Tasa de Rebote -> Define el porcentaje de gente que entra en tu web y se va sin realizar ninguna acción, una tasa de rebote alta no significa que sea mala, puede ser que el usuario resolvió la duda simplemente.
  • Pogo Sticking -> El pogo sticking guarda relación directa con una tasa de rebote alta.
  • Dwell time -> Mide el tiempo que el usuario para en su web consumiendo el contenido que buscó en Google antes de salir.

 

¿Qué es el thin content?

Entendemos el thin content o contenido de mala calidad como aquel contenido que no es capaz de solucionar la duda que el usuario tenía antes de entrar a nuestra web.

Esto no guarda relación con la cantidad de palabras de un texto, ni con la maquetación… sino con el mensaje final del contenido, la calidad del mismo y la capacidad del redactor para transmitir la información.

Google no quiere tener indexadas miles de millones de URLs que no aporten nada al usuario, por eso o bien las rastrea y no las indexa o bien las indexa pero no las llega a posicionar.

 

Tipos de thin content

Tener problemas de thin content en tu web suele ser la mayoría de las veces de forma involuntaria, algunos clientes que han llegado a mi buscando posicionar su web no eran conscientes de este problema que lastraba de forma grave su posicionamiento.

Conseguir detectar este tipo de contenidos y darle una solución efectiva repercute de forma directa en los rankings de las páginas webs afectadas y el tráfico se dispara rápido hacia arriba.

 

Paginaciones – Este tipo de páginas son muy comunes y aparecen en cualquier blog que tenga algo de contenido, se crean páginas del tipo ?page=1, ?page=2…. y son páginas que no aportan nada al usuario, simplemente un listado de entradas, que además pueden generar contenido duplicado, si la paginación general 1 coincide con las entradas de la categoría «Recetas» por ejemplo.

A continuación os muestro un listado de las páginas en riesgo de thin content realizado con la herramienta Safecont (que analizaré más abajo), te puedes dar cuenta que las primeras URLs que aparecen son las de categorías, porque son páginas, que si además no tienen entradas o muy pocas, el contenido de similaridad puede ser muy alto.

Análisis de páginas de categorías en Safecont
Análisis de páginas de categorías en Safecont
 Solución : si usas plugins como Rank Math puedes poner estas páginas como NOINDEX, evitando que Google las tenga en cuenta.

URLs parametrizadas – Muy comunes en los ecommerce, este tipo de URL suelen incluir filtros de búsqueda, buscadores faceteados, etc… que generan URLs muy similares que no aportan contenido de valor al usuario, simplemente modifican parámetros de búsqueda, resultando en cientos o miles de URLs muy similares que no queremos que Google rastree e indexe.

Ej:

https://mitienda.com/zapatos/mujer
https://mitienda.com/zapatos/mujer?talla=37
https://mitienda.com/zapatos/mujer?talla=37&color=marron
https://mitienda.com/zapatos/mujer?talla=37&color=marron&marca=Prada
https://mitienda.com/zapatos/mujer?talla=37&color=marron&marca=Prada&precio=300

Como ves esas 5 páginas tendrán contenido muy similar y a Google no le va a ayudar ya que no aportan contenido original y fresco, esas urls parametrizadas como norma general deberían no ser indexadas por Google.

 Solución : Desde GSC puedes eliminar estas URLs con parámetros, también desde WP puedes configurar que no se indexen.

 

Tags – Antes era raro en internet la web que no tenía la famosa «Nube de tags», un widget que en realidad no aportaba valor ninguno al usuario, se colocaban más bien para generar URLs con esas keywords y tratar de posicionar más… hasta que Google se cansó, hoy en día no sirven para nada más que crear páginas con contenido de baja calidad y crearnos dolores de cabeza.

 Solución : No uses tags o etiquetas en tu web y en caso de hacerlo siempre con noindex, nofollow.

 

Contenido automático – Hay muchas formas de crear contenido automático, espineado, traducciones, inteligencia artificial… lo que se busca es crear contenido «más o menos legible» que los rastreadores se lo traguen como contenido original, a los usuarios les puede chirriar un poco, pero si compran en Amazon con las descripciones que ponen los vendedores chinos te habrás dado cuenta que a veces el contenido mal redactado y mal traducido posiciona.

 Solución :Si vas trabajar con contenido automático, hazlo bien 🙂

 

Contenido plagiado – El contenido que menos trabajo requiere para conseguir, basta con ir a otra web, copiar el texto y publicarlo en la tuya, así en bruto. Existen técnicas más elaboradas que espinean, modifican o alteran ligeramente ese texto para que su % de similaridad se reduzca y pueda parecer contenido original a los ojos de Google.

Pero en definitiva no deja de ser contenido copiado de otra web y utilizado en la nuestra, aunque tratemos de «maquillarlo» Google entiende cada vez mejor la semántica de los textos y trabaja cada día para evitar este tipo de acciones.

 Solución : no uses este tipo de contenido, además de ser poco ético y moral por aprovecharte del trabajo de otros, no suele tener buen resultado.

Webs de afiliados – A pesar de lo que mucha gente piensa, Google no está en contra de las webs de afiliados, siempre que el enlace de afiliado le aporte valor al usuario. Google sabe si un usuario está buscando comprar un producto, si tu le facilitas una tabla comparativa con datos útiles y le reenvías a un enlace de afiliado está genial.

Si por el contrario le añades contenido y descripciones del producto, duplicada en otras webs, que no aportan nada de valor al usuario.. y le colocas 60 enlaces de afiliado salientes en una sóla web, tienes demasiado lastre para subir esa web al TOP1.

 Solución : Ten en mente siempre la necesidad del usuario y no coloques enlaces de afiliado al azar.

 

Problemas asociados al thin content

❌ El primero y más invisible de los problemas es que te hace perder dinero, dinero que podrías estar ganando si tu web estuviera bien posicionada, te hace perder el tiempo, mientras tu competencia se está haciendo un hueco en el mercado tu web está lastrada en crecimiento.

Elevar tasa de rebote – Es lo más lógico, ¿no? Si alguien entra a tu blog buscando respuesta a una pregunta y lo que encuentra no resuelve en absoluto su duda, lo normal es que vuelvan al buscador y vaya a otro resultado, eso es una señal clara para Google de que tu web no gusta a los usuarios.

Una tasa de rebote alta no siempre es mala señal, y por sí misma no debería preocuparnos, aunque podemos trabajar para mejorarla, pero si un usuario entra a nuestro artículo, permanece 2 o más minutos y sale puede haber resuelto su duda simplemente.

Gasto crawl budget – Si no conoces qué es el crawl budget, es el tiempo que Googlebot asigna a cada web para rastrear sus páginas (puede aumentar dependiendo de la autoridad de la página), por lo tanto, evitar que Google pierda el tiempo en páginas inútiles (como FAQs, Quiénes Somos, Política de Privacidad, etc…) mejorará la velocidad a la que Google encuentra nuestro contenido.

❌ Problemas de indexación – Este es un problema asociado precisamente al anterior, al gastar el crawl budget de nuestra web (lo asigna Googlebot) en páginas con thin content, si la relación de este contenido es mayor que las páginas realmente valiosas, no quedará tiempo de recorrer e indexar éstas últimas páginas.

Mala imagen – Si tu blog representa una empresa o marca, la impresión que se llevará el usuario no será todo lo buena que debería y si estás tratando de fidelizar a tus clientes vas por el camino equivocado.

❌ Posicionamiento – A la larga, los factores anteriores desencadenarán en un posicionamiento bajo de la web, de un rendimiento mucho menor de lo que podría hacer con un contenido bien trabajado.

 

Cómo solucionar el thin content

Al final de todo el artículo te doy una solución 100% efectiva para acabar con el thin content, pero ojo, no todo el mundo podrá llevarla a cabo, sigue leyendo y sabrás por qué.

Mi mejor recomendación es tener en cuenta los puntos anteriores de acabar con páginas «problemáticas» como paginaciones, urls parametrizadas, etc… desindexar páginas afectadas con thin content en Google Search Console, optimizar aquellas páginas con contenido de calidad y bien estructurado.. y.. esperar.

✅ Herramientas específicas

Problemas difíciles necesitan soluciones drásticas, este tipo de herramientas no son baratas pero te ahorrarán muchas horas de tu tiempo (y eso es mucho dinero!) además de darte indicaciones concretas sobre el problema que afecta a tu web.

Safecont

La herramienta referencia en este campo (al menos en español), Safecont te permite realizar un análisis semántico y de similaridad del contenido de tu web permitiendo mantener la máxima calidad y mantenerte a salvo de penalizaciones.

Safecont es la herramienta de referencia en cuanto al análisis de la calidad de nuestro contenido, no es algo que se haga a diario, pero siempre está bien tenerla a mano para poder revisar casos concretos de webs con contenido de baja calidad.

Una de las funciones que más me gusta al trabajar con Safecont es el historial de los análisis del dominio que realiza, de forma que es muy sencillo saber si estamos trabajando en la dirección correcta o no, como véis ese dominio ha pasado de tener un valor de riesgo de casi 50 a menos de 25, la mitad, no es que haga dos años (por las fechas) que no toco el dominio, sino que no he vuelto a realizar ningún análisis.

 

Dashboard de Safecont
Dashboard de Safecont

Desde el panel de control tienes una vista global del estado del contenido de tus proyectos, riesgo de penalización, similaridad, thin content o contenido duplicado (externo).

 

✅ Herramientas generales

No están pensadas para resolver problemas de thin content de forma específica, pero podemos aprovechar alguna de sus funcionalidades en nuestro favor para detectar y solucionar problemas con el contenido de nuestra web, vamos a ver cuáles son y cómo utilizarlas.

GSC (Google Search Console)

Gracias a Google Search Console podemos detectar de forma sencilla URLs o páginas de nuestra web que pueden estar afectadas por contenido de baja calidad o thin content, en la sección de Cobertura podemos encontrar un listado de las URLs de las que Google tiene constancia de nuestra web, las que puedan estar marcadas com «thin content» estarán marcadas en la sección de:

Rastreada: actualmente sin indexar

Eliminar URL

Si quieres que las URLs afectadas de thin content desaparezcan de forma inmediata de las SERPs, Google pone a tu disposición una herramienta muy práctica que te permite desde el panel de control de Google Search Console > Retirada de URLs añadir URLs de forma individual o que coincidan con una ruta eliminar aquellas URLs que indiques.

 

✅ Consejos SEO On Page

Robots.txt – Gracias al archivo robots.txt (recuerda que debes crearlo en la raíz) podemos indicar a Google (y otros buscadores) que queremos bloquear URLs con thin content, para que no las tenga en cuenta, no las indexe y no afecten de forma negativa a nuestro posicionamiento.

Muy útil si tienes páginas con poco contenido que no quieres eliminar o que vas a ir mejorando de cara al futuro.

Etiquetas nonidex – Esta etiqueta nos permite de forma individual evitar que Google indexe esa página que tenemos con contenido pobre y que no queremos eliminar.

Etiquetas nofollow – Evita que Google siga ese enlace y vaya a páginas con contenido de baja calidad.

 

✅ Crea contenido de calidad

Si no quieres andar con parches, buscando contenido de mala calidad en tu sitio, analizando las URLs que Google rastrea pero no indexa y en definitiva dando cabezazos porque tu proyecto no termina de despegar, déjame darte un consejo que dará solución 100% definitiva al problema del thin content: crea contenido de calidad.

Sí, pero es que eso lleva mucho tiempo.. solución: contrata un servicio de redacción

Sí, pero es que eso es muy caro solución: redacta tú el contenido!

Sí, pero es que eso lleva mucho tiempo… WTF! Si tratas tu web como un negocio (lo que es o debería ser!), requerirá tiempo o dinero, yo llevo muchos años en internet y créeme que a la larga no existen fórmulas mágicas ni atajos.

 

4 comentarios en “Porqué el thin content puede arruinar tu proyecto”

  1. Victor excelente contenido que permite aclarar a los que comenzamos es este mundo de las páginas web y seo. Lo mejor es desde el principio crear tu web sin tanta basura que luego de acumulada es más difícil sacarla y ya ha hecho daño a nuestro posicionamiento.

    Gracias.

  2. Gracias por el artículo, Completísimo y muy práctico. De lo.mejor en cuanto a encontrar contenido de mala calidad. Por aportar algo nosotros utilizamos DinoRank. Es más barato que Safecont aunque no sé si mejor o peor.

  3. En nuestra web la mayoría de las entradas son diarios de actividades pasadas . Artículos de contenido «evergreen» propiamente dicho habrá 25 y páginas comerciales otras 20. ¿Conviene desindexar 300 páginas que no interesan a las personas que buscan ahora a pesar de dejar la web con 50 entradas/páginas? Por un lado es «thin content» pero por otro lado está relacionado.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba