Cloaking, el arte de engañar a Google

Hoy vamos a desvelar una técnica black hat que aunque años atrás pudiera funcionar bien, hoy es más difícil engañar a Google y puedes caer en una penalización por usarla.

Aunque más allá de engañar a Google, la técnica de cloaking nos puede ser útil para mostrar contenido a un usuario y ocultarlo a otro, tenemos muchas opciones a la hora de segmentar usuarios, incluso puede haber razones legítimas para usar cloaking. 

¿Qué es el cloaking?

La técnica de cloaking es muy sencilla, consiste en mostrar distinto contenido a GoogleBot y a los usuarios, es decir, si yo entro desde mi navegador a la web encontraré un contenido y si el robot de Google la rastrea encontrará otro.

Al ser una técnica black hat y que trata básicamente de engañar a Google, ni qué decir tiene que infringe las directrices de calidad para Webmasters de Google, y que hacer uso de esta técnica puede resultar en una penalización para el dominio que uses. 

¿Qué no es cloaking?

A veces, hay usuarios que pueden estar confundido con esto del cloaking y creen que si muestras a Google una versión móvil adaptada (algo distinta de la desktop) a los visitantes desde dispositivos móviles y una versión desktop al resto de usuarios podrías estar haciendo cloaking.

No, este tipo de «segmentación de usuarios» no es cloaking, ya que no ocultamos contenido a los rastreadores, Google con su rastreador móvil podrá acceder al contenido completo de la versión móvil y con su rastreador desktop podrá acceder al resto de contenido, entendiendo que se trata de versiones móvil y desktop.

Como tampoco lo es redireccionar a los usuarios en un sitio multi idioma a la página adaptada al idioma especificado por la cabecera de su navegador. 

Utilidades del cloaking

Existen muchas situaciones en las que el cloaking puede ser útil, aunque hoy en día es difícil hacerlo funcionar sin que Google lo detecte, aún hay técnicas avanzadas para hacerlo.

Mostrar publicidad a los usuarios y no a Google

Que a Google no le gusta que abusemos de la publicidad en las páginas es algo que todos sabemos, cuando salió la actualización del algoritmo Google Page Layout (Ads Above The Fold), Google anunció que las páginas que abusaran de la publicidad en el espacio «Above the fold» (encima del pliegue) la primera parte de una página web que vemos, verían su posicionamiento perjudicado.

En ese caso, podrías usar el cloaking para mostrar a Google una versión de la página web sin anuncios y otra versión de la página web con muchos anuncios que sería la que finalmente verían los usuarios que accedieron a nuestra web. 

Keyword Stuffing

Otra técnica casi obsoleta, pero que estuvo muy ligada al cloaking en su día es la de keyword stuffing, esto es hacer un uso abusivo de palabras clave en nuestra web.

Antes de la llegada de Panda usar de forma indiscriminada keywords en tus textos podría mejorar tus rankings, con la llegada de la actualización del algoritmo, esta técnica pasó a estar penalizada, por eso algunos webmasters combinaban la técnica de keywords stuffing + cloaking, para mostrar el contenido sobre optimizado a Google y el contenido normal a los usuarios. 

Cómo hacer cloaking

Tenemos muchas opciones para hacer cloaking, la más básica simplemente tiene en cuenta el user-agent del visitante, por ejemplo, en el caso de Google (GoogleBot) es el siguiente: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Otros user-agent de rastreadores de Google:

  • Googlebot-Image/1.0
  • Googlebot News
  • Googlebot-Video/1.0AdsBot-Google (+http://www.google.com/adsbot.html)
  • FeedFetcher-Google; (+http://www.google.com/feedfetcher.html)
  • Mozilla/5.0 (Linux; Android 5.0; SM-G920A) AppleWebKit (KHTML, like Gecko) Chrome Mobile Safari (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)

Así, simplemente, a aquel visitante que tenga ese user-agent le mostraremos el contenido «encubierto» y al resto de usuarios le mostraremos otro contenido.

También podemos hacerlo por dirección IP, si sabemos que los rastreadores usan determinada IP, podemos añadirla a una «lista negra» y mostrar contenido distinto si el visitante tiene alguna de esas direcciones IP.

Otra de las formas utilizadas (aunque ya tiene menos eficacia) a la hora de engañar a los rastreadores es hacer redirecciones mediante JavaScript, los usuarios pueden interpretarlo y seguir la redirección mientras que los robots no y no podrían acceder a la versión final del documento. 

¿Cómo detecta Google el cloaking?

Google ha considerado desde siempre el cloaking como una técnica engañosa, cualquier tipo de cloaking está penalizado, porque entiende que no hay motivo para ocultar contenido a Google y mostrarlo al usuario, no quiere que el usuario acceda a contenido que ellos no han podido revisar.

Es simple, imagina que una página que hace cloaking, muestra al robot de Google un texto hablando sobre la Historia de España pero realmente el contenido que muestran a los usuarios es pornografía, si un usuario busca algo acerca de la Historia de España, Google le puede devolver la página de cloaking como resultado y al acceder encontrarse con contenido pornográfico.

Esto perjudica de forma terrible la experiencia de usuario y es algo por lo que Google lucha por mejorar a diario, es por esto, que las técnicas de cloaking están muy perseguidas. 

¿Cómo saber si estoy haciendo cloaking?

Aunque es raro que esto suceda, Google en su versión antigua de GSC (Google Search Console) puso a nuestro servicio una función que nos permitía examinar nuestra web como si fuéramos GoogleBot y ver el contenido que obtenía.

Ahora, con la función rastrear URL también podemos ver la versión final a la que accede el rastreador de Google en nuestra web, ver errores que haya generado, elementos a los que no pueda acceder, etc …

Ir arriba