Analizando la Calidad del Contenido con Ratios de Compresión en WordPress

En nuestros esfuerzos de SEO, siempre buscamos formas innovadoras de evaluar la calidad de las páginas. Recientemente, un artículo en Search Engine Journal nos hizo reflexionar sobre un enfoque único: utilizar los ratios de compresión como una señal de contenido de baja calidad. Inspirados por este concepto, así como por un estudio de investigación de 2006 sobre detección de spam, y en particular por el artículo de Go Fish Digital que exploraba esta idea, decidimos investigar si la compresibilidad de una página podría revelar posibles problemas de calidad en nuestro propio sitio.

Para probar esta idea, desarrollamos un plugin para WordPress llamado Content Quality Analyzer. La idea básica es que las páginas con contenido redundante o de bajo valor tienden a comprimirse más que las páginas de alta calidad e informativas. Este contenido redundante o de bajo valor a menudo aparece en páginas spam o en contenido SEO de baja calidad.

Entendiendo los Ratios de Compresión como Métrica de Calidad

La teoría es simple: los algoritmos de compresión como gzip reducen el tamaño de los archivos eliminando datos redundantes. Si una página se comprime significativamente, probablemente contiene mucho contenido repetitivo o de relleno. Según la investigación que revisamos, los altos ratios de compresión pueden indicar páginas de menor calidad o spam, ya que a menudo contienen frases repetidas, exceso de palabras clave o contenido general de “relleno”. Al medir este ratio, podemos identificar páginas que podrían estar afectando la calidad general de un sitio.

El Plugin Content Quality Analyzer

¿Qué Hace el Plugin?

El plugin Content Quality Analyzer analiza la calidad del contenido al editar productos, publicaciones o páginas en WordPress. Omite etiquetas HTML, shortcodes y URLs para centrarse en el contenido textual principal y muestra los resultados del análisis debajo del editor. Además, guarda los resultados en un archivo CSV para un seguimiento y análisis posteriores.

Funcionalidades Principales

  1. Cálculo del Ratio de Compresión: Mide el tamaño original del contenido y su versión comprimida utilizando gzip, calculando así el ratio de compresión.
  2. Análisis de Palabras y Frases:
    • Total de Palabras: Cuenta el número total de palabras en el contenido.
    • Palabras Repetidas: Identifica las palabras que se repiten más de 10 veces.
    • Total de Frases: Cuenta el número total de frases en el contenido.
    • Bigramas y Trigramas Repetidos: Identifica combinaciones de dos y tres palabras que se repiten frecuentemente.
  3. Promedios de Longitud:
    • Longitud Promedio de Frases: Calcula el promedio de palabras por frase.
    • Longitud Promedio de Palabras: Calcula el promedio de caracteres por palabra.
    • Sílabas por Palabra: Calcula el promedio de sílabas por palabra para evaluar la legibilidad.
  4. Puntuaciones de Legibilidad:
    • Flesch Reading Ease: Evalúa la facilidad de lectura del contenido.
    • Flesch-Kincaid Grade: Determina el nivel de grado necesario para comprender el contenido.
    • Índice Gunning Fog: Mide la complejidad del texto.
  5. Evaluación de la Calidad: Basado en los umbrales configurables, el plugin determina si el contenido es de baja calidad y proporciona razones específicas.
  6. Interfaz de Usuario Mejorada: Muestra los resultados en una tabla colorida dentro del editor y ofrece una página de configuración para ajustar los umbrales de calidad.

Implementación del Ratio de Compresión en WordPress

Desarrollamos el plugin utilizando PHP, integrándolo con los hooks de WordPress para analizar el contenido cada vez que se guarda una publicación. A continuación, se detalla el flujo de trabajo del análisis:

  1. Extracción del Contenido: Se extrae el contenido de la publicación, omitiendo etiquetas HTML, shortcodes y URLs.
  2. Cálculo del Ratio de Compresión: Se comprime el contenido utilizando gzip y se calcula el ratio de compresión.
  3. Análisis de Texto: Se realiza un análisis detallado del contenido, incluyendo la identificación de palabras y frases repetidas, y el cálculo de promedios de longitud y sílabas.
  4. Puntuaciones de Legibilidad: Se calculan las puntuaciones de legibilidad para evaluar la facilidad de lectura del contenido.
  5. Evaluación y Almacenamiento: Basado en los umbrales configurados, se evalúa la calidad del contenido y se almacenan los resultados tanto en el meta de la publicación como en un archivo CSV para futuros análisis.

Personalización y Configuración

El plugin permite a los usuarios ajustar los umbrales de calidad directamente desde el panel de administración de WordPress. Esto incluye:

  • Umbral de Ratio de Compresión: Definir el punto a partir del cual el contenido se considera de baja calidad.
  • Umbral de Flesch Reading Ease: Ajustar la puntuación mínima de facilidad de lectura.
  • Umbral de Flesch-Kincaid Grade: Definir el nivel de grado máximo permitido.
  • Tipos de Publicaciones Adicionales: Seleccionar otros tipos de publicaciones personalizadas que el plugin debe analizar.
  • Patrones a Ignorar: Especificar expresiones regulares para ignorar ciertas partes del contenido durante el análisis.

Mejoras y Optimización

Para garantizar que el plugin funcione de manera eficiente y precisa, implementamos varias mejoras:

  • Caché de Resultados: Almacena en caché los resultados del análisis para reducir la carga del servidor.
  • Bloqueo de Archivos CSV: Evita la corrupción de datos al asegurar que solo un proceso pueda escribir en el archivo CSV a la vez.
  • Compatibilidad con Gutenberg: Integra el análisis de calidad directamente en el editor Gutenberg, proporcionando una experiencia más fluida.
  • Internacionalización: Soporta múltiples idiomas, permitiendo a los usuarios traducir las etiquetas y mensajes según sus necesidades.
  • Depuración y Logs: Añade registros detallados que facilitan la identificación de problemas durante el desarrollo y uso del plugin.

Beneficios de Utilizar Ratios de Compresión para Evaluar la Calidad del Contenido

El uso de ratios de compresión como métrica de calidad ofrece varios beneficios:

  • Identificación Rápida de Contenido Redundante: Facilita la detección de contenido repetitivo o de relleno que puede afectar negativamente la experiencia del usuario y el SEO.
  • Optimización de Recursos: Ayuda a optimizar el contenido para una mejor compresión y tiempos de carga más rápidos.
  • Mejora de la Legibilidad: Al identificar contenido de baja calidad, se pueden realizar mejoras para hacer que el contenido sea más claro y accesible.
  • Monitoreo Continuo: Permite un seguimiento constante de la calidad del contenido a lo largo del tiempo, identificando rápidamente cualquier deterioro.



Corregir textos mediante GPT

Además, hemos creado un asistente basado en ChatGPT que permite mejorar el contenido de manera efectiva. Este asistente analiza los valores generados por el plugin, como:

  • Flesch Reading Ease: ❌ 13.97
  • Flesch-Kincaid Grade: ❌ 16.78
  • Índice Gunning Fog: ❌ 21.19

Al copiar estos valores y el texto correspondiente, el asistente sugiere mejoras para optimizar la calidad del contenido. Sin embargo, recomendamos hacerlo utilizando herramientas como ChatGPT Canvas con el siguiente prompt estructurado para obtener resultados efectivos:

Simplificar las oraciones
Acción: Divide las oraciones largas en oraciones más cortas.
Por qué: Los índices de legibilidad penalizan el uso de frases complejas.
Ejemplo:

Original: "Debido a la complejidad del tema, es imprescindible analizar múltiples variables antes de llegar a una conclusión definitiva."
Simplificado: "El tema es complejo. Es importante analizar varias variables antes de tomar una decisión."
Usar palabras más simples
Acción: Sustituye palabras largas o técnicas por términos más comunes.
Por qué: Los textos más accesibles evitan vocabulario complicado.
Ejemplo:

Original: "Implementar estrategias heurísticas para optimizar procesos es esencial."
Simplificado: "Usar estrategias prácticas para mejorar procesos es clave."
Eliminar palabras innecesarias
Acción: Elimina redundancias o frases que no aporten información relevante.
Por qué: Los textos claros suelen ser más directos.
Ejemplo:

Original: "Es absolutamente necesario considerar todos y cada uno de los factores involucrados."
Simplificado: "Es necesario considerar todos los factores."
Usar párrafos más cortos
Acción: Divide los párrafos largos en bloques más pequeños.
Por qué: Los párrafos cortos facilitan la lectura y comprensión.

Evitar jerga técnica
Acción: Define o evita términos técnicos si no son imprescindibles.
Por qué: La jerga puede dificultar la comprensión para una audiencia general.
Ejemplo:

Original: "El protocolo TCP/IP establece un conjunto de reglas que rigen las comunicaciones en redes digitales."
Simplificado: "Las redes digitales usan reglas como TCP/IP para comunicarse."
Incluir ejemplos concretos
Acción: Añade ejemplos que aclaren conceptos abstractos.
Por qué: Los ejemplos facilitan la comprensión.
Ejemplo:

Original: "El texto es difícil de leer."
Simplificado: "Este texto, con frases de más de 30 palabras y términos técnicos, es complicado de entender."
Evitar la voz pasiva
Acción: Cambia las construcciones en voz pasiva por voz activa.
Por qué: La voz activa hace el texto más dinámico y claro.
Ejemplo:

Original: "El informe fue escrito por el equipo de investigación."
Activa: "El equipo de investigación escribió el informe."
Utilizar conectores sencillos
Acción: Usa palabras como "y", "pero", "porque" en lugar de términos más complejos como "no obstante".
Por qué: Los conectores sencillos hacen el texto más fluido.

Revisar con herramientas de simplificación
Acción: Utiliza herramientas como Hemingway App o el corrector de legibilidad de Microsoft Word.
Por qué: Estas herramientas identifican frases complicadas o palabras difíciles.

Finalmente, también puedes consultar un asistente especializado que hemos desarrollado para corregir y optimizar el contenido directamente desde la plataforma de ChatGPT. Visita este enlace para obtener acceso al Optimizador de Contenido SEO. Este asistente está diseñado específicamente para mejorar textos según las mejores prácticas de SEO y legibilidad.

Deja un comentario