La búsqueda algorítmica de la calidad de los contenidos

Creo que debemos, antes de lanzarnos en la búsqueda algorítmica de la calidad de los contenidos, definir que es la calidad de los contenidos.

La calidad de los contenidos se refiere a la valoración de los materiales o información proporcionados a través de diversos medios, como textos escritos, videos, podcasts, etc., según ciertos criterios establecidos. Estos criterios pueden variar dependiendo del contexto y del propósito del contenido, pero generalmente incluyen aspectos como:

  1. Relevancia: El contenido debe ser pertinente y adecuado para tu audiencia objetivo. Debe abordar sus necesidades o intereses de manera efectiva.
  2. Exactitud: Debe ser preciso y verídico, libre de errores factuales. Esto es especialmente importante en contenidos educativos o informativos.
  3. Claridad y comprensibilidad: Debe ser fácil de entender para la audiencia a la que hables, utilizando un lenguaje y formato apropiados.
  4. Originalidad: Idealmente, el contenido debe ofrecer una perspectiva única o información nueva, no solo ser una repetición de lo que ya está disponible.
  5. Enganche: El contenido debe ser capaz de captar y mantener la atención del público. Esto puede lograrse a través de un buen storytelling, elementos visuales atractivos o interactividad.
  6. Valor agregado: Debe proporcionar valor a la audiencia, ya sea en forma de entretenimiento, información útil o soluciones a problemas concretos.

La evaluación de la calidad del contenido también puede considerar la autoridad y la credibilidad del autor o la fuente, la organización del contenido y la consistencia en el estilo y el tono. En resumen, un contenido de calidad es aquel que cumple con los objetivos propuestos de manera eficaz y satisfactoria para la audiencia deseada.

Surge entonces una verdadera pregunta: ¿Cómo podría Google detectar si un texto está redactado con talento? Quizás, de hecho, la pregunta está mal planteada.

Mientras trabajaba justamente en este contenido, leí una publicación esta semana que casi me dio un ataque al corazón, si la calidad no existe en absoluto, la “nulidad”, sí existe en este absoluto.

La calidad cotidiana

Sin duda, todos los días leemos algunos blogs, artículos, escuchamos podcasts, vemos vídeos en Youtube. De estas lecturas o escuchas, probablemente esperamos un pequeño algo…

Quizá esperamos, al llegar a un artículo, leer o escuchar un contenido que represente, para nosotros, cierta forma de calidad. Pero aún así, ¿qué es la calidad? Hablando de una calidad desde el ángulo de la utilidad.

¿Realmente podemos clasificar lo que es útil en la web y lo que no lo es?

No sé para ti, pero, en general, siempre siento un poco de arrepentimiento cuando, en retrospectiva, me doy cuenta de que perdí tiempo leyendo un artículo, un artículo que resulta ser totalmente inútil para mí. Sin embargo, todos tenemos tiempo que a veces aceptamos perder, porque ese momento, el que nos ofrecemos, constituye un descanso o un placer.

Cuando es voluntario, deseado, nuestro enfoque está bien establecido en la idea de perder un poco de tiempo. Es NUESTRA elección, desde el principio. De hecho, de manera inconsciente, una de nuestras razones es darnos la ilusión de que tenemos tiempo que PODEMOS perder… Es esta confirmación en el acto lo que va a constituir uno de los enriquecimientos que vamos a obtener.

En resumen, perder el tiempo en algunos casos, sí, pero al final, no sin una razón.

Volviendo a nuestras lecturas regulares de contenidos. Encontramos muchos contenidos inútiles en muchos sitios web saturados al estilo “sopa de letras”, contenido que supuestamente se genera con el objetivo de alimentar un blog sin ningún respeto por las personas (nota que dije “supuestamente” y no “probablemente”). Una persona que visita un contenido busca un enriquecimiento de valor. Generalmente una persona no va a buscar información vacía o que ya se haya publicado en todas partes. Buscará algo que sea propio del autor, información que eventualmente no exista en ningún otro lugar. Puede ser una idea, un punto de vista, una verdadera información nueva, humor también, pero en todos los casos, debe haber algo que sea “enriquecedor” en algún lugar para él, el lector.

El autor debe transmitir valor a sus lectores. El autor no debe pensar solo en sí mismo, hablo del egoísmo creativo en el episodio anterior con la danza de la creatividad, el autor no debe pensar sólo en su tráfico, también debe respetar a sus lectores, sean ocasionales o no. Sí, de acuerdo, publicar artículos en masa, todos los días, funciona en términos de tráfico.

Pero si es para no decir nada, el autor LE ROBA tiempo a la persona, y ese tiempo no le pertenece.

En mi opinión, o el autor realmente intenta aportar algo en un contenido, o que se calle el hocico y no publica nada… En mi opinión, nuevamente, un contenido que produce contenido sin interés, en masa, SPAMMEA la web. Es puro spam, nada más. Es un contenticidio.

De acuerdo, el diseño puede ser lindo, las frases con pocas faltas de ortografía… pero ¿dónde está el enriquecimiento de valor que se debe al lector?

¿Google puede eliminar de su índice estos contenidos sin sabor?

¿Se puede encontrar una solución algorítmica para eliminar estos contenidos insulsos?

Esto nos devuelve una vez más a estas nociones de calidad, preguntas tan intangibles y/o subjetivas. Sin embargo, te propongo mi enfoque de la calidad y te mostraré aquí que hay una esperanza de que un robot pueda detectar un texto sin interés. Una vez que podamos aprender de estos contenidos, podremos generalizar a otros casos.

¿Qué es la calidad de los contenidos?

Mi punto de vista sobre el spam varía un poco del de Google. En el fondo, me molesta menos que exista spam en algún lugar de la web donde nadie lo lea, excepto Google. Pero los contenidos, sí son leídos. Es muy molesto cuando el contenido producido no vale nada.

En cuanto a la forma de un contenido, Google ya puede detectar muchos contenidos de mala calidad. Pero una vez apartado el spam, ¿cómo definir lo que es un contenido de calidad en lo que queda? Esto se vuelve más complicado, al menos en apariencia. De hecho, en lugar de caracterizar lo que es un contenido de calidad, ¿un algoritmo puede detectar contenidos de “nulidad”?

Podríamos imaginar, por ejemplo, que todos los contenidos en la web son de calidad, excepto:

  • el spam (ya combatido por Google),
  • todos los contenidos nulos y carentes de cualquier interés.

Esta primera definición me parece bien.

Funcionamos en modo “todo menos”, eso ya puede servir como base de partida.

¿Por qué podría funcionar?

Esto podría resolver un problema crucial ya que, para juzgar la calidad de un contenido, ya no tendríamos que juzgar a la persona que lo lee. De hecho, un contenido, bien construido y bien desarrollado, desde el punto de vista del primer orden, también llamada lógica predicativa, puede ser de calidad para alguien que esté interesado en ese tema, pero no se va a percibir así para los que no les importe ese tema.

Entonces, si declaramos que este contenido es de calidad, estamos juzgando el valor a los que no les interesa este contenido, ya que eso equivale a decir que no les importa la calidad después de todo. Es muy molesto. Si, por el contrario, decimos que todo el contenido es de calidad, siempre y cuando al menos algunas personas lo encuentren interesante, cambiamos el enfoque y ya no juzgamos a las personas a quienes no les interesa el tema. Sabemos que a algunos les interesa, eso nos basta.

Mi propuesta es:

Todo el contenido es de calidad que no sea calificado como “inútil” por todo el mundo.

¿Qué es un contenido de mala calidad?

Un contenido, que encontré particularmente malo, trataba sobre una pseudo-crítica de estrategias SEO.

¿Por qué pienso que este contenido es malo?

  • El contenido comienza destacando al autor que ha hecho mejor que todos los demás en la temática. Presume, pero luego no da ningún elemento que permita verificar sus afirmaciones.
  • Habla de crítica, pero, en el fondo, apenas 250 palabras por cada estrategia SEO, es poco. No hay suficientes elementos para desarrollar ningún análisis. Se podría esperar más elementos y argumentos. Ahí, está muy descuidado.
  • Los subtítulos de los párrafos mencionan las URL de los sitios web, sin embargo, no hay enlaces a ellos. Hay varios enlaces a otros artículos del mismo autor en el mismo sitio. ¡Esto se parece tan poco al espíritu de la web!
  • Los comentarios del contenido están bloqueados por un sistema que requiere una cuenta registrada, lo que frena la interacción con el internauta, probablemente porque, al final, las opiniones de estos no importan para el autor de este contenido ya que solo busca ser el único en dar su opinión.
  • El autor no proporciona ninguna métrica sobre las 4 estrategias SEO, en ningún momento.
  • El autor no aborda la cuestión del tráfico orgánico real de cada uno de estos sitios web en ningún momento.
  • El autor nos dice que podría proporcionarnos una plétora de ejemplos de criterios de SEO, pero no da ninguno.
  • El autor no aborda la cuestión de la publicidad en las estrategias SEO, a pesar de ser un tema espinoso…
  • El autor censura cualquier opinión que sea demasiado contraria a la suya.

Al final, nos damos cuenta de que este contenido es finalmente un ajuste de cuentas con ciertas estrategias SEO, un verdadero Troll. El Troll es la forma más despreciable de atraer audiencia sin necesidad de tener neuronas… Pero, ¿por qué no aprovechar este contenido para transmitir algunas pequeñas cosas importantes al lector? ¿El autor solo quiere una tribuna y que pena para los lectores? Además, ni siquiera menciona mi súper estrategia del Mínimo SEO Viable, ¿no es sospechoso, verdad? (estoy bromeando ;-))

Cualquiera que sea el tipo de lectores (propietarios de sitios, especialistas SEO o agencias SEO), no se puede sacar nada de este artículo, supuestamente crítico. La broma, en relación con nuestro tema, es la última frase del contenido: “Animar a los autores a proporcionar un contenido atractivo.” JAJAJAJAJA Lamentablemente, este contenido no es un caso aislado…

Detección algorítmica de la nulidad

¿Una computadora puede detectar un contenido si este contiene elementos que caracterizan a los artículos malos?

¿Podemos utilizar, por ejemplo, los factores de clasificación para lograr nuestros objetivos?

El boletín de “El Placer del SEO” puede ofrecer algunas pistas sobre cómo abordar las cosas. Inscríbete con sus 6000 seguidores 😉

Por supuesto, con factores de calificación o sin ellos, tenemos una buena cantidad de modelos muy malos de todo tipo. Esto es aún más fácil dado que los autores de contenidos insípidos no están interesados, por definición, en lo que escriben. Al hacerlo, sus propósitos no es defensivo con este punto de vista, porque escriben sin pensar… Dejan numerosos indicios… ¡es práctico! 😉

Pero, y este es un concepto importante de entender, no necesitamos una computadora para poder entender lo que sea. Este es un falso problema. Sólo queremos que llegue a las mismas conclusiones que nosotros. Esto es cierto en IA, pero en general, en algoritmia.

Por eso, si, humanamente, podemos distinguir de manera absoluta lo que es de baja calidad o no, solo necesitamos pasar estos modelos a un algoritmo para que aprenda a detectar otros casos de baja calidad. El algoritmo no entiende lo que hace, pero está “diseñado” para dar los mismos resultados que los del ser humano. No nos faltan algoritmos en stock. Solo queda seleccionar el que sea más práctico en este caso, eso es todo. Estoy exagerando un poco, pero no tanto: hay que saber que con una gran cantidad de ejemplos y un algoritmo poco desarrollado, se obtienen más resultados que con un algoritmo muy bien diseñado, pero que tiene menos ejemplos.

Dado que la nulidad está bastante extendida en la web, ¡eso nos da bastantes esperanzas! Es solo una cuestión de voluntad por parte de Google.

La última palabra de este contenido (pero no la conclusión)

Los 3 mensajes que quiero transmitir en este contenido (que, espero, no sea nulo ;-)):

  • La web merece algo más que contenidos, sin interés, producidos en masa: hay que brindar valor a los lectores.
  • La cuestión de la calidad de los contenidos puede abordarse desde el ángulo “Es de calidad todo lo que no es inútil para al menos algunos lectores”.
  • Un algoritmo puede detectar diversos escenarios, pero no necesita funcionar como nosotros para lograrlo. Un algoritmo no piensa, no lo necesita. Pero puede llegar a las mismas “deducciones” que nosotros, sin necesidad de ninguna forma de pensamiento…

Un extra para el camino para los que todavía no se fueron: un algoritmo también puede actuar y adaptarse a un entorno en movimiento o incierto… un poco como los virus biológicos. Y, con los avances que se están haciendo, cada vez es más frecuente que el algoritmo gane.

Sin embargo, los algoritmos son idiotas porque no son conscientes de su “inteligencia”…

Te dejo reflexionar sobre eso…