.
Analistas 08/09/2022

¿Tatequieto de Google al ‘robo’ de contenido?

Guillermo Franco
Periodista consultor en medios y contenidos digitales

Luego de años de satanizar la llamada ‘agregación’ de contenido, la mayoría de los sitios web de medios colombianos terminaron adoptándola, lo que pondría en riesgo su tráfico ante recientes anuncios hechos por Google.

Para entender el impacto que tendrán esos anuncios es necesario aclarar términos, cuyo significado solo entienden algunos que se mueven en el negocio de los medios.

El término ‘agregación’ es utilizado para rotular y empaquetar diferentes tipos de actividades y, dependiendo de quién lo use, puede significar cosas diferentes.

El concepto se puede sobresimplificar y decir que el denominador común de esas actividades es el uso de contenido de terceros.

Así, por ejemplo, el Centro Berkman Klein para Internet y Sociedad (PDF), de la Universidad de Harvard, dice que “en su forma más básica, un agregador de noticias es un sitio web que toma información de múltiples fuentes y lo muestra en un solo lugar”. Esta definición, que data del año 2010, se puede complementar diciendo que hoy en día la agregación no se hace exclusivamente en sitios web. Por mencionar solo una diferente, y tal vez la más popular: se puede hacer en cuentas de redes sociales.

Lexis Nexis, una polémica compañía que, entre otros negocios, vende información, dice que “un agregador de contenido es una entidad que reúne contenido web o de medios, aplicaciones, o ambos, de fuentes en línea para su reutilización o reventa”.

Agregación vs. curaduría

Al revisar en detalle las actividades que se empaquetan bajo el rótulo ‘agregación’, y el desarrollo y clasificaciones que hacen el Centro Berkman, Lexis Nexis, y muchos otros, sin embargo, se descubre que en realidad hay dos procesos absolutamente diferentes: la agregación de contenido propiamente dicha y la ‘curaduría’ de contenido, aunque en la práctica se han convertido en términos intercambiables e incluso usados como sinónimos, sin serlo.

Calificándola como la que a su juicio es la distinción más convincente entre los dos procesos, Steven Rosembaum, autor del libro ‘Curation Nation’ (‘La Nación de la Curaduría’, en traducción libre), cita al bloguero Clinton Forry, quien dice que la agregación es automatizada, el contenido se colecta basado en criterios en forma de metadatos (conjunto de datos que da información sobre otros datos; por ejemplo, autor, fecha en que fue creado, etc.) o palabras clave y que estos se pueden ajustar o, de lo contrario, permanecer estáticos. En otras palabras: es un algoritmo el que hace la tarea. Google News es el mejor ejemplo. El algoritmo selecciona artículos de fuentes a juicio de Google confiables y toma partes de ellos (título, sumario o primeras líneas y foto) y las reproduce.

La curaduría de contenido, en contraste, dice, se caracteriza por ser una tarea en parte manual, que comienza con el análisis de fuentes, evalúa el contenido individualmente basado en criterios editoriales, y lo sopesa según el contexto, eventos actuales, la marca, el sentimiento. Es decir, en la curación, el elemento humano es, teóricamente, lo esencial.

Humano reemplazado

Esa distinción se remonta al año 2009. Pero para aterrizarla en nuestro contexto (y de muchos otros lugares del mundo) en el año 2022, habría que decir que mucho del elemento humano y el criterio editorial en la curaduría de contenido, que es lo que en realidad la mayoría de medios colombianos hacen, ha sido reemplazado también por algoritmos y malas prácticas.

En lo sucesivo en este texto usaremos la palabra curaduría.

Los algoritmos pueden iluminar el criterio editorial en la curaduría, diciendo, por ejemplo, qué es lo más compartido, lo más comentado, lo que más reacciones genera en redes sociales, o lo más buscado, valga la redundancia, en motores de búsqueda, como Google.

Eso no es malo: se trata de conectar a los periodistas con los intereses de la gente, su audiencia, entrar en la conversación.

Otra cosa es cuando esos algoritmos sustituyen el criterio editorial llevando la dictadura de la tendencia (el ‘trending’, en inglés).

En otras palabras, usando jerga de quienes se mueven en este mundo, si “está marcando”, hay que tenerlo, no importa si es una estupidez.

Nuevamente, hay que sentar posición: tomar en cuenta el ‘trending’ no es malo en sí mismo; es cuestión de balance con la agenda propia del medio.

Y la explicación de la importancia de prestar atención al ‘trending’ es muy sencilla: lo que marca es lo que da tráfico, y el tráfico está directamente relacionado con la posibilidad de obtener ingresos. El tráfico, cuantificado en usuarios únicos y páginas vistas, es lo que fundamental y lamentablemente se vende a los anunciantes.

Esto ha dado lugar a una dinámica en que todos los grandes medios colombianos se monitorean entre sí viendo qué tienen otros (exclusivo) y qué les está marcando. Críticos dirán que se ha generalizado el reciclaje mutuo.

El proceso se ha sofisticado tanto que gente técnica que se mueve fuera de las salas de redacción de los grandes medios termina diciéndole a los periodistas qué hay que escribir, incluso cómo hacerlo, y no solo de forma verbal sino con software en el que se asignan responsables.

Esos contenidos se procesan de forma tal que terminan ranqueando mejor en los motores de búsqueda que el contenido original. Ahí es el nuevo campo de batalla entre los medios.

Pero en este punto pueden aflorar las malas prácticas de la curaduría de contenido.

Agregación y porno

“La mala agregación (curaduría) es análoga a la pornografía: la reconoces cuando la ves”, dijo en el 2012 el fallecido David Carr, entonces columnista de medios de The New York Times, en un texto en el que hacía eco de quienes promovían un código de ética para la agregación (curaduría) de contenido.

Ese año la polémica por la agregación de contenido había llegado a su clímax en Estados Unidos, con el éxito de The Huffington Post, sitio web que, fundamentalmente, hacía agregación (curaduría) de contenido.
Pero no era el único, muchos otros medios la estaban haciendo, convirtiendo en ‘víctima’ incluso a The New York Times, el mismo en que trabajaba Carr.

El caso más emblemático ese año fue una agregación que hizo Forbes de un contenido publicado en The New York Times Magazine, y reproducido en su sitio web: el capítulo completo de un libro con el título ‘Cómo las empresas conocen sus secretos’, en el que documentaba cómo Target (una cadena de tiendas) identificaba las necesidades de sus clientes y les enviaba ofertas de acuerdo con su perfil.

Forbes hizo una versión ultracondensada, con un mejor título: ‘Cómo Target descubrió que una adolescente estaba embarazada antes que su padre’ y, aparentemente, consiguió muchísimo mayor tráfico.

En el año 2012 la ‘mala práctica’ era agregar o hacer curaduría. De hecho, esa curaduría de Forbes, en particular, mereció el calificativo de ‘robo’.

El debate en ese momento se centró en el valor de la agregación versus el contenido original, el que hacen los reporteros investigando, saliendo a la calle.

"Tomé un gran artículo de un excelente reportero y creé una versión que era mejor para una audiencia en línea. Esto es una gran parte de lo que hago como 'nuevo periodista'”, dijo Kashmir Hill, quien hizo la agregación de Forbes, al periodista especializado en medios Jim Romenesko (enlace no disponible, pero reseñado en la nota Journalism Ethics: Summarizing vs. Reporting; Ética Periodística: Resumir vs. Reportear).

“Si estuviera comenzando en periodismo hoy, probablemente, estaría resumiendo cada historia que pudiera encontrar... Pero cada hora gastada resumiendo es una hora no gastada en reportería. Y al final del día, este trabajo es en realidad el único divertido si usted descubre lo que nadie sabe todavía”, dijo Charles Duhigg, autor del artículo original (También a Romenesko, reseñado por el mismo sitio anterior).

Pero a pesar de que la discusión se centraba en medios digitales, la práctica de la agregación y curaduría de contenido no es exclusiva de ellos: la hacen la radio, la televisión y los impresos desde hace muchos años.

De hecho, sin tener ese nombre, hoy se reconoce que en el mundo de los medios los pioneros de la agregación, quien lo creyera, fueron Selecciones de Reader’s Digest, que apareció en 1922; y Time Magazine, en 1923, y que catalogaban y condensaban artículos.

La polémica por la agregación (curaduría) alcanzó su clímax en Colombia el año 2014, cuando un grupo de periódicos denunciaron a Pulzo *, portal especializado en agregación (curaduría) del Grupo Santo Domingo, ante la Superintendencia de Industria y Comercio (SIC), por competencia desleal, y le pidieron ordenar que se abstuviera de ‘usar’ sus contenidos. Esta controversia legal llegó a su fin en 2018, cuando los demandantes y Pulzo (que ha tenido desde sus inicios y en la actualidad las mejores prácticas de agregación de contenido) llegaron a un acuerdo, auspiciado por la Asociación de Medios de Información (AMI, antigua Andiarios).

Claramente, la discusión sobre el valor de la agregación (curaduría), versus el contenido original está superada en el mundo. Cada una tiene su lugar y valor para la audiencia. Sin embargo, hay que reconocer que el contenido original es el gran diferenciador entre medios de comunicación. Pero la gran ironía es que el mayor volumen de tráfico de estos puede venir, y seguramente es así, del contenido agregado, en particular aquel que ha sido seleccionado teniendo como criterio el ‘trending’. Más allá de las páginas vistas y los usuarios únicos, que es lo que publicitan, sería interesante conocer cuáles son las historias que más tráfico les generan, algo que nunca revelarán.

Las malas prácticas

La curaduría de contenido, además, tiene una justificación sencilla, si se quiere filosófica, y de ahí el sentido de la palabra curaduría: en un mundo sobrecargado de información, ‘alguien’ tiene que seleccionar lo que es importante para la audiencia.

Se calcula que cada día se producen 2,5 quintillones de bytes de datos (2,5 seguido por 18 ceros), un dato que no es fácil asimilar.

Para aterrizarlo, basta mencionar una declaración de Eric Schmidt, CEO de Google en el 2010, según la cual "entre los albores de la civilización hasta 2003, había sólo cinco exabytes de información creada, ahora se crea ese volumen de información cada dos días, y el ritmo es cada vez mayor”.

Cuando se enuncian las mejores prácticas para la curaduría de contenido, automáticamente se identifican las malas prácticas, porque a diferencia de lo que ocurre con la pornografía, usando el símil de David Carr, solo el experto puede identificarla, no la audiencia. Es más: a esta última poco le importa esta discusión.
Veamos las mejores prácticas, enunciados por una legión de expertos, pero citando las de Berkman Center de Harvard:

  • “Reproduzca solo aquellas partes del titular o artículo que sean necesarias para expresar su punto o para identificar la historia. No reproduzca la historia en su totalidad”.
  • “Trate de no usar todos, o incluso la mayoría, de los artículos disponibles de una sola fuente. Limítese a aquellos artículos que sean directamente relevantes para su audiencia”.
  • “Identifique de manera destacada la fuente del artículo.
  • “Siempre que sea posible, enlace a la fuente original del artículo.
  • “Cuando sea posible, proporcione contexto o comentarios sobre el material que utiliza”.
  • ¿Malas prácticas de los medios colombianos?
  • Usar contenido sin entrecomillar y atribuir.
  • No citar la fuente. O, a pesar de citar la fuente, no enlazarla para llevarle tráfico (algún burócrata de los medios ordenó no poner esos enlaces porque -dice- “nos sacan el tráfico”: la completa negación de Internet).
  • Citar uno que otro párrafo y entrecomillarlo, pero parafrasear otra parte del contenido (decir lo mismo con otras palabras, en otro orden, usando sinónimos).
  • Sobreagregar: tomar demasiado contenido de una nota o de un sitio.
  • Hacer copy/paste de contenido curado por otros y atribuírselo.
  • Hacer copy/paste del contenido original y ponerlo bajo la marca de su propio sitio, poniendo o no crédito al autor o medio propietario.

Pero tal vez el punto más sensible de la curaduría de contenido tiene que ver con el valor, valga la redundancia, que agrega quien hace la agregación o curaduría del contenido. ¡La buena agregación agrega valor al contenido!

El nivel más básico es condensar, resumir, sintetizar, pero es duramente criticado.

En defensa de ese ejercicio, el periodista Jonathan Stray, dijo en un webinar del Poynter Institute (que forma periodistas y hace investigación sobre periodismo, con sede en la Florida, EU): “Aquí hay algo que yo no entiendo. Si reescribir, condensar, etc., es una tarea inútil, ¿por qué obtienen tal tráfico las versiones ‘agregadas’? Seguramente, eso indica que estas organizaciones están suministrando valor al usuario en alguna parte” (enlace no disponible).

“Internet es grandiosa porque es un mercado abierto –y, claramente, hubo mucha gente a la que le gustó su resumen (probablemente, más de lo que les gustó mi artículo). Ojalá la próxima vez el Times (y yo) seamos lo suficientemente inteligentes para atraer nosotros mismos esos lectores”, dijo Duhigg, el autor del artículo ‘robado’ por Forbes.

Pero, si bien hacer resúmenes, sumarios de contenido, tiene un gran valor en el mundo digital, es el nivel más básico. Niveles más elevados incluyen agregar contexto, análisis, opinión, contrastación de versiones, explicación, entre muchas otras.

Amenaza de Google

El anuncio de Google, publicado en su blog el 18 de agosto, decía que iba a mejorar la posición en su ranking del contenido original y de calidad sobre la información ‘reciclada’ que circula por sitios de agregadores.

El sitio The Verge, al reseñar el anuncio de Google, dijo que esas actualizaciones “tienen como objetivo abordar el ‘clickbait’ y mejorar la relevancia de los resultados en la búsqueda”.

“Sabemos que las personas no encuentran útil el contenido si parece que fue diseñado para atraer clics en lugar de informar a los lectores. Entonces… implementaremos una serie de mejoras en la búsqueda para que sea más fácil para las personas encontrar contenido útil creado específicamente por y para personas… Esta actualización ayudará a garantizar que el contenido no original y de baja calidad no obtenga una alta clasificación en la búsqueda, particularmente (pero no exclusivamente) para materiales educativos en línea, entretenimiento, compras y contenido relacionado con la tecnología”, dice Google.

¿Información reciclada, ‘clickbait, diseño para atraer clics, baja calidad? Eso suena a malas prácticas de agregación (curaduría).

La pregunta que surge es si Google va estar en capacidad de distinguir entre las buenas y las malas prácticas de agregación, o va a castigarlas por igual.

La estrategia de Facebook, que en algún momento hizo un anuncio similar para castigar el ‘clickbait’, ha sido un rotundo fracaso en Colombia, a juzgar por su profusión en medios.

Los ajustes de Google arrancaron el 22 de agosto en idioma inglés. En muy breve llegarán al contenido en español. Amanecerá y veremos.

*Guillermo Franco montó la operación de contenido de Pulzo en 2013 y fue su director hasta 2018.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA