Noticias

Así es el árbol del conocimiento de EL PAÍS

26-01-2017

Si pudieras verlo desde el cielo, se parecería a un árbol. O a un inmenso río. Pero en lugar de circular agua por su cauce lo que lo alimentan son las palabras. Donald TrumpRyan GoslingBrexitCaso Gürtel... Así hasta alcanzar una lista entrelazada de 130.000 conceptos que te permiten a ti, lector, rastrear las noticias relacionadas a estas palabras. Es el colabulario, el sistema de etiquetado de los 15 medios del Grupo PRISA que tratan de servir de contexto a la actualidad y de memoria colectiva de los términos que nos importan.

"En Cien años de soledad, cuando Gabriel García Márquez cuenta la historia de la peste del insomnio, en Macondo se van olvidando de las cosas y para qué sirven. Así que uno de los personajes toma la decisión de apuntar en unas notas las palabras que definen a un término concreto. Así consiguen no olvidar qué son los objetos. Nuestro trabajo es parecido. Tratamos de darle una palabra a una realidad concreta para que entre dentro de la conversación". Así define Felipe Díez Núñez (Ávila, 1976), responsable del colabulario, el trabajo que él y el equipo de documentalistas de EL PAÍS hacen con esta herramienta.

Las etiquetas de EL PAÍS no son las mismas que podemos ver en un blog o las redes sociales. Estas segundas pertenecen a un lenguaje de taxonomía, de ordenación de los conceptos, conocido como folcsonomía. Este lenguaje permite que cada usuario de Internet cree sus propias etiquetas. "Imagina qué pasaría si ese fuera nuestro sistema de ordenación. Con cientos de periodistas de 15 medios distintos tendríamos un grave problema. Homonimias, polisemia, etcétera. En EL PAÍS, cada término del colabulario es elegido por nuestro equipo bajo criterios documentalistas, no de SEO [las estrategias de posicionamiento que sirven para aparecer en lo alto de una búsqueda en Google o similares]. Es decir, elegimos las palabras más atemporales para servir de memoria", explica Díez, coordinador del equipo que tutela y alimenta esta herramienta y que además vigila la calidad del etiquetado de las noticias. El colabulario establece también una jerarquización de sus términos, lo que permite englobar grandes temas con una palabra que se puede luego ramificar en los detalles.

En el futuro, el colabulario será una de las herramientas clave en la riqueza informativa del Grupo PRISA, que vive la transformación digital de su principal cabecera, EL PAÍS. "Estamos dirigiendo el colabulario hacia la ontología. Esta herramienta necesita de una semántica interna para que las máquinas [los robots de los buscadores que detectan el contenido] las reconozcan y sepan interpretarlas. El futuro será la web semántica, algo que, en España, no tiene ningún medio de comunicación", apunta Díez. Esto permitirá que los robots buscadores puedan reconocer no solo una etiqueta en concreto, sino todos los términos relacionados con ella en ese gigantesco árbol, o río, del que hablábamos en un principio. "Esta investigación no piensa ya en cómo usamos Internet hoy. Se anticipa a cómo la usaremos en el futuro".

Díez, para rematar de definir qué es el colabulario y por qué es pieza esencial de tu periódico, vuelve a Macondo: "Hay un momento en el que a los personajes, de tanto escribir las etiquetas, se les olvida qué quieren decir. Entonces, vuelven a dar una vuelta de tuerca y a esas etiquetas les añaden una información que dice para qué sirve esa palabra. ¿Mesa? Sirve para comer encima de ello. Esto es lo que estamos haciendo con la ontología. El colabulario es la mesa. Y la ontología, su descripción. En fin, hablando en mayúsculas, es una lucha contra la desmemoria".

Fuente: EL PAÍS

Volver a noticias

Subir al inicio de la página