Lenguaje, herramienta por excelencia en el contexto digital

Internet es un espacio de información que, si bien es benéfico para la humanidad, representa también un peligro porque se corre el riesgo de perdernos en el cúmulo de datos que están ahí y que con frecuencia no son tan confiables, alertó Adriana Suárez Sánchez, académica del Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI) de la UNAM.

Obtenerla es importante en todos los ámbitos de nuestra vida; y si está actualizada y es fiable estamos en posibilidad de tomar decisiones o preparados ante situaciones en diferentes aspectos de nuestra vida cotidiana, comentó.

El tema del lenguaje en su localización ha sido investigado en el IIBI, donde especialistas desarrollan trabajos asociados a la búsqueda en catálogos de bibliotecas, bases de datos y entornos web.

“En este rubro hemos creado lenguajes de indización como el tesauros, taxonomías y ontologías que apoyan a los usuarios en la recuperación de datos mediante un lenguaje estandarizado, y trabajamos para que los sistemas sean más inteligentes y respondan con mayor eficacia a las consultas de los cibernautas.”

En la actualidad, el panorama de las fuentes de información se ha ampliado. A principios y mediados del siglo XX las personas se mantuvieron documentadas por medios impresos, luego a través de la radio y la televisión; sin embargo, aproximadamente a mediados de la década de 1990 las tecnologías de la comunicación y la información registraron la aparición y masificación de internet. A partir de entonces la web se ha consolidado como un espacio de contenidos relevante a la par de los medios tradicionales.

Dentro del contexto digital el lenguaje sigue siendo la herramienta por excelencia con la que establecemos interrogaciones en un buscador como Google, o en una base de datos como JSTOR, orientada hacia la investigación y enseñanza con tecnología de punta, incluso las consultas que planteamos a las inteligencias artificiales como Alexa, Siri o ChatGPT, explicó Adriana Suárez.

En el caso de los catálogos de bibliotecas, bases de datos e inteligencias artificiales debemos ser conscientes de que estamos ante un agente artificial; es decir, una computadora que no posee la complejidad de comprensión lingüística que tenemos los humanos. “Lo intentan, hacia allá se dirigen, pero aún falta más desarrollo semántico en tales sistemas”.

Frente a esa situación, nuestras consultas deben realizarse en un lenguaje estándar, con sintaxis adecuada y semántica clara. Por ejemplo, si indagamos “león” debemos precisar, de inicio, si se trata del animal, la ciudad de Guanajuato o el equipo de futbol.

Recordó que en Google, a diferencia de otras herramientas digitales, son más fáciles las búsquedas debido a la estructuración de su contenido; es decir, se trata de un gran motor que se adhiere más al lenguaje natural, porque tiene texto completo, ello es bueno y malo.

En esa plataforma las búsquedas son sencillas, pero con frecuencia no precisas; en cambio, sitios como bibliotecas y repositorios digitales son espacios más estructurados y formales donde recuperamos otro tipo de recursos de información confiable, actualizada y organizada.

Suárez Sánchez mencionó que se adhieren a la normatividad para la integración de los recursos en la web, todo lo que se integra debe pasar por una reglamentación establecida por un consorcio: el W3C (World Wide Web Consortium).

Para ello, utilizan esquemas de metadatos que describen adecuadamente los recursos, lo que incide en la recuperación de la información; eso tiene que ver con algo que llamamos web semántica, que es más significativa y estructurada en términos de metadatos.

Bibliotecas y repositorios digitales son fáciles de revisar. “Trabajamos en una recuperación semántica de la información, cuyo supuesto es un enlace significativo entre las consultas de los usuarios en lenguaje natural y esos recursos indizados en uno controlado que necesita para satisfacer su necesidad informativa”.

Su premisa es la difusión y acceso global con miras a generar conocimiento. Por ejemplo, en México podemos consultar repositorios sobre cultura china o de canciones rumanas, esa es la ventaja de esos espacios –a diferencia de Google–, porque son más estructuradas, cuentan con información confiable; eso es importante en el contexto de las fake news, que circulan en la red.

En las últimas décadas, la Universidad Nacional desarrolló un proyecto en la materia que dio origen al Repositorio Institucional de la UNAM, el cual contiene más de tres millones de recursos digitales. Hasta el momento es un portal centralizado que cuenta con todos aquellos creados en esta casa de estudios, y está abierto para el público en general, finalizó Adriana Suárez.

OVER 80 YEARS OFFERING
Academic excellence