{"id":11508,"date":"2021-03-07T07:09:46","date_gmt":"2021-03-07T11:09:46","guid":{"rendered":"https:\/\/prensaxtremard.com\/nacional\/enfoque-informatica-wikipedia-rumbo-a-un-idioma-universal\/"},"modified":"2021-03-07T07:09:46","modified_gmt":"2021-03-07T11:09:46","slug":"enfoque-informatica-wikipedia-rumbo-a-un-idioma-universal","status":"publish","type":"post","link":"https:\/\/prensaxtremard.com\/nacional\/enfoque-informatica-wikipedia-rumbo-a-un-idioma-universal\/","title":{"rendered":"Enfoque: Inform\u00e1tica – Wikipedia rumbo a un idioma universal"},"content":{"rendered":"


\n
<\/p>\n

\n

El futuro empez\u00f3 el 1 de abril de 2020. Ese d\u00eda, el inform\u00e1tico Zdenko Vrandecic hizo p\u00fablica su visi\u00f3n: conseguir que Wikipedia \u2013la enciclopedia on-line\u2013 no solo sea diez veces m\u00e1s grande, sino tambi\u00e9n m\u00e1s fiable y m\u00e1s actualizada. Wikipedia Abstracta es el nombre del proyecto. Por su objetivo y por la fecha en la que se public\u00f3, el D\u00eda de los Inocentes en el mundo anglosaj\u00f3n, la idea de una Wikipedia abstracta casi suena a broma: lo que este inform\u00e1tico quiere es inventar una especie de lenguaje universal. De esta manera, todos los art\u00edculos de la Wikipedia escritos, por ejemplo, en ingl\u00e9s podr\u00edan leerse tambi\u00e9n en suajili, y a la inversa.<\/p>\n

A Vrandecic, un inform\u00e1tico de 42 a\u00f1os, en el mundillo especializado se lo conoce como \u2018Denny\u2019. Nos recibe de buen humor y rodeado de cajas. Acaba de dejar su trabajo en Google y se ha trasladado a la localidad de Berkeley para centrarse en su nuevo proyecto, ahora como empleado de la Fundaci\u00f3n Wikimedia.<\/p>\n

El gigantesco libro de consulta on-line que es la Wikipedia comprende hoy m\u00e1s de 55 millones de art\u00edculos, 100 veces m\u00e1s entradas que la mayor enciclopedia impresa de todos los tiempos. En total hay m\u00e1s de 300 Wikipedias en diferentes idiomas y dialectos, desde el alban\u00e9s hasta el yoruba y el zul\u00fa, pasando por el escoc\u00e9s y el yidis.<\/p>\n

Pero ese tama\u00f1o y esa variedad enga\u00f1an, advierten los expertos. El crecimiento explosivo ha quedado atr\u00e1s, el n\u00famero de contribuyentes activos se ha estancado. La fiabilidad de las entradas va en aumento, pero a cambio de una mara\u00f1a de reglas que se lo ponen muy dif\u00edcil a los nuevos autores. La mayor\u00eda de las entradas est\u00e1n elaboradas por hombres blancos procedentes de sociedades ricas. Los Pa\u00edses Bajos, por ejemplo, tienen m\u00e1s autores que toda \u00c1frica.<\/p>\n

La versi\u00f3n m\u00e1s grande es la de lengua inglesa, con m\u00e1s de seis millones de entradas. La alemana, con unos 2,5 millones de art\u00edculos, ocupa la segunda posici\u00f3n. Pero sorprendentemente hay m\u00e1s de un mill\u00f3n de entradas redactadas solo en alem\u00e1n que carecen de versi\u00f3n en ingl\u00e9s. Versiones en otros idiomas est\u00e1n igualmente aisladas unas de otras, son como islas en un vasto oc\u00e9ano.<\/p>\n

Y eso es lo que quiere cambiar Vrandecic: desea que todas las entradas de la enciclopedia sean accesibles a todo el mundo, que todas las personas puedan disfrutar del conocimiento atesorado por la humanidad, incluido el de las regiones m\u00e1s apartadas del planeta.<\/p>\n

El fracaso y las burlas<\/strong>

\nCuando Wikipedia naci\u00f3, esta idea habr\u00eda sido impensable. La enciclopedia on-line lleg\u00f3 a Internet el 15 de enero de 2001, hace ya 20 a\u00f1os. Todo empez\u00f3 con un fracaso. Jimmy Wales, hombre de negocios estadounidense, dirig\u00eda desde Florida una especie de revista en l\u00ednea dirigida al p\u00fablico masculino llamada Bomis, con contenidos de deporte y erotismo. Esta base le permiti\u00f3 crear en el a\u00f1o 2000 una enciclopedia comercial on-line bajo el nombre de Nupedia. Pero la cosa no funcion\u00f3. As\u00ed que Wales abandon\u00f3 su idea de negocio y transform\u00f3 la enciclopedia en un proyecto amateurvoluntario. Y lleg\u00f3 la sorpresa: empez\u00f3 a crecer a un ritmo incre\u00edble.<\/p>\n

Al principio, la Wikipedia era objeto de muchas burlas, \u00abel equivalente acad\u00e9mico a un Big Mac\u00bb, dec\u00edan. Pero, para pasmo de los cr\u00edticos, los estudios demuestran que los art\u00edculos de la Wikipedia tienen una fiabilidad similar a los de la Encyclop\u00e6dia Britannica. Los servidores de Wikipedia est\u00e1n gestionados por la matriz Wikimedia, una organizaci\u00f3n sin \u00e1nimo de lucro con sede en San Francisco y que se financia mediante unas donaciones que alcanzan un valor de 110 millones de d\u00f3lares al a\u00f1o.<\/p>\n

Sin embargo, aunque la Wikipedia es un \u00e9xito, muchos de sus problemas siguen sin resolverse. \u00abLa mayor\u00eda de las entradas est\u00e1n redactadas de una forma enrevesada \u2013se lamenta Vrandecic\u2013. El otro d\u00eda estaba con mi hija en el parque, y por curiosidad me puse a mirar la entrada de \u2018margarita\u2019. Solo entend\u00ed la mitad porque no tengo un doctorado en Biolog\u00eda\u00bb.<\/p>\n

Como la comunidad de autores voluntarios no parece tener ganas de simplificar los textos, Vrandecic conf\u00eda en que su programa de traducci\u00f3n sea capaz de elaborar versiones sencillas de una forma autom\u00e1tica.<\/p>\n

Vrandecic es un hombre polifac\u00e9tico. En la universidad estudi\u00f3 una dupla de carreras tan poco habitual como Inform\u00e1tica y Filosof\u00eda. Y m\u00e1s tarde desarroll\u00f3 Wikidata, una base de datos puros. Wikidata se usa de forma global, independientemente de cada idioma. La intenci\u00f3n de Vrandecic es extender el principio en el que se basa Wikidata a art\u00edculos enteros de la enciclopedia.<\/p>\n

Las \u2018alucinaciones\u2019<\/strong>

\n\u00bfY por qu\u00e9 no recurre a programas de traducci\u00f3n autom\u00e1ticos, como Google Translate? \u00abSolo funcionan bien si los dos idiomas cuentan con enormes cantidades de textos en formato legible por m\u00e1quina\u00bb, responde. Cuanto menor es la cantidad de textos digitalizados, mayor es la cantidad de morralla que producen. En el mundo especializado se suele hablar de \u2018alucinaciones\u2019 para referirse a esos resultados que no tienen ni pies ni cabeza.<\/p>\n

Por eso, Vrandecic est\u00e1 desarrollando algo tan ambicioso. \u00abQueremos formular las entradas de la Wikipedia de manera que sean independientes de un lenguaje natural \u2013dice\u2013. Tomemos, por ejemplo, el concepto \u2018la mitad\u2019, que se puede expresar de una forma precisa e independiente de cualquier idioma mediante la f\u00f3rmula \u201850%\u2019. En el siguiente paso, a partir de ese \u201850%\u2019 ya se podr\u00eda generar el ingles \u2018half\u2019 o el franc\u00e9s \u2018la moiti\u00e9\u2019\u00bb.<\/p>\n

Los nombres de lugares, por su parte, se pueden sustituir por c\u00f3digos alfanum\u00e9ricos. Por ejemplo, en Wikidata la ciudad de San Francisco tiene adjudicado el \u2018Q62\u2019. Los autores podr\u00edan utilizar estos datos, \u00e1ridos pero s\u00f3lidos, para formular a partir de ellos una entrada perfectamente legible de la Wikipedia en el idioma propio.<\/p>\n

Lo del idioma universal es un sue\u00f1o muy antiguo de la humanidad. El fil\u00f3sofo Ren\u00e9 Descartes ya propuso en el siglo XVII una \u00ablingua universalis\u00bb, una lengua de la verdad que permitiera \u00abenumerar todos los pensamientos de los hombres y ponerlos en orden\u00bb, adem\u00e1s de \u00abdistinguirlos de forma que sean claros y simples\u00bb.<\/p>\n

\u00abNosotros somos mucho m\u00e1s modestos, nuestra lengua aspira a ser simple y funcional\u00bb, dice Vrandecic. Por ejemplo, un armaz\u00f3n de datos puros sobre San Francisco podr\u00eda ser m\u00e1s o menos as\u00ed: \u00abinstance: San Francisco (Q62), class: object_with_modifier_and_of(\u00bb.<\/p>\n

Esta serie de expresiones de ra\u00edz inform\u00e1tica no se parecer\u00e1 a la lengua so\u00f1ada por Descartes, no tendr\u00e1 nada de arm\u00f3nica sucesi\u00f3n de pensamientos. Un software de renderizado ser\u00e1 el encargado de transformar las series de elementos en un lenguaje comprensible para las personas, dando pie a un \u2018art\u00edculo resumido\u2019 que luego ser\u00e1 pulido por los autores de las entradas de la enciclopedia.<\/p>\n

Heather Ford, profesora de Medios Digitales en la Universidad Tecnol\u00f3gica de S\u00eddney, ve un problema: en su opini\u00f3n, la Wikipedia Abstracta es tan exigente que contribuir\u00e1 a seguir reforzando el dominio de los pa\u00edses desarrollados en la enciclopedia.<\/p>\n

Al contrario, replica Vrandecic: mediante una traducci\u00f3n precisa, las entradas elaboradas en idiomas minoritarios podr\u00edan encontrar un acceso m\u00e1s f\u00e1cil a la Wikipedia inglesa. Adem\u00e1s, las traducciones no ser\u00edan un sustitutivo, sino una herramienta adicional para los autores, que siempre conservar\u00edan el control sobre sus textos: \u00abLo que quiero es que una entrada sobre la cultura amhara venga del amhara, y que una entrada sobre las danzas bengal\u00edes tambi\u00e9n est\u00e9 escrita por bengal\u00edes\u00bb.<\/p>\n

Est\u00e1 previsto que la Wikipedia Abstracta presente sus primeros resultados para 2023.<\/p>\n<\/p><\/div>\n