Sociedad

Combatiendo los datos anecdóticos en Wikipedia

29 Ago, 2011 - - @kikollan

Esta mañana he fracasado buscando unos datos en Wikipedia y me he dado cuenta de que el formato tiene una deficiencia que en general olvidamos: las enciclopedias sufren de un exceso de datos anecdóticos. En Wikipedia sobran hitos. La fecha en que se inventó el teléfono y el destino del primer ferrocarril son datos interesantes, ¿pero es esa la información más relevante?

Keynote_def.png

Pensad en mi búsqueda de esta mañana. Estaba preparando un artículo y quería averiguar en que momento del siglo XX las máquinas de escribir sustituyeron a la escritura manuscrita. Desgraciadamente Wikipedia no dice nada al respecto… pese a que lo sabe todo sobre las (muchas) primeras máquinas de escribir: la primera con retorno de carro, la primera con tecla Shift, con espaciado variable, con mecanismo margarita y un largo etcétera. Un montón de información inútil. Saber cuándo se construyó la primera maquina es secundario, es más relevante averiguar cuándo y cómo se popularizó, cuándo y cómo aquel cacharro metálico tuvo su efecto sobre el mundo.

¿Pero a qué se debe esa abundancia de datos «anecdóticos»? Quizás son más divertidos, y por eso abundan, aunque yo diría que la razón de su éxito es que son datos fáciles de conseguir. Es más sencillo averiguar cuándo se presentó la primera maquina de escribir que precisar cuándo se extendió su uso en oficinas, o entre escritores, en España o en París.

En el fondo el problema es que sufrimos una (enorme) falta de información objetiva y datos cuantitativos. Pensad en las preguntas a priori sencillas, como cuál era la temperatura en la edad media (I) o cuánta gente moría en las guerras (II), que en pleno siglo XXI aún tratamos de responder. Será difícil responder todas las incógnitas, pero lo mínimo que podemos hacer es ser conscientes de que existen; que existen… y que seguirán existiendo aunque llenemos un trillón de Wikipedias con fechas y anécdotas.

Nota. Si tenéis curiosidad sobre mi pregunta original —¿cuándo se popularizó la maquina de escribir?—, he encontrado una primera respuesta usando «Ngram Viewer» de Google para representar la evolución del uso de la palabra «typewriter» en libros de los últimos 200 años. Supongo que existen datos mejores (ventas o estadísticas oficiales) pero éstos son una aproximación razonable, objetiva y numérica. Además, me fascina pensar que ese conocimiento sobre el uso de las palabras estaba fuera de nuestro alcance hace solo dos años, hasta que la tecnología permitió escanear millones de libros y procesarlos todos, palabra por palabra.


6 comentarios

  1. Tienes toda la razón. La divulgación histórica popular, difundido a través de ciertas publicaciones periódicas y ciertos «historiadores», muestra un especial fetichismo por el dato, por la anécdota, que sustituye la aproximación al conocimiento histórico por el compendio de datos entrelazados. Y es que todo hecho pasado no es histórico, ni es propio de historiadores saber el color de la capa de Carlos V durante el verano de 1521…

  2. J.E dice:

    Disiento hasta cierto punto. El problema es que cada búsqueda es enormemente individual y las enciclopedias (así, en general) tienden a recopilar todos los datos para intentar satisfacer todos los perfiles de búsquedas aunque, obviamente, no consiguen contentar a todos.

    PD: A lo que te ha pasado se le llama «entropía», por cierto… http://es.wikipedia.org/wiki/Entrop%C3%ADa_(informaci%C3%B3n)

  3. oalfonso dice:

    La última búsqueda funciona si esa palabra se ha usado siempre y no sustituyó a otra.

  4. Javilogik dice:

    Quien dijo que Wikipedia fuera una enciclopedia?

  5. Kiko Llaneras dice:

    DPS, es curioso el pico de de «typewritter» al surgir «word processor», ¿quizás en texto tipo «the word processor will kill the typewritter»?

    Ngrams es estupendo.

Comments are closed.