miércoles, 14 de mayo de 2014

La Digitalización y la Digitalización que hace Google

La Digitalización y la Digitalización que hace Google

En el mes de marzo escribí este artículo sobre la Digitalización para el blog Dokumentalista, y lo he querido compartir con todos los seguidores de Archinfo 2.0.
“La digitalización debe ser entendida como un proceso de conservación y difusión de la documentación. Hay que tener muy claro que lo más importante es el documento y se debe atender siempre a su estado de conservación, sus características físicas y las necesidades que tiene cada documento en particular. No podemos entender la digitalización como un proceso general en el que todo se hace igual, ya que cada documento precisa de un tiempo, un cuidado y una manipulación única. Los documentos son parte de la historia, y como tales deben ser respetados y tratados.
Partiendo de estas ideas nos vamos al año 2002, fecha en la que Google comienza a escanear libros de todo el mundo, gracias a una serie de acuerdos con grandes universidades. Se buscaba la creación de una enorme biblioteca virtual, a escala mundial, que reuniera en el ordenador de casa las imágenes digitalizadas de libros de todo el mundo. Este enorme proyecto se presentó en 2004 bajo el nombre de “Google Print”, hoy conocido como Google Book Search, en la Feria del Libro de Frankfurt. En ese momento, ya se habían digitalizado miles de libros y numerosas editoriales y bibliotecas se sumaron al proyecto, permitiendo el acceso a sus fondos y la digitalización en masa de sus documentos.
La digitalización realizada por Google se enfrenta a numerosas cuestiones legales en lo referente a los derechos de autor, ya que el contenido de los fondos se expone de forma gratuita para su consulta desde cualquier parte del mundo. Pero para entender mejor todo este asunto os remito a la siguiente información: http://www.julianmarquina.es/google-gana-la-batalla-de-la-digitalizacion-de-libros/
La digitalización que realiza Google difiere mucho de la que se realiza en las empresas privadas dedicadas a ello. En la digitalización profesional se suele aplicar una fórmula que contiene los tres factores fundamentales a los que debemos atender cuando vamos a realizar la digitalización de un documento histórico. Se trata de: “Calidad + Conservación = Tiempo”
La calidad de las imágenes de Google es muy escasa. En las imágenes que vemos en Google Book podemos encontrar dedos de los digitalizadores, falta de texto, imágenes recortadas y pérdida de información; pero a esto le debemos sumar que los documentos están digitalizados en blanco y negro, con exceso de luz, hasta el punto que parecen fotocopias que, incluso en algunos casos, no están bien enfocadas y no se puede leer con facilidad el texto. Esta falta de calidad en las imágenes se debe a que se trata de una digitalización realizada con rapidez, en masa, sin atender a las características propias de cada documento. Google utiliza una cámara Elphel 323, que permite que se lleguen a digitalizar unas mil páginas por hora. Se busca la digitalización rápida, con el objetivo de hacer el mayor número de libros en el menor tiempo posible.
libro en blanco y negro
Las empresas del sector de la digitalización tienen unos criterios de calidad bastante diferentes. En el proceso que aplican pocas veces usan el blanco y negro (salvo excepciones por características del proyecto), en cambio emplean la escala de grises, donde las imágenes no tienen tantos brillos y se aprecian mucho mejor las características de cada hoja. La digitalización se realiza también en color, lo que nos ofrece mucha más calidad de imagen ya que se pueden apreciar las distintas tonalidades. Cuando tenemos delante un pergamino, por ejemplo, la imagen en color de calidad nos permite apreciar los distintos tonos que tiene la hoja y gran cantidad de detalles, lo que permite que se ofrezca una mejor idea de las características del documento a través de la pantalla.
escaner cenitalLa calidad de las imágenes es máxima y se intenta evitar no haya presencia de dedos, textos recortados y que el texto esté perfectamente enfocado para la correcta visualización de las imágenes. Utilizan distintos tipos de escáneres cenitales, como es el caso del Digibook, el Book2net y el Copibook, en función de las características de los documentos que se van a digitalizar, ya que estos escáneres ofrecen un mejor rendimiento y calidad con diferente tipología de documentos en función del formato y el estado de conservación del mismo y las características de la sala de digitalización. Además, cada uno de estos escáneres realiza la digitalización en diferentes tiempos, que pueden oscilar entre las 100 páginas por hora en color y las 180 por hora en escala de grises, aunque estos datos son muy relativos y dependen, sobre todo, de las características de cada documento.
libro en color
Ya se ha mencionado la conservación de los documentos. En el caso de Google que aplica una digitalización masiva y rápida, los documentos no se tratan en ningún caso, con el respeto que se merecen, y algunos de ellos han quedado desencuadernados y con páginas rotas. Es una pena ver como, por realizar este proceso con rapidez, no se está teniendo en cuenta la importancia de la conservación de los documentos. Este es uno de los factores más importantes en la digitalización profesional, donde la conservación está por encima de todo lo demás.
Si bien vamos a digitalizar un documento para que pueda ser consultado en cualquier parte del mundo y con ello favorecemos el acceso a la cultura, el documento original debe quedar en el mismo estado en el que llegó a manos del digitalizador, que debe saber manipular el documento que tiene delante, respetando sus características y ajustando el proceso de digitalización a las condiciones de cada documento. El profesional de la digitalización debe estar formado para llegar a ser consciente de la importancia del documento original y que éste no sufra ningún tipo de daño, que en algunos casos puede llegar a ser irreparable.
Y el resultado de todo este proceso es el tiempo. Los proyectos de digitalización no son baratos y es un factor a tener en cuenta, pero si sumamos la Calidad de las imágenes digitalizadas y la correcta Conservación de los documentos, nos saldrá el tiempo exacto que debemos dedicar a la digitalización de cada documento, como piezas únicas de nuestro patrimonio que deben ser conservadas para la posteridad.
Digitalizar millones de libros al año no implica que las imágenes se vean correctamente (más bien todo lo contrario) y no asegura su correcta  conservación, aunque si permite que el proceso sea menos costoso y llegue a más personas en el mundo; por el contrario, una digitalización de mayor calidad y donde las imágenes se ven con claridad aumenta los tiempos y costes del proyecto, pero se garantiza la conservación del documento y de la Historia que lleva asociada.”
Fuente: Dokumentalistas

Publicado en  http://archinfo20.es/la-digitalizacion-y-la-digitalizacion-que-hace-google/

La digitalización debe ser entendida como un proceso de conservación y difusión de la documentación
archinfo20.es

No hay comentarios:

Publicar un comentario