Los trabajos
de digitalización de museos y
bibliotecas son tareas titánicas que buscan garantizar la preservación
de la historia de la humanidad y todos los conocimientos que hemos adquirido a
lo largo de los años. Aquí mismo en Xataka hemos recopilado 54 de estas
iniciativas, donde la clave está en poner todo este material al
alcance del público, y si es gratis, mucho mejor.
Hoy se está
dando a conocer que la Biblioteca
Nacional de Noruega ha terminado con
su primera etapa de digitalización que consistió en el escaneo de
aproximadamente 250.000 libros noruegos, es decir, casi todos los libros
publicados antes del año 2000 en aquel país. Donde lo mejor de todo es que
están disponibles en línea de forma gratuita casi para cualquier persona, ya
que hay algunas restricciones.
Aproximadamente 250.000 libros disponibles
El
nuevo portal
digital de la Biblioteca Nacional de Noruega pone a nuestra
disposición los ya mencionados 250.000
libros, casi medio millón de periódicos, más de 270.000 imágenes,
sonidos, programas de televisión, radio y hasta música, así como manuscritos,
revistas e incluso informes y documentos del Parlamento Noruego.
Todo esto
está disponible de forma gratuita para aquellos usuarios con IP en Noruega, ya
que el resto del mundo sólo podrá
acceder a una parte del acervo, que contempla sobre todo, aquellos que
no tienen derechos de distribución internacional.
La buena
noticia es que la biblioteca ha puesto a disposición de aquellos que no estamos
en Noruega, un formulario para
solicitar acceso sobre todo a los libros, el cual está
disponible principalmente para propósitos de investigación,
educación y traducción profesional, pero cualquier persona puede enviar dicho
formulario. Una vez que se nos dé la autorización, tendremos acceso al contenido durante un periodo de
seis meses con posibilidad de solicitar una extensión.
Un proceso titánico
Este
proyecto, que arrancó en 2006,
consiste en varias líneas de producción que se encargan de digitalizar
diferentes tipos de materiales. Aquí se usan desde escáneres de hojas, de
documentos y automáticos, los cuales se encargan de capturar desde los libros
hasta periódicos, revistas y fotografías. De igual forma se cuenta con equipo
para digitalizar películas, vídeos y clips de audio.
Una vez que
se tienen los archivos digitales, estos pasan por un proceso de reconocimiento óptico de caracteres (OCR) donde
se "traducen" las imágenes para convertirlas en texto, y que también
sirve para reconocer qué partes son encabezados o las diferentes secciones que
integran un documento.
Finalmente
cuando todo está listo, lo último es clasificar el material para añadirlo a la base de datos y
esté disponible para los usuarios, incluso hay algunos que se podrán descargar.
Los libros están disponibles en PDF, mientras que las fotografías y documentos
históricos se encuentran en JPEG2000 o TIFF. Por otro lado, los archivos de
audio están en WAV y los vídeos en MPEG4 H264.
No hay comentarios:
Publicar un comentario