Cámaras digitales y fotografía quesabesde.com
 Fotografía digital   |   Audio portátil   |   PDA   |   Vídeo digital   |   Cine en casa 
entrar/registrarse
Buscar:





publicidad

    quesabesde   cámaras digitales y fotografía  actualidad   Digitalizar documentos:...
miércoles, 30 de agosto de 2006
Digitalizar documentos: la biblioteca virtual
La imagen digital no solamente ha revolucionado el mundo de la fotografía profesional o la de consumo. Un campo en el que está teniendo una tremenda repercusión es el de los archivos, bibliotecas y hemerotecas. Actualmente, se están vendiendo multitud de cámaras digitales y escáneres que tienen como destino convertir inmensos fondos documentales a soporte digital.
 
Paulo Porta.- Primero fue la introducción de productos audiovisuales y multimedia. Después, el servicio de consulta de catálogos web, mediante el cual podemos localizar un libro, una revista o una lámina; saber si está disponible; consultar su ficha bibliográfica, e incluso leer su contenido.

Desde hace unos años, se han incorporado a los fondos documentos en soporte digital que se pueden incluso leer en su totalidad a través de la red, y hasta han aparecido los primeros libros creados directamente para este medio. Los fondos más valiosos de los archivos documentales suelen estar impresos en papel. Muchos de ellos son antiguos, algunos estropeados por el tiempo y el uso, o con problemas de conservación. Su digitalización va a suponer un gran esfuerzo, pero muchas bibliotecas universitarias y estatales ya se han puesto manos a la obra.

Y es que, a diferencia del papel, el soporte digital compatibiliza bien sus dos máximos intereses: la disponibilidad de la información y la preservación de los originales.

Se trata de digitalizar texto e imagen. Un buen número de originales son monocromos y se tratan, por tanto, en escala de grises, aunque capturarlos en color puede ayudar a eliminar eventuales manchas en el papel. Muchas de las ilustraciones son grabados impresos con la misma tinta calcográfica que el texto, por lo que su tratamiento no difiere demasiado. En otras ocasiones, las imágenes e incluso el texto son en color.

Otra característica de los textos antiguos es que, a efectos técnicos, son imágenes. Muchos son manuscritos, y en otros que ya presentan tipografía de imprenta el propio aspecto de la página es parte sustancial.

Para los libros más modernos, en los que el interés se centra en la información, el proceso puede continuar con el reconocimiento óptico de caracteres -OCR-, que los transformará en texto editable. Se puede entonces hacer una nueva paginación de texto e imágenes, elaborando el libro digital como una nueva versión -mucho más manejable- del original.

Formatos y tamaño

Además de su utilidad, los recursos informáticos que consume el texto editable son ridículos en comparación con una imagen.

Cada página DIN-A4 blanca llena de texto negro en Arial o Times de 11 puntos supone en formato RTF o en un documento PDF unos 15 KB, mientras que como imagen en escala de grises y a 240 ppp de resolución ocupa en memoria 5,5 MB, que se pueden convertir en 200 KB al guardar un archivo TIFF con compresión LZW.

Contrariamente a lo que se pueda pensar, el texto negro bien definido sobre blanco puro difícilmente se reduce más con JPEG, incluso a la compresión máxima y con la degradación que conlleva. Sin embargo, nuestra página sí que puede bajar a unos 150 KB en formato GIF con 16 niveles de gris, suficientes para no endurecer demasiado los caracteres, e incluso a menos de 100 KB en PNG de 8 bits.

Recorte al 100% de zoom de un texto, en formato PNG (1,21 KB) indistinguible del original (37 KB) y de las copias en TIFF (LZW, 23,7 KB) o en GIF (1,38 KB).
Copia guardada en JPEG con la opción Guardar como, a un nivel de calidad de 0 (24,2 KB).
Copia guardada en JPEG con la opción Guardar para web y con calidad de 0 (1'93 kb).

Todo ello puede comprobarse muy fácilmente a partir de varios originales distintos en escala de grises. Se demuestra, por tanto, que si queremos publicar en la red un documento de texto a modo de imagen, incluso manuscrito y/o con grabados o xilografías en negro, GIF y PNG son los formatos adecuados, y no JPEG.

Lo mismo cabe decir de las capturas de pantalla con cuadros de diálogo y herramientas de programas, con las que se ilustran tantos tutoriales.

Captura: escáner versus cámara

La decisión de utilizar uno u otro medio de digitalización -escáner o cámara- depende de las condiciones en las que hay que realizarla y, sobre todo, de las características y estado del original.

Hace años que los escáneres alcanzaron frecuencias de resolución óptica idóneas para digitalizar documentos, y su velocidad también ha mejorado notablemente.

Son ideales para láminas, páginas sueltas o libros poco gruesos que no se dañen al abrirse 180 grados. Se han construido, además, aparatos en los que el cristal -y por tanto el área de impresión- llega hasta uno de los bordes, permitiendo digitalizar páginas de libros abiertos hasta 90 grados.

Otras ventajas son la estabilidad en el nivel de iluminación y de enfoque, o el control de la resolución y el tamaño de los archivos creados.

Las cámaras digitales, por su parte, son más versátiles, aunque requieren un mayor control de los parámetros de captura. Su principal ventaja es que permiten digitalizar documentos de tamaños mayores que los escáneres, y originales que no sean totalmente planos y presenten irregularidades, incluidas ciertas aplicaciones de cartón, tela, madera y otros materiales que impidan mantener su superficie pegada al cristal de un escáner.

Según el tamaño del original, la cámara se puede alejar más o menos para realizar la captura. El tamaño del documento resultante depende mucho de esta distancia y, sobre todo, de los megapíxeles del sensor. Lo idóneo, además, es utilizar trípodes o soportes especiales, así como un sistema de iluminación controlado:

Esquema de iluminación para un documento original plano o abierto 180 grados: toma vertical y dos luces a 45 grados.
A la izquierda, una adaptación con soporte para una apertura de 120 grados: la cámara se coloca a 30 grados y está acompañada por un foco inclinado 15 grados. A la derecha, con soporte para una apertura a 90 grados: cámara a 45 grados y foco perpendicular.

Tratamiento y archivo

Tras la digitalización, los documentos pueden necesitar un tratamiento de ajuste y dimensionado que unas veces puede ser casi completamente automático y otras conlleva un proceso largo y delicado.

En general, un libro puede generar muchos archivos informáticos, ya que necesita tantos escaneados como páginas (o más, si se extraen aparte las ilustraciones). Si el destino es la conversión OCR, solamente se precisa una copia a tamaño adecuado.

Pero en láminas y libros especiales que se ofrecen en imágenes, es habitual llegar a tres versiones: una a bastante resolución, hábil para la consulta en detalle e impresión a buen tamaño; otra a tamaño intermedio, adecuada para su visualización en una pantalla, y una tercera en miniatura, para una ficha de datos o la previsualización en un catálogo.

Obviamente, lo mejor es digitalizar cada página una única vez con los requerimientos de la primera versión, que se guarda en un formato adecuado para la impresión, como TIFF. Las otras versiones se hacen a partir de ésta, habitualmente en JPEG.

Esta cantidad de archivos requiere una nomenclatura extensa, que sea eficaz para su localización y acorde con las propuestas de normalización de las instituciones competentes. Un ejemplo:

BBBBBBBB_FFF_SSSSSSSSSS_NN_PPPP_C_V

El tramo B identifica a la biblioteca, fundación o archivo. F se refiere al fondo documental. S es la signatura de la obra. N, el número de volumen. P, la página. C, la cobertura. Finalmente, V es la versión.

Las coberturas habituales son: p para página completa, z para doble página y d para detalle. En caso de que se registren varios detalles en la misma página, se ordenan alfabéticamente como da, db, dc.

En cuanto al tratamiento como imagen, hay técnicas específicas para los documentos digitalizados. La manera de aplicar la herramienta Niveles o enfocar los textos, además de otros consejos para la digitalización, constituirán el grueso del próximo artículo.

Paulo Porta

Paulo Porta es profesor de instituto. Imparte plástica y fotografía digital y es autor del manual 'Fotografía e Imaxe Dixital'.

Los artículos de la serie "Mapa de bits" se publican, normalmente, los días 15 y 30 de cada mes.



<< Noticia anterior   Noticia siguiente >>
 Imprimir esta noticia
 Enviar a un amigo

Fotografía: página principal

última foto publicada:
69/365, Fragmentos para una Historia de la Mierda
últimas noticias


suscripciones
boletines
Para suscribirte a los
boletines debes registrarte antes.
Si ya eres usuario de
QUESABESDE.COM,
haz clic aquí.
RSS
Facebook
Twitter
publicidad
Las más nuevas

marzo, 2010
   Panasonic G10
   Panasonic G2

febrero, 2010
   Pentax Optio X90
   Pentax Optio W90
   General Electric X5
   General Electric G5WP
   Samsung WP10
   Samsung ES73
   Samsung WB2000
   Casio EX-S7
¿Qué significa esta tabla? Las últimas cámaras digitales aparecidas en el mercado.

Más visitados
 1. Pentax K-x
 9,09% de visitas 9,09%
 2. Canon EOS 550D
 8,24% de visitas 8,24%
 3. Nikon D90
 7,1% de visitas 7,1%
 4. Canon EOS 1000D
 6,14% de visitas 6,14%
 5. Nikon D5000
 6,08% de visitas 6,08%