terça-feira, 2 de setembro de 2014

Internet Archive traz milhões de imagens históricas ao Flickr


O Internet Archive já disponibilizou mais de 2 milhões de imagens do domínio público na sua conta do Flickr

Jornal I - Portugal

A iniciativa partiu de Kalev Leetaru, um acadêmico norte-americano que começou a trabalhar em milhões de imagens (o Ars Technica estima serem 14 milhões) pertencentes a livros digitais do domínio público. Ao todo já foram disponibilizadas mais de 2,6 milhões de imagens no Flickr .

O Internet Archive digitalizou todos os seus e-books através de OCR (Optical Character Recognition), uma tecnologia que permite tornar o texto dos livros pesquisável. A partir desta base Leetaru desenvolveu um software capaz de tirar partido desta tecnologia, utilizada na digitalização de livros escritos entre 1500 e 1922. Segundo a BBC, contudo, o programa OCR descartou secções de texto que reconheceu como imagens.

O software de Leetaru, por sua vez, teve de voltar atrás no processo e descobrir quais foram as porções de texto descartadas, de forma a convertê-las automaticamente em imagens Jpeg. O passo seguinte envolveu disponibilizar as imagens no Flickr. “O software também copiou as captações para cada imagem, bem como o texto dos parágrafos que no livro antecedem e sucedem a imagem”, afirmou a BBC.

Para Leetaru, contudo, o ideal seria ver bibliotecas de todo o mundo adotar práticas semelhantes. “Na verdade essa é a minha esperança”, afirmou. “Que as bibliotecas de todo o mundo apliquem este mesmo processo aos seus livros digitais, para poderem expandir constantemente este universo de imagens”.

Nenhum comentário:

Postar um comentário