terça-feira, 4 de setembro de 2012

Mecanismo de busca inspirado em Ranganathan identifica contexto, opinião e ajuda a prever o futuro





Informações contextualizadas

Inspirados pelas ideias propostas por um bibliotecário indiano há quase um século, uma equipe europeia desenvolveu um novo sistema de buscas para a internet que leva em conta fatores como opinião, contexto, tempo e localização.

A nova tecnologia, que promete chegar ao mercado rapidamente, consegue mostrar tendências na opinião pública sobre um determinado assunto, companhia ou pessoa, e como essa tendência muda com o tempo.

A equipe do projeto Living Knowledge (conhecimento vivo, em tradução livre) acredita que seus algoritmos permitirão até mesmo fazer previsões sobre o futuro.

"Faça uma busca pela palavra 'clima' no Google, ou em outro motor de busca qualquer, e o que você receberá de volta será basicamente uma lista de resultados que caracterizam a palavra: não há categorização, nenhuma ordem específica, nenhum contexto.

"Os motores de busca atuais não levam em conta as dimensões da diversidade: fatores como quando a informação foi publicada, se há uma tendência de favorecer uma ou outra opinião, quem publicou e quando," explica Fausto Giunchiglia, professor de ciência da computação na Universidade de Trento, na Itália.

Google da diversidade

Mas será que a tecnologia de buscas na internet poderá ser capaz de abarcar a diversidade? Poderá um mecanismo de buscas dizer-lhe, por exemplo, como a opinião pública sobre as mudanças climáticas mudaram na última década? Ou como a temperatura poderá estar daqui a um século, agregando estimativas atuais e do passado a partir de fontes diferentes?

Giunchiglia garante que não apenas é possível, como isso já pode ser feito a partir dos resultados do projeto.

Os pesquisadores foram buscar inspiração no sistema de classificação de livros criado por Sirkali Ramamrita Ranganathan nos anos 1930, que permite atribuir múltiplas características a um livro, revista ou artigo.

Em vez de uma posição taxonômica fixa, o sistema permite, por exemplo, que um texto sobre os efeitos das mudanças climáticas na agricultura escrito no Brasil em 2010 seja classificado como "Geografia; Clima; Mudança Climática; Agricultura; Pesquisa; Brasil; 2010".

O que os cientistas fizeram foi transformar o pseudo-algoritmo de Ranganathan em um algoritmo codificado em um programa para minerar dados na internet.

Isso permite extrair de cada texto um significado e um contexto, associando-lhe as chamadas "facetas" da classificação bibliográfica. "E usar essas facetas para estruturar a informação com base nas dimensões da diversidade," completa o professor Giunchiglia.

Conhecimento aberto

O programa básico será disponibilizado como software de código aberto, e vários parceiros do projeto Living Knowledge afirmaram que pretendem implementar a tecnologia em produtos comerciais.

O professor Giunchiglia, por sua vez, anunciou que pretende criar uma fundação sem fins lucrativos para implementar os resultados do projeto, um de cada vez, conforme surjam demandas para isso.

Fonte: Inovação Tecnológica

Nenhum comentário:

Postar um comentário