Início | Hoje | Mais ▼
Acerca | RSS | Registar | Entrar

Acerca do Busca Tretas

O Busca Tretas é um motor de busca especializado, focado no media on-line português.

Este serviço surgiu da necessidade de procurar informação sobre os assuntos tratados no tretas.org.

O tretas.org é um sitio onde queremos usar a informação disponível publicamente, proveniente de fontes reputadas ou pelo menos que sejam sujeitas a algum escrutínio público para documentar de uma forma estruturada o que se vai passando no nosso país.

Para isso necessitamos de ter acesso às fontes de informação e, tão importante como isso, temos de conseguir procurar nessas fontes com qualidade e eficiência as referências necessárias.

As nossas fontes principais são os jornais on-line. Infelizmente, talvez devido à juventude da Internet, os jornais não só não estão indexados convenientemente, como há vastas regiões do respectivo conteúdo que não são indexadas de todo. Além disto, salvo raras e honrosas excepções (como o DN e JN), as facilidades de busca de cada site são rizíveis e de uma forma geral impossíveis de usar para fazer um trabalho sério. Em todo o caso fica impossível obter as notícias de mais de uma fonte ao mesmo tempo.

O Busca Tretas propõe-se resolver estes problemas:

  • Apenas indexamos fontes do media mainstream, os resultados, por este motivo vão ficar constrangidos desde logo a estas fontes, ou seja não vai haver poluição de outras fontes no nossos resultados;
  • Cada fonte é tratada de uma forma específica de forma a que em cada documento indexado apenas seja considerada a notícia em sí e nem mais um bit de informação;
  • Vai-se poder obter imediatamente informação de várias fontes e filtrar essa informação de acordo com vários critérios.

Da construção deste motor de busca resultaram alguns efeitos secundários que vale a pena referir. Uma vez construída a base de dados que indexa os artigos, tornou-se quase óbvio permitir ao utilizador navegar dia a dia. Construiu-se a infraestrutura que permite essa navegação e acrescentaram-se funcionalidades de filtragem dos resultados. O utilizador pode pois, deslocar-se para qualquer data coberta pelos nossos dados e analisar não só o assunto em que está interessado, mas também consultar e observar todo o contexto que envolve esse assunto, seja ele qual for. Esta funcionalidade é fundamental muitas vezes para compreender eventos passados e nem sempre é aparente quando analisamos apenas os resultados de uma busca.

Outra funcionalidade implementada, cuja necessidade não podíamos antecipar quando iniciamos este projecto, foi uma colecção de ferramentas que permite marcar as notícias e fazer a respectiva gestão. Isto passa por termos uma lista de favoritos de consulta muito fácil, adicionalmente os elementos desta lista podem ser categorizados e anotados para posterior referência. Como pudemos aplicar múltiplas categorias a cada notícia resulta a possibilidade de cruzar dados e extrapolar nova informação a partir da informação existente. Esta funcionalidade também é fundamental para conseguirmos lidar com a quantidade massiva de informação disponível.

Observando as funcionalidades anteriores fica claro que um investigador ou uma pessoa interessada pode com pouco esforço desenhar as circunstâncias em que se deu um determinado evento bem como analisar a respectiva envolvente. No passado, este domínio sobre a informação apenas estava disponível a profissionais ou a pessoas com recursos (por exemplo jornalistas, historiadores, detectives, partidos políticos, governos, etc). Com um site como o Busca Tretas, qualquer pessoa o pode fazer.

Finalmente, por forma a maximizar o efeito do esforço de cada um, estão implementadas as funcionalidades necessárias para partilhar a informação encontrada, a lista de marcadores é pública por omissão (pode ser privada opcionalmente), permitimos fazer-se comentários a cada notícia, etc.

Julgamos que com este site estamos a dar um contributo para a verdadeira democratização do acesso à informação, proporcionando ao cidadão comum as ferramentas necessárias para fazer análises profundas com a mesma facilidade aos temas que marcam a actualidade ou a eventos situados no passado mais distante.

Todos os cidadãos são convidados a utilizar este site. Qualquer comentário, crítica ou sugestão pode ser enviado para: webmaster@tretas.org.

Helder Guerreiro

José Lopes

PS: É claro que o direito de cópia dos resultados obtidos é dos respectivos proprietários.

Nota técnica

Este sistema corre sobre Linux, utilizam-se os seguintes sistemas principais:

  • Base de dados PostgreSQL;
  • Índice feito utilizando a biblioteca Xapian;
  • Interface web feita com Django;
  • Os icons utilizados no site foram retirados da colecção de icons do Projecto KDE, estão sob licença GPL v2.

Corre num servidor HP ML110 G3, completamente obsoleto!