Ferramenta permite pesquisar em bancos de dados de impressos dos últimos 200 anos

Ngram Viewer mapeia conteúdo publicado em milhões de livros entre 1800 e 2000.

Bruno Leal | Agência Café História

O Google Labs, inovadora seção de aplicativos protótipos do Google, lançou no último dia 16 de dezembro o Google Books Ngram Viewer, uma ferramenta elegante e que pode em breve se tornar um verdadeiro aliado para os historiadores. O Books Ngram Viewer utiliza o banco de dados do Google Books para calcular quantas vezes um mesmo nome, frase, termo, expressão ou conceito foi utilizado entre 1800 e 2000. Assim, com apenas alguns cliques é possível saber em menos de um segundo a trajetória de uma palavra ao longo de dois séculos de cultura escrita e descobrir um pouco mais sobre as tendências culturais, políticas e sociais de nosso tempo.

Tela do Google Books Ngram Viewer
Tela do Google Books Ngram Viewer

Books Ngram Viewer é muito simples. Para usar o aplicativo, o internauta precisa preencher apenas três espaços: palavra(s), período e a língua a ser pesquisada. Depois, basta clicar em Search lot of books. O sistema, então, consulta um banco de dados de mais de 500 bilhões de palavras, divididas entre 5 milhões de livros, publicados entre 1800 e 2008 e digitalizados pelo Google nos últimos anos. Essa consulta gera um gráfico no qual é possível observar a evolução (ou involução) de uma palavra ao longo do tempo.

Como tudo começou

O “Books Ngram Viewer” nasceu em 2004, quando os peesquisadores da Universidade de Havard, Jean-Baptiste Michel e Lieberman Aiden, começaram uma pesquisa sobre verbos irregulares no inglês. Os dois buscavam determinar quando formas verbais específicas deixaram de ser usadas em detrimento de outras, mais modernas. Na época, esse tipo de pesquisa era possível apenas manualmente: página por página, livro por livros. O processo todo lhes custou longos 18 meses. Pouco mais de um ano depois, Jean-Baptiste e Lieberman souberam dos planos do Google para digitalizar todos os livros do mundo. Os dois, então, entraram em contato com Peter Novig, diretor de pesquisa do Google. Novig logo percebeu a importância daquela ideia para a ciência e deu carta branca para os desenvolvedores. O Books Ngram Viewer é a versão mais acabada desta ideia e utiliza 4% do banco de dados do Google Books. O Google Books Ngram Viewer utiliza um método de modelagem chamado N-gram, que possibilita buscas em sequências de linguagem natural.

Historiadores

Para os historiadores, o programa desenvolvido pelo Google é muito bem-vindo. Como bem se sabe, as palavras não são entidades estáticas, programadas para ter um começo, meio e fim. Mas pelo contrário: são vivas, políticas, sujeitas à ação dos homens em sociedade. E o Books Ngram Viewer mostra muito bem isso. Com ele é possível identificar quais termos são mais sensíveis que outros, desvendar dimensões até então pouco abordadas da memória social e outros processos políticos e sociais de diversos períodos históricos.

O Café História testou várias combinações. No clássico Brazil x Argentina, na língua inglesa, por exemplo, nós continuamos dando de goleada. O Brasil sempre foi muito mais citado do que o vizinho. No entanto, é curioso observar que tanto o crescimento quanto a queda das referências a ambos seguem o mesmo padrão. A década de 1940 representa o período de maior menção aos dois países, o que pode ser explicado pelo auge da cultua do American Way of Life e sua influência na América do Sul.  Curioso também notar a trajetória de palavras caras à historiografia. É o caso do termo “holocaust”, utilizado para se referir ao extermínio de seis milhões de judeus durante o Terceiro Reich (1933-1945). Segundo o Books Ngram Viewer, a palavra conheceu um verdadeiro boom na década de 1980, o que reforça aquilo que muitos historiadores já tinham notado: aquela década experimentou uma explosão de narrativas e representações do Holocausto.

Seja o primeiro a comentar

Faça um comentário

Seu e-mail não será divulgado.


*