Mecanismos de Busca na Internet - 24/08/2006
Em busca de um melhor aproveitamento nas pesquisas via Web
Cansou de clicar no Google em busca de informações na Internet? Você é daquelas pessoas que acreditam que o único buscador da Web é o atual recordista de acessos? Yahoo, Alta Vista, MSN Busca, Vivisimo e Alltheweb são ilustres desconhecidos para você e seu micro? Há formas mais rápidas e seletivas para que as pesquisas empreendidas nesses mecanismos de busca da Internet sejam mais eficientes?
Uma pergunta de cada vez para que não fiquemos confusos. Em relação ao Google, por exemplo, a sua onipresença em nossos computadores é derivada de vários fatores. Entre eles podemos destacar a capacidade de inovação de suas ferramentas, a facilidade de uso, a enorme quantidade de páginas agregadas aos seus mecanismos de busca e a rápida popularização de seu pouco usual e simpático nome.
O Google, como toda grande realização da Internet é, sobretudo, resultado da ação de jovens empreendedores que começaram a trabalhar praticamente na garagem ou no porão de suas casas (no caso do Google, no dormitório da universidade de Stanford). Atualmente é o maior e mais acessado site do mundo. As pesquisas realizadas diariamente e mundialmente em sua gigantesca base de dados e informações sobre páginas da Internet supera marcas bilionárias...
A despeito do início um tanto quanto “romântico” de atividades (seguindo os padrões históricos de criação de mega-empresas como a Apple ou a Microsoft) por parte dos criadores do Google, os jovens Larry Page e Sergey Brin (o primeiro é norte-americano e o segundo é russo, numa combinação que é bem a cara do mercado globalizado pós-queda do Muro de Berlim), atualmente a empresa é uma potência que inclusive movimenta muito dinheiro no mercado de ações (nos pregões da Nasdaq) e que têm filiais em várias partes do mundo (inclusive em São Paulo).
O Google não está sozinho no mercado, há outros buscadores
que prestam
serviços qualificados, como é o caso do
Yahoo Search,
do AltaVista, do Vivisimo ou do MSN Busca.
Atualmente as ações da Google têm um valor quase cinco vezes superior aos 85 dólares inicialmente cobrados quando lançadas no mercado em 2004. A empresa tem um valor de mercado superior ao de gigantes estabelecidos há muito mais tempo, como a Coca-Cola, a Boeing ou a Motorola. O site Yahoo, um de seus concorrentes, que tem um tempo de mercado um pouco mais longo (e conseqüentemente maior longevidade na exposição de sua marca) arrecada pouco menos da metade do Google. Os dados mais recentes (janeiro/2006) demonstram que há mais de 8 bilhões de URLs1 em sua base de busca.
Para seus usuários, a simplicidade reside em acessar o www.google.com.br, digitar o assunto a ser pesquisado para que, em poucos segundos, milhares de páginas de websites relacionados ao temas sejam disponibilizados. Há, no entanto, algumas preocupações importantes para os menos-avisados ou pouco habituados ao contato com o Google ou qualquer outro mecanismo de busca, ou seja, muitas e muitas páginas apresentadas na pesquisa podem não ter absolutamente nada a ver com a pesquisa.
Nesse sentido é de essencial importância que, seja no Google ou nos seus concorrentes diretos, nos preocupemos em separar o joio do trigo. Para isso valem algumas importantes e simples medidas que tornarão sua busca menos atribulada e passível de erro. Para tanto iremos trabalhar inicialmente com um tema de interesse específico da educação, a própria palavra Educação, como objeto de pesquisa para ilustrar o uso desses mecanismos.
Ao digitar esse vocábulo no Google temos acesso a mais de 43 milhões de páginas que versam sobre o tema. Nem todas as páginas têm como objetivo principal o tema Educação e explicações acerca de suas características, história, conceitos, correntes,...
A disponibilização das páginas utiliza elementos de apresentação ordenada pela quantidade de vocábulos semelhantes ao digitado na origem da pesquisa ou, em certos casos, a média de pageviews (entradas nas páginas dos sites), dando-se então maior ênfase aos campeões de acesso. Isso quer dizer que nem sempre você irá encontrar as informações que deseja logo nas primeiras páginas mostradas a partir de sua pesquisa, é muito provável que algumas dessas páginas sejam úteis a você, no entanto tenha sempre a preocupação de verificar com atenção o conteúdo lendo rapidamente os dados sobre o site que aparecem embaixo do nome do mesmo.
Pelos serviços de busca e seus mecanismos específicos que
rastreiam
imagens, vídeos e áudios podemos encontrar
fotografias, trechos de
filmes ou ainda músicas em diversos
formatos
(As imagens acima foram obtidas a partir de pesquisa noYahoo Search).
Se essa leitura não for suficiente, clique e acesse a página. Uma passagem rápida pelos conteúdos das mesmas em suas homepages será suficiente para que você perceba se satisfazem sua pesquisa. Outra forma de agilizar a pesquisa e, evitar que sua navegação aconteça em muitas páginas desnecessárias ao seu percurso é especificar se você quer que a pesquisa seja feita apenas em páginas cuja língua é o português ou ainda em sites que tenham o Brasil como país de onde as URLs se originam.
No Google, ao pedir acesso apenas as páginas em português houve uma diminuição de dois milhões de endereços disponíveis nas páginas ofertadas sobre o assunto. Ao pedir somente as páginas brasileiras a redução foi de mais de 10 milhões de páginas... Ao realizar o mesmo trajeto no Yahoo Search (http://br.search.yahoo.com/), encontramos inicialmente 17 milhões de páginas e, usando o buscador apenas para páginas em português essa quantidade diminuiu para 16 milhões e meio.
Alguns buscadores que possuem recursos diferenciados, como é o caso do Vivisimo (www.vivisimo.com), que coloca uma classificação das páginas encontradas partindo-se de um de seus qualificativos (no caso de Educaçao, surgiram classificações como: Universidade, Escola, Ministério da Educação, Educação à Distância, Virtual,...), disponibilizam uma quantidade muito mais reduzida de sites sobre os temas pesquisados. Em uma busca sobre educação encontramos “apenas” 1 milhão e duzentas mil páginas acerca desse assunto...
Praticamente todos os buscadores possuem ferramentas que auxiliam os internautas a encontrar imagens, vídeos, áudios ou notícias. Isso é uma restrição percebida no Vivisimo, que não possui tais elementos de pesquisa. Por outro lado, esse buscador nos oferece a possibilidade de vasculharmos os artigos de algumas importantes agências noticiosas do mundo, como a Reuters, a CNN, o Washington Post, o New York Times ou a BBC.
Os elementos básicos da página inicial de um buscador
pouco variam. Há os indicativos dos elementos que se buscam
logo abaixo do logotipo da empresa (web, imagens, MP3/Áudio e
Vídeo), um espaço para digitar o termo pesquisado com
o
botão que inicia a busca, um link para configurar pesquisas
avançadas e direcionadores da pesquisa que permitem direcionar
a pesquisa em termos de língua e país pesquisado. (Acima o exemplo do AltaVista).
A busca por imagens/vídeos/áudios/notícias no Alta Vista, no Google ou no Yahoo nos proporciona diferentes respostas em quantidades e origens das imagens. Há muito material semelhante surgindo nessas buscas (assim como o que acontece quando vasculhamos a Web através desses buscadores atrás de sites), no entanto, se você precisa de diversidade é sempre interessante realizar buscas em todos eles para verificar as eventuais diferenças que irão surgir.
Ao clicar, por exemplo, em busca de vídeos sobre o cineasta Michael Moore (de Fahrenheit 11/9 e Tiros em Columbine), consegui encontrar 586 links no Yahoo, 498 no Alta Vista e somente 221 no popularíssimo Google. Diga-se de passagem que a página em português do Google, destinada ao Brasil, ainda não possui o recurso de busca de vídeos. Dessa forma é preciso acessar sua versão norte-americana (www.google.com) para que consigamos obter essas produções na internet por esse buscador. Esse serviço ainda é novo no Google, por isso suas referências ainda são em menor número do que as de seus concorrentes.
Na busca por imagens resolvemos clicar Monet, o famoso artista francês, encontramos 275 mil referências no Google, 113 mil no Yahoo e 118 mil no Alta Vista. Não há como afirmar se entre as imagens encontradas no Google estão todas as que aparecem nos outros buscadores, o mais provável é que isso não aconteça. Por isso, se você realmente quiser diferenciar seu trabalho, não tenha preguiça e entre nos três maiores mecanismos de busca da Internet e arrisque-se a encontrar o que quer.
A Microsoft também possui um buscador através de seus serviços no Brasil. Esse mecanismo é o MSN Busca (http://search.msn.com.br/) e oferece recursos para a pesquisa de URLs, Notícias e Imagens, como os seus concorrentes. A sua base de referências é reduzida quando comparada com o Google ou os outros competidores do mercado. Por exemplo, quando digitamos educação tivemos “apenas” 242 mil repostas... Há de se destacar, no entanto, que o banco de imagens é de boa qualidade e oferece imagens interessantes não encontradas em outros buscadores.
Os buscadores normalmente listam relações de 10 a 20 páginas sobre o
assunto pesquisado de cada vez. Tenha sempre disposição e uma
enorme dose de boa vontade ao fazer suas pesquisas para não desanimar
e deixar de olhar depois das primeiras páginas. O material
diferenciado para a sua produção pode estar ali...
(acima o exemplo do MSN Busca).
Uma importante dica para quem vai pesquisar usando esses buscadores é ter sempre um conjunto de palavras relacionadas ao tema principal como suporte e subsídio ao seu levantamento. Por exemplo, se o objeto de sua pesquisa é o filme Central do Brasil, procure também a partir do nome dos artistas (Fernanda Montenegro, Vinicius de Oliveira, Marília Pera, Othon Bastos,...), do diretor Walter Salles Jr. ou em cinema brasileiro, cultura nacional, sites sobre cinema,... Se for o caso, faça buscas utilizando também termos em inglês, a dimensão de sua busca será muito maior...
Outra prática que nos auxilia em nossas buscas na Internet é a utilização dos recursos de pesquisa avançada oferecidos por todos os buscadores. Por exemplo, propus uma pesquisa no Google tendo como tema a palavra Brasil, recebi como resposta um total de 296 milhões de páginas. O meu objetivo não era esse tema tão amplo, por isso entrei nos mecanismos de pesquisa avançada e coloquei que a expressão Congresso Nacional deveria fazer parte da pesquisa e que esse levantamento deveria se restringir apenas ao último ano; ao mesmo tempo defini que as palavras Senado, Câmara e Deputados deveriam aparecer; firmei, entretanto, que o vocábulo partidos não deveria surgir nos links pesquisados... O resultado final foi que das 296 milhões de URLs sobre o Brasil restaram somente 1 milhão e 200 mil sites...
O Google Acadêmico, também conhecido como Scholar, é uma
preciosidade
para quem está pesquisando e produzindo teses,
dissertações ou trabalhos de conclusão de curso.
O mesmo exercício no Yahoo, sem restrição de período como no caso da pesquisa no Google, baixou a quantidade de páginas disponibilizadas de 97 milhões para 8 milhões e setecentos mil sites. Os resultados obtidos no Alta Vista baixaram de 68 milhões de páginas surgidas inicialmente sobre o tema Brasil para 5 milhões e meio de URLs.
Ao realizar suas pesquisas não se esqueça de verificar as credenciais das páginas pesquisadas, dos autores dos textos e das imagens, dos produtores dos vídeos e também a questão dos direitos autorais sobre o uso de qualquer um dos recursos que irá utilizar a partir desse levantamento. É essencial que os sites que sejam utilizados por você tenham uma “assinatura” que lhes conceda o crédito e a autenticidade para sua validação. Sem esse identificador da origem dos materiais é difícil crer que essas produções sejam confiáveis.
Quando falo em assinatura refiro-me a identificação do autor, da instituição que patrocina o site, do órgão governamental que subsidia esse trabalho ou da escola/universidade que dá ao mesmo o credenciamento que merece. Nesse sentido vale destacar um mecanismo em particular do Google chamado Scholar ou Acadêmico (como é conhecido no Brasil, acessível a partir do link http://scholar.google.com/schhp?hl=pt-BR). Através dele conseguimos artigos que têm fundamentação acadêmica e que, dessa forma, são muito valiosos para trabalhos em nível de 3º grau (universidade). Boa sorte em suas próximas pesquisas!
1 - URL = Universal Research Location – Endereço eletrônico das páginas da Internet.
1 rogerio da silva - sao paulo
Gostei muito deste artigo, pra dizer bem a verdade gostei ainda muito mais deste site, e espero que continuem nos presenteando com materias tao interessantes como essa. Meu muito obrigado. E sempre que desejarem, podem usar este endereço eletronico para se comunicarem.
26/08/2008 16:24:13
Os conceitos e opiniões emitidos em artigos assinados são de inteira responsabilidade dos autores.