Nos bastidores de muitos sites, os filtros colaborativos estão tocando nas preferências de pessoas semelhantes a você para ajudar a recomendar outros produtos, histórias ou links que você pode gostar.

Você viu esses filtros em ação no recurso "Clientes que compraram este item também compraram" da Amazon, em "Recomendações no futuro" do Digg e em muitos outros lugares.

No South By South West Interactive, um painel formado por representantes do Digg, The Filter, Baynote, Netflix e Last.fm reuniu-se para falar sobre a importância desses mecanismos de recomendação..

Anton Kast, cientista-chefe do Digg, explicou como esses filtros começaram com filtragem de e-mails e Usenet com base na classificação das pessoas, antes de sair da esfera de pesquisa e para a web comum..

"A idéia de filtragem colaborativa é simplesmente combinar a entrada de muitas pessoas diferentes para filtrar informações melhor do que seria possível. Em particular, você usa informações de muitos julgamentos independentes de muitas pessoas, para fazer algo que você não poderia ter feito apenas com ciência da computação e metadados e fatos que não vieram de seres humanos reais ".

Kast continua: "Esta técnica está em toda parte. Pode parecer obscura, pode parecer especializada, mas na verdade é tão simples que é quase universal".

Exemplos comuns incluem filtros de spam do Gmail, PageRank, marcação de vídeos do YouTube, votação de comentários em fóruns e sistemas de ajuda.

Então, isso é filtragem colaborativa, mas o que é recomendação?

"Qualquer filtragem colaborativa onde a saída é personalizada", diz Kast, apontando recomendações na Amazon, de músicas na Last.fm e filmes na Netflis como exemplos.

E, claro, a filtragem colaborativa aparece no Digg. "No Digg qualquer um pode enviar uma história", diz Kast. "E qualquer um pode votar em qualquer história - essa é a parte filtrante, e o que for mais popular ganha. É um gigantesco filtro colaborativo no sentido mais simples e clássico. Mas, se você fizer login, analisaremos seu histórico de votos, correlacionaremos com outros Histórias de voto das pessoas, e encontrar histórias que essas outras pessoas gostaram e mostrar-lhe aqueles, então você recebe filtragem colaborativa personalizada ".

Mas há quatro problemas básicos com essa abordagem, diz Kast.

O primeiro é a dispersão: "as pessoas que fazem a filtragem são escassas em comparação com a quantidade de conteúdo que precisa ser filtrada", explica Kast. "Se há mais histórias do Digg do que pessoas votando lá, obviamente não estamos obtendo uma boa cobertura.

"Em segundo lugar está o problema do examinador inicial, em que algo é apenas submetido e você não tem muitas informações de votação para fins de filtragem."

Terceiro é o que Kast se refere como "o problema das ovelhas cinzentas" - onde o que é mais popular aparece na página inicial, "e coisas que não são particularmente populares mas que um pequeno grupo de pessoas é louco - como você serve isso? pequeno grupo de pessoas? "

E finalmente, diz Kast, há oposição do usuário. "O Digg tem uma história fascinante onde, de vez em quando, um grande número de pessoas fica incrivelmente entusiasmado com uma coisa e acaba na nossa home page e luta contra as metas que temos para representar pequenos grupos ou ter conteúdo diverso, mas isso é apenas um problema fundamental - quando você está confiando nas pessoas, há vontade popular. "