Pesquisadora quer ensinar computadores a reconhecer spams com mais precisão

17/08/2011

Por meio de "aprendizado ativo", computador tomaria decisões a partir de padrões de comportamento do usuário.

Sem a detecção de spams, muitos de nós gastaríamos horas gerenciando uma avalanche diária de e-mails. Para ajudar nessa luta interminável, a pesquisadora Nina Balcan desenvolveu uma máquina que aprende métodos que podem ser usados para desenvolver programas personalizados que decidem automaticamente se e-mails são spam ou não. Graças aos esforços da cientista da computação, o Instituto de Tecnologia da Georgia ganhou um dos prêmios do Microsoft Research Faculty Fellowship, que deu 200 mil dólares para serem utilizados a critério da pesquisadora.

Os resultados dos estudos de Balcan podem ser utilizados para resolver muitos problemas de separação e dados, argumentou a cientista; e a detecção de spam é apenas uma das muitas aplicações possíveis. Um computador poderá decidir se um e-mail é um convite verdadeiro de um de seus amigos do Facebook ou apenas uma mensagem enviada como tentativa de phishing – e há diversas maneiras de ensinar a máquina a como se comportar.

Com uma técnica chamada de aprendizado supervisionado, o usuário ensina o computador ao alimentá-lo com informações a respeito de quais e-mails são spam e quais são seguros.

“Portanto, uma pessoa precisa rotular um número enorme de mensagens como seguras ou não, o que não é o mais eficiente”, explicou Balcan. Um método melhor seria utilizar o aprendizado ativo, de acordo com a cientista. Dessa maneira, o computador usa coleções imensas de e-mails que não foram sinalizados para gerar apenas algumas perguntas para o usuário, reduzindo o esforço humano necessário, já que a pessoa precisa sinalizar apenas alguns.

Tipicamente, as perguntas seriam sobre exemplos não identificados que a máquina tem menos certeza, dado seu conhecimento naquele momento. O computador pode identificar padrões em e-mails que o usuário já categorizou e, então, selecionar as mensagens ainda não sinalizadas que não combinam com os padrões aprendidos. Ao utilizar essas dúvidas, o computador aprende novos padrões, afirmou Balcan.

O aprendizado ativo tem potencial para sempre produzir melhores resultados do que a partir do aprendizado supervisionado, comparou a pesquisadora. No entanto, esse primeiro método é extremante sucessível a erros, tornando-o potencialmente difícil de ser concretizado. Uma única vez em que o usuário sinalizar um e-mail confiável como spam por engano pode deixar todo o sistema na direção errada, da qual talvez ele nunca possa se recuperar. O objetivo do trabalho da pesquisadora é mudar esse panorama. “Estou procurando por métodos mais robustos” comentou Balcan.

De maneira geral, a pesquisadora pretende desenvolver a compreensão de quando diferentes tipos de protocolo aprendizado ajudam, por que e por quanto. A abordagem da estudiosa é interdisciplinar. “Minha pesquisa conecta aprendizado das máquinas, teoria dos jogos, economia e otimização” definiu Balcan, que colabora com  estatísticos, teóricos, cientistas da computação, teoria dos jogos e os biólogos computacionais.

Site: IDG Now!
Data: 16/08/2011
Hora: 10h
Seção: Mercado
Autor: Nicolas Zeitler
Link: http://idgnow.uol.com.br/mercado/2011/08/15/pesquisadora-quer-ensinar-computadores-a-reconhecer-spams-com-mais-precisao/