Facebook SDK

Quem valoriza os dados estatísticos para mensurar audiência, aquisição e dados analíticos comportamentais geridos pelo Analitics do google para conduzir suas tomadas de decisões hoje convive ou sofre com o referer spam.

Spam de Referência (referrer spam)

Um referer é uma informação oriunda de um campo de cabeçalho HTTP que identifica o endereço da página. O servidores armazenam os logs de acesso permitindo que servidores web identifiquem de onde as pessoas o estão visitando.

O Spam de Referência foi projetado para gerar solicitações de acesso a partir de algum ponto (site qualquer) para alvos específicos (seu site) isso acontece a qualquer momento e em qualquer lugar ao redor do mundo pela utilização de bots de tráfego, computadores infectados, entre outras táticas de blackhat. Os spammers tentam através do referrer spam melhorar a classificação no motor de busca de seus próprios sites através desta ligação nos logs de acesso dos websites legítimos e de quebra atrair os donos dos sites para algum phishing de captura de emails, atraídos pelos picos de acessos repentinos.

Quais são as consequências?

Essa prática adotada pelos spammers modifica a taxa de rejeição na pesquisa, causa um aumento repentino de trafego, entre outros problemas para quem acompanha ou faz a aferição nas métricas e estatísticas. Para quem tem um grande volume de trafego isso pode não ser problema, mas para sites que tem um volume baixo de acessos esses números inflados podem arruinar seus cálculos usados  em estratégias, conversões e metas.


O que fazer?

Direto ao ponto: Muitos já abordaram esse assunto, inclusive um deles foi o site MOZ que sugeriu algumas medidas a ser tomadas neste link. Infelizmente a dura realidade é que há pouco o que se fazer! A solução definitiva teria que partir diretamente do Google em mudar radicalmente o funcionamento do rastreamento, pois mesmo modificando .htaccess não vamos bloquear o spam de referência fantasma!


Referências Fantasmas (ghost referrals)

Enquanto o bloqueio de referências maliciosas por .htaccess funcionam nos servidores, as referências fantasmas nunca chegam a entrar no site e não aparecem nos registros de nosso servidor. Este tipo de spam utiliza o código de acompanhamento (UA-XXXX) do Google Analytics que inserimos no código-fonte do site. Os bots criados pelos spammers conseguem obtê-lo facilmente e enviam os dados diretamente para a conta do Google Analytics, mesmo sem sequer ter que visitar nosso site.


Conclusão

Tal como acontece com e-mail spam, referrer spam pode ser "filtrada" ou "bloqueado" não definitivamente, mas podemos tentar diminuir a quantidade deles, pois novos bots são criados todos os dias, fazendo com que o bloqueio total seja impossível. Se você não trabalha com questões de métricas, usabilidade e comportamento o melhor é nem levar tão a serio o Google Analytics, pois vai gerar um trabalho extra e muitas vezes desnecessário, mas é bom monitorar o site verificando se existe uso abusivo das requisições e no uso de banda e então bloquear os bots.

Existe um projeto no github de gerar black list para piwiki constantemente atualizado, que poderia servir de base para montar seu arquivo de bloqueio.

Credito da imagem: projectdiscovery

Comentar

Cada comentário é apreciado, mas tenha em mente que os comentários são moderados e podem levar algum tempo para aparecer. Todos os comentários de spam serão excluídos.

أحدث أقدم