Tag Archives: spam

Bloquear los bots que spamean tus estadísticas de visita

Bloquear los bots que spamean tus estadísticas de visita

Hasta hace poco, los bots tipo ilovevitaly.com, semalt.com, darodar.com y muchos otros eran tolerables, no porque me gustaban pero porque raras veces superaban el 10% de las visitas así que había decidido no perder tiempo haciendo algo al respecto.

Todo cambio la semana pasada cuando de repente estos p…. bots alcanzaron el 75% del total de las visitas e intentaron logearse con un ataque de fuerza bruta que venía – que sorpresa – de China. Supongo que los Rusos estaban de vacaciones este día!

Como todo en la vida, llegado a cierto punto, la broma de niños se convierte en mosca cojonera que se tiene que aplastar, intoxicar, torturar o cualquier otra cosa para que entiendan que sería mejor ir a jugar un poco más lejos.

Los Content Delivery Network

Los CDN actúan como un desvió por el cual todo el tráfico tiene que pasar y todas las IP que están en lista negra quedan o bloqueadas o tendrán que resolver un Captcha. Un CDN gratuito como CloudFlare, pero existen muchos otros, se configura fácilmente y ofrece varios filtros interesantes como obligar los visitantes de ciertos territorios a resolver un Captcha para llegar a su página web.

Por desgracia, la versión gratuita no permite bloquear las visitas provenientes de Rusia (por ejemplo) y para configurar CloudFlare, el usuario debe absolutamente tener acceso a su hosting para cambiar los DNS, cosa imposible en las plataformas tipo wix, blogger, wordpress.org,…

Los CDN permiten también mejorar la velocidad general de la página web y los buenos plugins de caché suelen tener una opción de compatibilidad, así no se tiene que elegir entre seguridad y optimización, se puede tener los 2 a la vez.

Filtrar con .htaccess

Después de la primera etapa, las visitas suelen regularse y en teoría se ve menos nombre de países como Rusia, China o ‘not set’ pero los CDN no actúan como la varita mágica de Harry Potter y todavía hay mucha basura que tirar.

He leído en muchas webs como crear filtros en Google Analytics para que no aparezcan más los intrusos, y lo explico en la tercera parte para los que quieren hacerlo, pero para mí es como esconder el polvo bajo la alfombra, no lo ves pero sigue aquí y para mi es tan insoportable que la mosca cojonera de la que hablé al principio: tiene que desaparecer.

El .htaccess es el primero archivo que leen los navegadores, antes del index.php o html, y hay que andar con cuidado porque si equivocarse en el index.php no es grave, un error en el .htaccess puede bloquear del todo una página web sin posibilidad de volver atrás si el usuario no tiene un acceso FTP a su web.

Existen varias formas de añadir líneas de código al .htaccess, o por FTP o mediante un plugin como Yoast WordPress SEO que lo permite en ‘herramientas > editor de archivos > archivo .htaccess’. Prefiero el FTP porque siempre se tendrá la posibilidad de modificar el archivo, incluso en caso de error, pero es más sencillo hacer modificaciones desde un plugin.

Entre lo que encontré en la web y mis propias constataciones, recopile más de 70 dominios y subdominios cuyo único propósito es fastidiar el propietario de una página web. Si por lo menos ganaban algo lo podría entender pero no, es realmente fastidiar por el placer de fastidiar. Añadir las siguientes líneas en su .htaccess reducirá de forma muy importante las visitas indeseadas de bots y la ventaja es que tiene efecto inmediato.

RewriteEngine on
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*4webmasters\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*76brighton\.co\.uk [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*7makemoneyonline\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*adcash\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*adviceforum\.info [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*anticrawler\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*anticrawler\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Best\-seo\-offer\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*best\-seo\-solution\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Blackhatworth\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*blackhatworth\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Buttons\-for\-your\-website\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Buttons-for-website\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*buy\-cheap\-online\.info [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*cenokos\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*cenoval\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*cityadspix\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*cyprusbuyproperties\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Darodar\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*descargar\-musica\-gratis\.net [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Econom\.co [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*edakgfvwql\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*event\-tracking\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*forum20\.smailik\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*free\-share\-buttons\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*get\-free\-traffic\-now\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*gobongo\.info [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*googlsucks\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*guardlink\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*hulfingtonpost\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*humanorightswatch\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Ilovevitaly\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Iskalko\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*iskalko\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*kambasoft\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Lomb\.co [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Lombia\.co [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*luxup\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*myftpupload\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*netvibes\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*o\-o\-6\-o\-o\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*offers\.bycontext\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*openlinkprofiler\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*paparazzistudios\.com\.au [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*powitania\.pl [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*Priceg\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*prodvigator\.ua [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*ranksonic\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*resellerclub\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*s\.click\.aliexpress\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*savetubevideo\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*screentoolkit\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*securesuite\.co\.uk [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*securesuite\.net [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*seoexperimenty\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*sharebutton\.net [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*sharebutton\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*simple\-share\-buttons\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*site12\.social\-buttons\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*slftsdybbg\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*social\-buttons\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*socialseet\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*superiends\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*tasteidea\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*theguardlan\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*torontoplumbinggroup\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*trafficmonetize\.org [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*vodkoved\.ru [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*website\-errors\-scanner\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*websocial\.me [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*www1\.social\-buttons\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*ykecwqlixx\.ru [NC]
RewriteRule .* - [F]

Añadir filtros a Google Analytics

Llegado a este punto, después de haber ajustado un CDN y añadido líneas de código al .htaccess deberíamos estar contentos pero no, los profesionales del spam han descubierto el modo de actuar directamente con el código de rastreo de Google Analytics.

Un internauta dejo un ejemplo muy claro, tenía una web ‘muerta’ sin dominios ni nada pero cuando todavía estaba ‘viva’ tenía un código GA que le servía a rastrear sus visitas y le sorprendió descubrir que, meses después, GA registraba visitas en una web que no exista más…

Como he dicho antes, el método GA no elimina el problema, solo lo esconde, pero por los que no pueden o no quieren modificar el .htaccess es una solución alternativa.

Existen 2 grandes métodos, el rápido que consiste en excluir directamente el tráfico no deseado de las estadísticas de GA, la pega de este método es que no se podrá saber cuál es la proporción de visitas spam que se recibe. El segundo método es más largo pero tiene la ventaja de ver el trafico normal – sin spam – pero también de poder ver la proporción de trafico toxico e incluso crear un informe. Puede ser útil para ver cómo evoluciona la amenaza potencial en segundo plano y hacerse una idea de si se prepara un ataque más gordo de tipo DDoS.

Los 2 videos de abajo explican los pasos a seguir. En el caso del método rápido, se tarda menos de 1 minuto para añadir un filtro pero insisto sobre el hecho que no se podrá tener idea de la proporción de tráfico que representan los bots de semalt.com y otros.

Compartir