چگونگی متوقف کردن Crawler و Ghost Spam در Google Analytics
یکی از مفیدترین ویژگی های Google Analytics این است که به مدیران وب کمک می کند URL های ارجاعی که از سمت دیگران به وب سایتشان می آید را پیگیری کنند. متأسفانه اسپم ها از این امکان استفاده می کنند تا وب سایت های خود را ارتقاء دهند یا به تصویر شرکت های غیر مرتبط را با وارد کردن نام دامنه خود به عنوان URL های ارجاع در داده های Analytics شما ، آسیب می رسانند. دو نوع اصلی از هرزنامه وجود دارد که می تواند از این قابلیت استفاده کند : Ghost spam و Crawler spam.
Ghost Spam چیست و چگونه آن را فیلتر کنیم ؟
هرزنامه هایی که از این روش استفاده می کنند ، در واقع سایت شما را نمیبینند.در عوض، این نمونه هرزنامه از پروتکل اندازه گیری استفاده می کند و به مردم این امکان را می دهد که داده ها را مستقیما به Google Analytics ارسال کنند و از طریق آن اطلاعات مخرب را اضافه کنند. معمولا، آنها به صورت تصادفی کدهای ردیابی تجزیه و تحلیل را تولید می کنند(UA-XXXXX-1).به این ترتیب آنها اطلاعات جعلی در حساب خود تولید می کنند ، بدون اینکه هیچگونه ردیابی انجام دهند.
از آنجایی که اسپم ها در فضای مجازی نمی دانند کدام دامنه آنها را به Google Analytics ارسال می کند ، آنها از نام هاست خود استفاده می کنند که هیچ ارتباطی با سایت شما ندارد یا اینکه آنها هیچ نام دامنه ای را مشخص نمی کنند. شما به راحتی می توانید لیستی از نام های میزبانان معتبری را دریافت کنید که باید اطلاعات را به حساب شما ارسال کنند. معمولا، این لیست فقط yourdomain.com (نام دامنه ی خودتان) و تمام زیر دامنه هایی که blog.yourdomain.com دارند .برای دریافت این اطلاعات، به Google Analytics بعد Network بروید و گزینه Hostname را به عنوان Dimension اولیه یا Primary Dimension انتخاب کنید.
سپس، شما باید یک لیست از تمام نام های میزبان خود را با استفاده از عبارات منظمی مانند موارد زیر ایجاد کنید:
yourdomain\.com|blog\.yourdomain\.com|www\.yourdomain\.com
تمام نام های میزبانی که در واقع متعلق به شما هستند را به آن لیست اضافه کنید و آن را در یک فایل خالی ذخیره کنید . ما در یک لحظه به آنها نیاز خواهیم داشت .
سپس روی گزینه ی مدیریت در بالای سایت کلیک کنید ، حساب کاربری خودتان را انتخاب کنید و مشخصات و ویژگی های مربوط به سایت خودتان را انتخاب کنید ، روی گزینه ی Filters کلیک کرده و سپس Add Filter را انتخاب کنید . با این کار شما می توانید یک فیلتر جدید ایجاد کنید . یک نام مناسب برای آن بنویسید ، مانند “Ghost spam filter” ؛ سپس نوع فیلتر را سفارشی انتخاب کنید . اکنون نام میزبان را از فیلد فیلتر انتخاب کنید و روی دکمه ی Include کلیک کنید . در پایان لیست دامنه های معتبر را در فیلد Filter Pattern اضافه کنید . اگر قبل از فعال کردن آن روی لینک Verify this filter(تایید این فیلتر) کلیک کنید بسیار خوب است .
هنگامی که این کار را انجام می دهید، اطلاعاتی را که از داده های Analytics شما حذف می شوند را خواهید دید. در نهایت با کلیک کردن روی گزینه ی save ، فعالیت هایتان را ذخیره کنید .
نحوه ی متوقف کردن Crawlers Spam
متوقف کردن Crawlers Spam بسیار ساده است ، زیرا آنها به سایت شما دسترسی دارند. شما می توانید نام هاست آنها را به راحتی به دست آورید با همان روشی که نام هاست های معتبر خودتان را پیدا می کنید. در این زمان می توانید تمام منابع مشکوک و نا معتبر و هنام هاست هایی که متفاوت از شما هستند را بدست آورید .
شما می توانید آنها را با استفاده از دستور .htaccess زیر ، بلاک و یا مسدود کنید:
## STOP REFERRER SPAM RewriteCond %{HTTP_REFERER} spammybot\.com [NC,OR] RewriteCond %{HTTP_REFERER} buysomething\.com [NC] RewriteRule .* - [F]
توجه داشته باشید که فایل های .htaccess محسوس هستند و شما باید از کاراکتر نقطه یا دات با یک اسلش استفاده کنید. به عنوان مثال اگر شما میخواهید spam-bot-site.net را بلاک کنید ، شما باید spam-bot-site\.net در دستورات خود اضافه کنید .