یک دریای پهناور را در نظر بگیرید. در این دریا، کشتیهای مسافربری، باربری، تجاری و… مختلفی روی سطح آب شناورند. هرکدام از این کشتیها برای اینکه بتوانند در حوزه فعالیت خودشان به خوبی عمل کنند، سعی دارند سوخت بیشتر و با کیفیتتری به موتور خانه برسانند.
اما در این بین، چند کشتی دزد دریایی هم هستند که به جای فعالیت عادی، تصمیم گرفتهاند که به سوخت بقیه کشتیها دستبرد بزنند و از آن برای ادامه کارشان استفاده کنند.
در مثال بالا، دریا همان دنیای وب است. کشتیها سایتها هستند و سوخت آنها برای رقابت، محتوایی است که روی سایتشان قرار میدهند. کشتیهایی هم که به جای خرید یا تولید سوخت، سوخت کشتیهای دیگر را میدزدند، همان سایتهای سارق محتوا هستند.
حالا یک سازمان نظارتکننده روی این دریای پهناور – یعنی گوگل – برای جلوگیری از دزدی و مقابله و با دزدان دریایی، دست به کار میشود. نتیجه این دست به کار شدن، الگوریتم Pirate یا همان دزد دریایی گوگل است. در این مقاله با ما همراه باشید تا Pirate را بشناسیم و ببینیم که گوگل این بار برای مقابله با خرابکارها دست به چه اقداماتی زده است!
الگوریتم دزد دریایی گوگل یا Pirate چیست؟
دزد دریایی یکی از این الگوریتمهای مهم گوگل است که در سال ۲۰۱۲ معرفی و در سال ۲۰۱۴ بهروزرسانی شد.
وظیفه الگوریتم pirate، شناسایی محتوای دزدی (یا همان کپی) است!این الگوریتم، برای مبارزه با نقض قانون کپیرایت آمده است و با هر نوع محتوای کپی یا دزدی برخورد میکند.
الگوریتم Pirate چه محتوایی را از نتایج گوگل حذف میکند؟
بیشتر مواقع زمانی که حرف از محتوا میزنیم، ذهن مخاطبان به سمت مقالههای متنی میرود. اما منظور از ما از حذف محتوا به دست الگوریتم دزد دریایی، فقط محتوای متنی نیست. تمرکز اصلی این الگوریتم بیشتر روی محصولات و محتوای غیر رایگان است تا محتوای رایگانی که الگوریتم پاندا میتواند آن را شناسایی کند.
به طور کلی انواع محتوایی که این الگوریتم میتواند برای حذف صفحه آن از نتایج اقدام کند عبارتند از:
- تصویر
- متن
- ویدیو
- صوت
- محصول
این یعنی شما برای تصویر، محتوای متنی و حتی محصول دانلودی و غیر دانلودی خودتان هم میتوانید به گوگل شکایت کنید و گزارش کنید که سایت دیگری با این محتوای به سرقت رفته از شما، در نتایج رتبه دارد.
نمونهای از نتیجه شکایات که به تازگی در سطح وب فارسی اتفاق افتاد، سایت معروف p30download بود که به صورت ناگهانی و یک شبه، رتبه تمامی کلمات کلیدی خودش در سطح وب را از دست داد و با افت شدید ترافیک روبرو شد. در حال حاضر هم فقط در صورت جستجو نام برند این سایت، آن را در نتایج گوگل پیدا میکنید.
دلیل این اتفاق شکایتهای پیدرپی سایتهای فارسی و غیر فارسی از آن، به دلیل انتشار محصولات دانلودی آنها به صورت رایگان بود. این محصولات بیشتر نرمافزارهای دانلودی مثل فتوشاپ، دانلود منیجرها و همینطور بازیهای غیر رایگان خارجی بود.
در ادامه درباره گزارش محتوای کپی به گوگل صحبت خواهیم کرد، ولی قبل از آن، اجازه دهید مقایسهای بین قبل و بعد الگوریتم Pirate داشته باشیم.
الگوریتم دزد دریایی گوگل، چه تغییراتی در نتایج جستجو ایجاد کرد؟
قبل از اینکه سروکلۀ الگوریتم دزد دریایی گوگل پیدا شود، با جستجوی عبارتی مثل «watch toy story 4»، سایتهایی را میدیدید که یا برای جذب بازدیدکننده فیلم را بطور رایگان برای دانلود گذاشته بودند، یا اینکه برای دانلود غیرقانونی فیلمی که کپی شده، پول میگرفتند.
اما الان، حداقل در نتایج اولیه گوگل، نتایج معتبری را میبینید که شما را به سمت تماشای قانونی فیلم هدایت میکنند (مثل تصویر زیر).
با اجرای الگوریتم دزدان دریایی، سایتهای زیادی که دانلود رایگان نرمافزارها و محتوای پولی را فراهم کرده بودند، دچار افت شدید رتبه و ریزش شدید کاربران شدند.
یک نکتۀ مهم_ احتمالاً الان دارید پیش خودتان فکر میکنید که ما در ایران هنوز هم بهترین فیلمهای دنیا را رایگان دانلود میکنیم و میبینیم. پس این الگوریتم چرا هیچ کاری نمیکند؟ خب حق با شماست؛ همین الان هم اگر به فارسی سرچ کنید «تماشای فیلم اسباب بازی ها ۴»، خیلی راحت به لینکهای دانلود رایگان میرسید.
در واقع، در کشور ما هنوز قانون کپیرایت جدی گرفته نمیشود و از طرفی گوگل هم هنوز در برخی کشورها، از جمله ایران، آنقدرها برای کپیرایت سخت نمیگیرد؛ مگر آنکه مانند p30download تعداد زیادی گزارش نقض قانون کپیرایت دریافت کند.
چگونه محتوای دزدیده شده را به گوگل گزارش دهیم؟
انجام این کار اصلاً سخت نیست و با DMCA گوگل انجام میشود، اما جواب گرفتن از گوگل ممکن است مدت زیادی طول بکشد. اما قبل از اینکه به سراغ نحوۀ گزارش محتوای کپی به گوگل برویم، بیایید با DMCA بیشتر آشنا شویم.
سرویس DMCA گوگل چیست؟
DMCA مخفف عبارت Digital Millennium Copyright Act به معنای «قانون حق چاپ هزاره دیجیتال» است که در سال ۱۹۸۸ به دست رئیس جمهور آمریکا امضا شد. پس از آن و از سال ۲۰۱۲، واحد DMCA در شرکت گوگل، شروع به کار کرد. هدف این واحد حمایت از قانون کپی رایت در حوزه وب بود.
با استفاده از این سرویس، افرادی که محتوایشان به سرقت رفته، میتوانند درخواست بدهند تا صفحه سایت خطاکار، از نتایج جستجوی گوگل حذف شود.
این یعنی اگر محتوای متنیِ رایگان یا غیر رایگان، ویدیویی، محصول و هر نوع محتوای دیگری که دارید، به دست فرد و افرادی دزدیده و روی سایتشان منتشر شده باشد، میتوانید آدرس صفحه سارق را به بخش DMCA گوگل گزارش دهید. این بخش گزارشات (یا noticeها) را در اسنادی ذخیره میکند و اگر تعداد Notice ها زیاد شود، الگوریتم Pirate به بررسی آنها میپردازد.
DMCA و الگوریتم دزدان دریایی گوگل، ارتباط نزدیکی باهم دارند. در واقع این الگوریتم با استفاده از گزارش کاربران و کمک اپراتورهای انسانی است که تصمیم میگیرد کدام صفحات و سایتها از نتایج گوگل حذف شوند.
مراحل گزارش محتوای کپی شده به DMCA گوگل
برای گزارش کافیست به پیشخان DMCA گوگل مراجعه کنید؛ روی Create new notice کلیک کنید و بعد طبق تصویر زیر، مراحل را انجام دهید و گزارشتان را برای گوگل ارسال کنید.
لطفاً به این چند نکته دقت کنید:
- متن پیام و مشخصات شما، حتماً باید به زبان انگلیسی باشد
- گزارش خود را دقیق بنویسید و فقط به اسم و آدرس آن سایت بسنده نکنید
- آدرس صفحات مورد نظرتان را وارد کنید؛ نه آدرس دامنه سایت
- گزارشات شما توسط نیروی انسانی گوگل بررسی میشود
خب تا اینجا فهمیدیم که الگوریتم دزد دریایی گوگل، چطور با محتوای دزدی مقابله میکند. اما یک سؤال؛ مطالب این مقاله به این معنی است که ما با انتشار محتوای یک سایت دیگر در سایتمان و در ادامه شکایت صاحب محتوا، به طور کلی از نتایج گوگل حذف میشویم؟ در ادامه به جواب این سؤال میرسید:
دزد دریایی گوگل چقدر سختگیر است؟
اول این نکته را بگوییم که تمرکز و اولویت اول Google Pirate روی حذف URL یا همان صفحه است، نه کل سایت؛ ولی اگر گوگل برای بیش از ۵۰% محتواهای ایندکس شدۀ شما گزارش کپی بودن دریافت کند، به احتمال خیلی زیاد دچار پنالتی سخت و سنگین Pirate شوید. در مثالی هم که برای سایت پیسی دانلود زدیم، باید بدانید که این سایت محتواهای بسیاری زیادی داشت که بیشتر آنها محتوای نقض کننده قانون کپی رایت بودند و به همین دلیل کل سایت دچار جریمه شد.
در مورد شدت سختگیری الگوریتم دزد دریایی هم راستش را بخواهید، گوگل در خیلی از موارد از شکایتهای DMCA چشم پوشی میکند! یعنی مجبور است که خیلی از آنها را نادیده بگیرد. چرا؟
تصور کنید که شما در گوگل عبارت دانلود فتوشاپ را سرچ میکنید. گوگل هم به خاطر شکایتهای شرکت Adobe (سازنده فتوشاپ) از سایتهای ارائه دهنده این برنامه، تمامی آنها را از نتایج حذف کرده است.
آیا این موضوع باعث میشود تا شما راضی به خرید برنامه فتوشاپ به قیمت چند صد دلار از Adobe شوید؟ نه! ولی باعث میشود شما به جای گوگل، در موتور جستجوی دیگری مثل بینگ، به دنبال دانلود برنامه فتوشاپ باشید.
پس گوگل در نهایت برای اینکه مخاطبان خودش را از دست ندهد، مجبور است در برخی مواقع بیخیال شکایتهای شرکتهای صاحب اثر محتوا بشود. اما در هر حال این شرایط برای همه محتواها هم به وجود نمیآید، پس مراقب باشید!
یک نکته_ احتمالاً اغلب مخاطبان این مقاله، وبمسترانی هستند که از مقالههای تکراری در سایتشان استفاده نمیکنند؛ اما با مطالعه این مطالب این سؤال در ذهنشان به وجود آمده که: چطور یک سایت میتواند مطالب سایت من را، در حالی که آن را منتشر کردهام بدزدد؟ مگر پاندای گوگل با آن مقابله نمیکند؟
در ادامه توضیحات بیشتری میدهیم.
دزدان محتوا و آموزش مقابله با آنها
هزینهای که الآن باید برای نوشتن یک مقاله هزار کلمهای به نویسنده محتوا بدهید، چیزی بین ۲۰ تا ۱۰۰ هزار تومان است. حالا فرض کنید سایت دیگری بدون پرداخت حتی یک ریال، مقالهای را که برای آن هزینه کردهاید، میدزدد و به عنوان صاحب آن محتوا شناخته میشود! چطور؟!
سایتهایی در سطح وب وجود دارند که نه به دست وبمستر و مدیر، بلکه به دست رباتهای خودکار مدیریت میشوند. این رباتها به صورت اتوماتیک محتوای یک سایت را کپی میکنند و در سایت خودشان قرار میدهند.
محتوایی که از طرف این سایتهای سارق دزدیده و منتشر میشود، تعداد و سرعت بالایی دارد و این موضوع باعث میشود که رباتهای گوگل و بقیه موتورهای جستجو، با سرعت بیشتری برای بررسی و ایندکس محتواها به آن سر بزنند.
حالا تصور کنید که اگر یکی از این رباتها به کمک وبمستر، سایت شما را هدف قرار بدهد چه اتفاقی میافتد؟ محتوای جدید شما امروز ساعت ۱۷ عصر در سایتتان منتشر میشود، اما گوگل تا ۲ روز دیگر برای ایندکس مقاله به سایت شما سر نمیزند. در این حالت ربات در همان ابتدای کار محتوای دست اولتان را در سایت خودش منتشر و از طرف گوگل به عنوان صاحب محتوا شناخته میشود! حالا محتوای شما از نظر گوگل کپی است و احتمالا در صورت تکرار، با خشم پاندا روبرو میشوید.
راه مقابله با دزدی محتوا
راه پیشنهادی گوگل، کمک گرفتن از الگوریتم دزد دریایی است. به این صورت که شما باید به سایت گوگل و سرویس dmca در پنل گوگل کنسول سایتتان بروید و در آنجا با ارائه شواهدی مثل زمان انتشار محتوا در سایتتان یا دیگر راهها به کارشناسان گوگل بفهمانید که سایت شما، صاحب اصلی محتواست.
و پیشنهاد ما:
۱) بعد از انتشار محتوا، آن را در شبکههای اجتماعی (مخصوصا توییتر) به اشتراک بگذارید تا با سرعت بیشتری ایندکس شود.
۲) با استفاده از ابزار سرچ کنسول گوگل رباتهای موتور جستجو را از انتشار محتوا در سایت باخبر کنید تا سریعاً برای ایندکس آن اقدام کنند.
برای این کار کافیست وارد سرچ کنسول شوید، گزینه URL Inspection را انتخاب کنید، آدرس صفحه را در کادر وارد کنید و اینتر را بزنید. در اینجا اگر محتوای شما ایندکس نشده باشد، میتوانید گزینه Request Indexing را انتخاب کنید تا در اولین فرصت، رباتهای گوگل محتوایتان را بخوانند.
۳) انتشار محتوای سایتتان را در یک زمان خاص انجام دهید. به طور مثال، یک شنبهها و سه شنبهها در ساعت ۵ عصر محتواهایتان را منتشر کنید. به این صورت رباتهای خزنده شرطی میشوند و دقیقاً در همین روز و ساعت برای ایندکس مقالات به شما مراجعه میکنند.
۴) در تمامی محتواها از لینکسازی داخلی استفاده کنید و گاهی هم به صفحه اصلی لینک بدهید
کلام آخر: حواس جمع باشید!
موتور جستجوی گوگل از هوش مصنوعی فوقالعاده قدرتمندی استفاده میکند. اما خوشبختانه یا متأسفانه این هوش مصنوعی هنوز هم توانایی مقابله با هوش انسان را ندارد. پس در این حالت بهتر است به جای اینکه فقط به گوگل اعتماد کنیم تا ما را به عنوان یک سایت معتبر، درستکار و با کیفیت تشخیص بدهد، خودمان هم دست به کار شده و با بررسیهای دقیق، مطمئن شویم که بقیه وبمستران از سایت ما سوء استفاده نمیکنند.
امیدواریم مطالب این مقاله در مورد الگوریتم دزد دریایی گوگل و همینطور مقابله با دزدی محتوا برای شما مفید بوده باشد. در صورتی که نکتۀ دیگری درباره کپی و دزدی محتوا میدانید که ممکن است به درد ما و سایر خوانندگان این بخورد، خیلی خوشحال میشویم آن را مطرح کنید.
همینطور اگر علاقه به مطالعه کاملترین آرشیو مربوط به الگوریتم ها و آپدیتهای گوگل هستید، به دستهبندی الگوریتم های گوگل در نوین مراجعه کنید.
نوشته الگوریتم دزدان دریایی گوگل چگونه با دزدی محتوا مقابله میکند؟ اولین بار در نوین. پدیدار شد.