سقوط مبهم وبسایتها و بررسی ضعف های گوگل و الگوریتمها

توسط

ضعف های الگوریتم های گوگل، موضوعی که شاید خود مسئولین کمپانی نیز از آن آگاه بوده و هستند و اما به دلایل تجاری و بیزنسی، هرگز به زیر بار این ضعف ها نرفته اند. در این مقاله می خواهیم این موضوع را تشریح کنیم و در نهایت خواهیم دید که بسیاری از آسیب هایی که به وبسایت ها وارد می شود، نه نتیجه کار غیرحرفه ای و نه نتیجه سهل انگاری مدیران و نه نتیجه عدم مدیریت صحیح و نه نتیجه عدم کیفیت سرورها و دامنه ها و زیر دامنه ها و نه نتیجه استاندارد نبودن و بلکه نتیجه ضعف الگوریتم هایی است که وظایف مختلفی را باید به عهده داشته باشند که این وظایف را گاها با ضعف های آشکاری، کامل و درست به پایان نمی رسانند و وب سایت هایی بی مسوولیت، خلافکار، اسپم نویس، سارق آثار پژوهشی و … به راحتی از این ضعف ها استفاده کرده و الگوریتم هایی را که در تبلیغات و معرفی آنان، به عنوان غولهای کمپانی معرفی شدند را دور می زنند و در جایگاه هایی قرار می گیرند که شایسته آنها نیست. الگوریتم ها را کم و بیش می شناسیم و از تکرار مجدد تعاریف و کار و وظایف آنها خودداری کرده به سراغ اصل موضوع می روم.

الگوریتم گوگل پنگوئن Google Penguin Algorithm
به نظر می رسد که کار این الگوریتم، مبارزه با کمپین لینک بوده و جریمه وبسایت هایی که از جایگاه خود سواستفاده کرده و لینک می فروشند و آنها که این لینکها را می خرند. این الگوریتم وظایف دیگری نیز دارد که جای بحث آن اینجا نیست. خب ببینیم که ضعف این الگوریتم چیست؟ فرض می کنیم که وبسایتی دارای رتبه عالی بوده و برای مثال پیجرنک 5 دارد و با این امکان، اقدام به فروختن لینک و یا راه اندازی کمپین لینک ها در سایت خود نموده است. تا اینجا به ظاهر، گوگل با یک وبسایت خلافکار (طبق قوانین کمپانی) روبروست و الگوریتم پنگوئن، موظف است بعد از شناسایی و پی بردن به خلاف این وب سایت، آن را طبق اطلاعیه ای که در معرفی این الگوریتم ارائه شد، جریمه کرده و جایگاه آن را گرفته و از آن پس نیز هرگز ارتقاء ندهد. خب تا اینجا بسیار هم عالیست. اما مشکل کجاست؟ مشکل جاییست که پنگوئن، تر و خشکها را با هم می سوزاند و در واقع توان دنبال نمودن لینک هایی که در کمپین لینک وبسایت خلافکار بوده را ندارد.

پنگوئن تمام لینک هایی را که در کمپین بوده اند را به عنوان خریداران لینک شناسایی و آنان را نیز جریمه میکند. ایراد کار چیست؟ ایراد از آن جایی نشات می گیرد که بسیاری از لینک های قرار داده شده در کمپین ها می توانند با هدف تخریب سایر وبسایت ها قرار داده شده باشند، بدون اینکه مسوولین آن، خلافی را مرتکب شده باشند و نمونه آن، وبسایت های ثبت لینک، تبادل لینک و سایر وبسایت هایی است که چه لینک را می فروشند و چه رایگان عرضه می کنند. رقبایی که توان رقابت سالم در محیط را ندارند، با پی بردن به این ضعف بزرگ پنگوئن، از این هربه برای آسیب رسانی به وبسایت های دیگر استفاده کرده و به راحتی این الگوریتم را دور زده و به آن به غلط تفهیم می کنند که سایت مقصد، خریدار بوده و خلافکار است و پنگوئن نیز، از انجا که توان دنبال نمودن و پی بردن به اصل ماجرا را ندارد، به سرعت تمامی لینکها را با چشم بسته جریمه می کند. نتیجه این می شود که فردی درستکار با وبسایتی بدون 1 خط اسپم، می گوید که نمیدانم چرا وب سایتم پیشرفت نمی کند.

موضوع بعدی در رابطه با بخش بیزنس هاست که خواهیم دید چگونه گوگل، بر خلاف شعار خود، کیفیت را فدای درآمد می کند. در این کمپانی، دو بخش Google Adwords و Google Adsense که به ترتیب مسوول دریافت تبلیغات سازمانی و شخصی در امور وب سایت ها هستند، به نحو چشمگیری با بخش ضداسپم این کمپانی ارتباط دارند. این دو سرویس که درآمد کل کمپانی نیز به میزان 10 میلیارد دلار در 8 سال پیش (یعنی فقط در سال 2006) و 16 میلیارد دلار در سالهای اخیر، را تامین می کنند (گزارش ادوارد سیک در آنوال ریپورت http://www.webcitation.org/61rPRmWhL)، به اشکالی گوناگون نشان داده اند که آن دسته وب سایتها که هزینه می کنند، می توانند به نوعی از الگوریتم ها نیز عبور نموده و فارغ از محتوای خود (چه اسپم چه محتوای سرقتی چه جدید و نوآورانه)، جایگاه های خوبی را برای خود دست پا نمایند و آن دسته وبسایتها که هزینه نمی کنند را به راحتی لگد مال نمایند. نتیجه چه می شود؟

فردی برای نمونه، عبارت مقالات وردپرس را در این موتور جستجوگر سرچ می کند و به ردیف، محتویاتی را خواهد دید که همگی از روی یکی کپی برداری شده اند، خب قضیه جالب تر مانده و آن این موضوع است که در صفحات سوم و چهارم و پنجم از نتایج جستجو، با تعجب به موارد تازه و جدیدی بر میخورد. این به چه معناست؟ گوگلی که خود، وبسایت ها را از خرید بک لینک بازداشته و مجازات می کند، خود مقوله ای به نام پیجرنک را در معرض فروش قرار می دهد و آشکار و پنهان، این موضوع را القا می کند که می توانید پول بدهید و فارغ از کیفیت محتوای خود، جایگاه های خوب را کسب کنید.

اگر به نشریه خوارزمی در 21 سپتامبر 2011 هم نگاهی داشته باشیم که گوگل از کلیک بر هر لینک تبلیغاتی 60 سنت سود می کند، این روند هم منطقی به نظر میرسد که محتوای لینکی که تبلیغات داده است، می تواند برای گوگل بی اهمیت باشد. البته در این نکته که تبلیغات بسیار هم خوب است شکی نیست اما اینکه تبلیغات هر محتوایی از نظر گوگل، یکسان تلقی و یکسان مورد لطف قرار می گیرد، نه تنها یک ضعف برای الگوریتم ها بلکه یک ضعف اساسی و ناعادلانه برای کل کمپانی گوگل محسوب می شود که فضای رقابت سالم را به فضای جنگ سرمایه تبدیل می کند. این یک اتهام نیست، بلکه واقعیتی است که وجود دارد، چه ما بر سر و کله یکدیگر بکوبیم و چه نکوبیم، این مورد وجود دارد.

الگوریتم گوگل پاندا
شاید وقتی نسخه سوم الگوریتم پاندای گوگل معرفی شد، همگان فکر کردند که از شر کپی کنندگان راحت شدند در حالی که چنین نبود و در ادامه خواهیم دید که کپی کننده ها و سارقان آثار، چگونه این الگوریتم را دور می زنند. پاندا 3 در واقع چیز جدیدی نبود، بلکه به نوعی در آن تلاش شد ضعف های نسخه های قدیمی تر، اصلاح شود. با ورود این الگوریتم، از آنجا که ما در ایران 70 میلیون نفر متخصص بهینه سازی سایت داریم، این الگوریتم، غول مبارزه با کپی برداران محتوا و سارقان آثار منتشر شده معرفی شد. عده ای به شکلی ماهرانه که نشان داد همیشه خلافکارها یک قدم جلوتر از الگوریتم ها هستند، با ثبت نام در خبرنامه های وبسایت های درست نویس و تمیز کار، بلافاصله از ورود محتوای جدید به سایتها آگاه شده و در دم اقدام به های لایت و کپی مطلب در وبلاگ و یا وبسایت خود (که سابقا نیز با تبلیغات بالاتر از آن وب سایتها قرار گرفته بود) کرده و به نوعی پاندا 3 و جانورهای گوگل و روبات ها و عنکبوت های کند گوگل را، قبل از رسیدن به آن مطلب، دور می زنند و آن مقاله و مطلب را به نام وب سایت خود، به عنوان محتوای جدید، منتشر می کنند. نتیجه چه می شود؟ پاندا و روبات ها کند هستند. کندتر از خلافکاران، وبسایت اصلی جریمه می شود و وب سایت سارق تقدیر شده و لینکش در جایگاه بهتری قرار می گیرد. مدیران وب سایت جریمه شده بعد از چند روز، لینک خود را در ته نتایج دیده و یا همان مطلب را در رتبه اول اما با آدرس دیگری مشاهده می کنند. این به نظر عادلانه نمی رسد، اما ما باور داریم که فضا، فضای رقابت سرمایه است و نه رقابت نوآورانه و سالم و منطقی و تمیز.

الگوریتم مرغ مگس خوار
الگوریتم مرغ مگسخوار که سالهای زیادی از عمر آن نمی گذرد، به نوعی آمده است تا خلاف تمام گفته های ما در این مقاله را اثبات نماید. اما هنوز نیامده ایرادی از جانب فارسی زبانان به آن وارد شد که جای تامل داشت. این الگوریتم، زبان فارسی را به درستی تشخیص نمی دهد و تعدادی از واژه های فارسی مانند ک و ی و گ و پ را به شکل عربی آن (ی) و (ک) مورد تحلیل قرار می دهد که در نتایج کار آن در وب فارسی، یک ضعف محسوب می شود. الگوریتم مرغ مگس خوار از آنجا که هنوز آنطور که باید و شاید مورد مطالعه قرار نگرفته، و از طرفی هدف آن، توجه بیشتر به محتوا اعلام شده است، کار خود، ادعای گوگل، ضعف ها و نقاط قوت خود و سایر موارد را در آینده بهتر نشان خواهد داد.

نویسنده: روحان هوسپیان

1 نظر
  1. رز 9 سال قبل
    پاسخ

    زمین در انتظار تولد یک برگ …
    من در حال شمارش معکوس …
    صفر همیشه پایان نیست …
    گاه آغاز پرواز است …

ارسال یک نظر

نشانی ایمیل شما منتشر نخواهد شد.

همچنین ممکن است دوست داشته باشید