Взривоопасен теч: Мистериозният алгоритъм на Google Search може би е разгадан
2500 страници документация за системата за търсене и класиране на сайтове в Google изтекоха онлайн
Алгоритъмът за търсене на Google е може би най-значимата система в интернет, която има способността да вдъхва сили на едни сайтове и да обрича други на забрава. От нея до голяма степен зависи обликът на световната мрежа и как всеки сайт се класира в търсачката.
От десетилетия цяла една индустрия – оптимизация за търсачки, или „SEO“ – се опитва да разгадае "кода", който придвижва дадена страница нагоре в класацията за различни ключови заявки за търсене в Google. Но как точно компанията прави подредбата дълго време си оставаше неразплетена загадка.
Досега.
Едно взривоопасно изтичане на информация от тази седмица хвърля повече светлина върху този забулен в тайна ключов алгоритъм на търсачката на Google. В интернет се появиха хиляди страници с вътрешни документи, които дават безпрецедентен поглед към механизма ѝ на работа. И подсказват, че в продължение на много години Google не е била напълно честна по тези въпроси.
Анонимен източник е изпратил колекцията от документи, озаглавена „Content API Warehouse“, на Ранд Фишкин, дългогодишна влиятелна фигура в SEO индустрията. В тези около 2500 страници се описват множество неизвестни досега или непотвърдени знания за начина, по който Google решава да класира уебсайтове в своята търсачка.
През последния четвърт век от отдела за търсене на Google не е съобщавано за изтичане на информация в такъв мащаб или подробности“, заяви главният изпълнителен директор на Sparktoro Ранд Фишкин, дългогодишна влиятелна фигура в SEO индустрията.
Първоначално Google отказваше да коментира материалите, но впоследствие потвърди, че колекцията от 2500 изтекли вътрешни документа е автентична, пише The Verge.
Според Фишкин документите описват API за търсене на Google и разбиват каква информация е достъпна за служителите.
Подробностите, споделени от Фишкин, са в голяма степен технически и вероятно по-разбираеми за разработчици и SEO експерти, отколкото за неспециалисти. Съдържанието обаче не е задължително доказателство, че Google използва посочените данни и сигнали за класиране при търсене. По-скоро изтичането очертава какви данни събира Google от уебстраници, сайтове и търсещи потребители и предлага косвени предположения за това, което изглежда интересува Google, както пише SEO експертът Майк Кинг в своя преглед на документите.
Изтеклите документи засягат теми като това какви данни събира и използва Google, кои сайтове Google издига за чувствителни теми като избори, как Google се третира малки уебсайтове и др.
Лъгал ли е досега Google?
Според Фишкин и Кинг част от информацията в документите изглежда е в противоречие с публичните изявления на представители на Google.
„Лъжа“ звучи грубо, но това е единствената точна дума, която може да се използва тук“, пише Кинг. „Макар че не обвинявам непременно публичните представители на Google, че защитават своята патентована информация, не приемам усилията им да дискредитират активно хора от света на маркетинга, технологиите и журналистиката, които са представяли подобни открития.“
Секретният алгоритъм за търсене на Google роди цяла индустрия от маркетолози, които следят внимателно публичните указания на гиганта и привеждат към тях онлайн присъствието на милиони компании по света. Всепроникващите, често досадни тактики доведоха до общо мнение, че резултатите от търсенето в Google стават все по-лоши, претъпкани с ненужни детайли, които операторите на уебсайтове се чувстват задължени да правят, за да бъдат виждани сайтовете им.
Но някои подробности в изтеклите документи поставят под въпрос точността на публичните изявления на Google относно начина на работа на търсачката.
Един от примерите, посочени от Фишкин и Кинг, е дали данните от Google Chrome изобщо се използват при класирането. Представители на Google многократно са посочвали, че не използват данни от Chrome за класиране на страници, но Chrome е изрично споменат в разделите за това как уебсайтовете се появяват в Search. Връзките, които се появяват под основния URL адрес на vogue.com в скрийншота по-долу, може да са създадени отчасти с помощта на данни от Chrome, става ясно от документите.
Друг повдигнат въпрос е каква роля играе Е-Е-А-Т при класирането, ако изобщо играе такава. Това е съкращение за experience, expertise, authority and reliability (преживяване, експертиза, авторитет и надеждност) – метрика на Google, използвана за оценка на качеството на резултатите. Представители на компанията вече заявиха, че E-E-A-T не е фактор за класиране. Фишкин отбелязва обаче, че в документите не е открил много неща, които да го споменават конкретно.
Кинг обаче подробно описва как Google изглежда събира данни за автора от дадена страница и има поле за това дали даден субект на страницата е автор. В част от документите, споделени от Кинг, се казва, че полето е „разработено и настроено основно за новинарски статии... но се попълва и за друго съдържание (напр. научни статии)“. Въпреки че това не потвърждава, че тези компоненти са изричен показател за класиране, показва, че Google поне следи този атрибут. Представители на Google по-рано настояваха, че информацията за авторите е нещо, което собствениците на уебсайтове трябва да правят за читателите, а не за Google, тъй като това не влияе на класирането.
Въпреки че документите не са точно „пушечно оръжие“, те предоставят задълбочен, нефилтриран поглед към строго охранявана черна кутия на системата. Антитръстовото дело на американското правителство срещу Google, което се върти около търсачката, също доведе до оповестяване на вътрешна документация, която предлага допълнителни сведения за това как работи основният продукт на компанията.
Общата предпазливост на Google по отношение на начина на функциониране на Search доведе до това, че уебсайтовете изглеждат по един и същи начин, тъй като SEO специалистите се опитват да надхитрят Google въз основа на подсказките, които компанията предлага. Фишкин критикува също така публикациите, които с доверие поддържат публичните твърдения на Google като истина без допълнителен анализ.
„Исторически погледнато, някои от най-силните гласове и най-плодовитите издатели в индустрията за търсене с удоволствие повтарят безкритично публичните изявления на Google. Те пишат заглавия като „Google твърди, че XYZ е вярно“, а не „Google твърди XYZ; доказателствата сочат обратното“, пише Фишкин.
Моля, направете нещо по-добро. Ако това изтичане на информация и съдебният процес в Министерството на правосъдието могат да доведат до само една промяна, надявам се това да е тя.“