Thursday, December 14, 2006

Автоматическое vs Ручное определение спама

Поисковые системы используют все возможные методы обнаружения спама в своих алгоритмах. Но есть очень много ситуаций, когда используются люди для анализа сайтов (Google quality guidelines).

Так почему поисковики используют ручное распознование спама???

Необходимость ресурсов
Алгоритмы поисковиков становятся все более и более совершенными и они могут определить все что угодно. Только нужно учесть - сколько займет это ресурсов!!!

Поэтому, в тех случаях, когда необходима постоянная проверка используют автоматические ресурсы, а в других случаях прибегают к ручной оценке спама.


Ручное вмешательство
Другая проблема у поисковика: "Как идентифицировать спам?" Какойто текс скрывается, потому что кто то хочет обмануть поисковик? Некоторые случаи могут быть выявлены с помощью алгоритмов, но обычно необходимо принять решение. И его принимает человек. Поисковики делают все возможное в соответствии с заданными алгоритмами, а уже люди учат их как распознавать спам. Но все равно решение принимает человек.

Процесс рассморения

Приведу основную градацию запрещенных активностей по версии Google:
1. Не спам, легальный контент и активность;
2. Возможно спам. Обнаружен, но невозможно определить автоматически (навешивается оранжевый или красный флаг, небольшое уменьшение в ранжировании);
3. Определен легкий спам-контент. Определяется алгоритмом. (небольшое снижение PR)
4. Определен тяжелый спам. Помечается флагом и просматривется вручную (удаляется из индекса)
5. Возможный спам из-за внешних факторов. Находится, но невозможно определить алгоритмически.
6. Определен легкий спам-контент из-за внешних факторов. Определяется алгоритмически (помечается красным флагом)
7. Определен тяжелый спам-контент. Помечается и проверяется человеком(сайт удаляется из индекса)

Флаги сами по себе не несут на себе эффекта на PR, но с увеличением количества красных флагов для сайта упрощают дальнейшее их рассмотрение. Когда необходимо человеческое вмешательство, то Твои сайты (да именно сайтЫ) будут просмотрены и возможно все забанены. Если ты уже "прославился", то у Тебя очень большой шанс быть забаненным навсегда. Тебя спасет, только придумывание нового алгоритма - а я скрещу за тебя пальцы. ))

Используй знания для своего преимущества.

Для определения техники спама всегда необходим простой просмотр статистики загрузки сервера. Поисковики не любят тратить ресурсы впустую, поэтому ты должен избегать этого. Не бери на себя много красных флагов, потому что можешь получить статус серьезного спамера и получить запрос на рассмотрение твоего сайта человеком. Люди довольно дорогой ресурс и поисковики отправляют на рассмотрение только при 100% уверенности в спаме или обнаружении новой техники спама.

Однажды Ты будешь помечен как НЕВЬЕБЕННЫЙ спаммер. Ты можешь гордиться собой и продолжать в том же духе. А можешь сменить направление деятельности - убрать все ссылки между сайтами определенными как спам и обычными. И они закроют глаза на Тебя!

Успеха в Твоем нелегком деле!
Скажу спасибо Ван Дер Граафу за материал.

2 comments:

Luis Alberto said...

все супер, только опечаток немеряно.

deMarco said...

Исправлюсь! )
Спасибо!