Как найти спамера в твиттере 2

Владимир | | Разное.

Что-то последнее время не дает мне покоя twitter 🙂

Сервис очень интересный и предоставляет интересные возможности как для общения, так и для рассылки спама. Т.к. я рассылкой спама не занимаюсь, то меня больше интересуют методы борьбы со спамерами в твиттере. В одном из предыдущих постов я уже рассказывал о способе поиска «специалистов по продвижению», но за это время возникло ещё несколько идей, которыми я и хочу поделиться.

Идея очень простая — подсчет ответов пользователю.

Обратите внимание, не тех ответов, которые пользователь сам написал, а тех, которые написали ему.

Давайте порассуждаем. Для администрации узнать количество ответов, которые пришли данному пользователю не сложно. Для этого достаточно посчитать количество сообщений в которых есть @ник_пользователя.

Дальше возникает тонкий момент. При каком количестве ответов нужно считать пользователя спамером?

И тут опять приходят на помощь «руководства по продвижению в twitter». В них предлагается интенсивно фолловить других пользователей и, чтобы twitter вас не забанил, отвечать на чужие твиты. Т.е. изображать общение.

Проблема (спамеров) в том, что написать несколько десятков ОСМЫСЛЕННЫХ сообщений, на которые другой пользователь захочет ответить, очень сложно. А на общие фразы типа «спасибо» и «актуально» обычно никто не отвечает.

А дальше все просто. Нужно считать отношение ваших сообщений другим пользователям и сообщений, отправленных вам. Если этот параметр превысит определенное значение — пользователя в бан 🙂

Администраторы могут взять выборку 100% не спамерских аккаунтов, определить это соотношение для них и использовать его в качестве опорного.

Правда этот метод имеет уязвимость. Спамер может зарегистрировать несколько (десятков или сотен) аккаунтов и отвечать с них на свои же твиты.

Такой подход значительно усложняет ситуацию, но и тут есть решение.

Цель спамера – это не 10-100 фолловеров, а десятки тысяч. Поэтому если даже спамер отвечает сам себе с сотни аккаунтов, это означает, что с 99% он все равно не получает никаких ответов.

Зарегистрировать больше 100 аккаунтов довольно сложно, т.к. для этого нужно:
1) обойти captcha;
2) использовать разные IP (иначе вся эта деятельность будет выглядеть очень подозрительно).

В общем, метод имеет недостатки и я не думаю, что администрация твиттера когда-нибудь станет применять его в качестве основного средства поиска спамеров. Но в качестве дополнения к методу, о котором я рассказывал в прошлой статье – вполне возможно.

Сложно, конечно, предсказать действия владельцев твиттера. Может, в рассылке спама они видят способ монетизации своего ресурса? И будут продавать специальные спамерские аккаунты? 😉

Но в любом случае, возможность найти спамеров у них есть.

Делайте выводы 🙂

Интересно почитать:

Может ли страдать тетрадка в клеточку,
или моральные проблемы создания искусственного интеллекта