Как найти спамера в твиттере 2

Владимир | | Разное.

twitter spam

Что-то последнее время не дает мне покоя twitter 🙂

Сервис очень интересный и предоставляет интересные возможности как для общения, так и для рассылки спама. Т.к. я рассылкой спама не занимаюсь, то меня больше интересуют методы борьбы со спамерами в твиттере. В одном из предыдущих постов я уже рассказывал о способе поиска «специалистов по продвижению», но за это время возникло ещё несколько идей, которыми я и хочу поделиться.

Идея очень простая — подсчет ответов пользователю.

Обратите внимание, не тех ответов, которые пользователь сам написал, а тех, которые написали ему.

Давайте порассуждаем. Для администрации узнать количество ответов, которые пришли данному пользователю не сложно. Для этого достаточно посчитать количество сообщений в которых есть @ник_пользователя.

Дальше возникает тонкий момент. При каком количестве ответов нужно считать пользователя спамером?

И тут опять приходят на помощь «руководства по продвижению в twitter». В них предлагается интенсивно фолловить других пользователей и, чтобы twitter вас не забанил, отвечать на чужие твиты. Т.е. изображать общение.

Проблема (спамеров) в том, что написать несколько десятков ОСМЫСЛЕННЫХ сообщений, на которые другой пользователь захочет ответить, очень сложно. А на общие фразы типа «спасибо» и «актуально» обычно никто не отвечает.

А дальше все просто. Нужно считать отношение ваших сообщений другим пользователям и сообщений, отправленных вам. Если этот параметр превысит определенное значение — пользователя в бан 🙂

Администраторы могут взять выборку 100% не спамерских аккаунтов, определить это соотношение для них и использовать его в качестве опорного.

Правда этот метод имеет уязвимость. Спамер может зарегистрировать несколько (десятков или сотен) аккаунтов и отвечать с них на свои же твиты.

Такой подход значительно усложняет ситуацию, но и тут есть решение.

Цель спамера – это не 10-100 фолловеров, а десятки тысяч. Поэтому если даже спамер отвечает сам себе с сотни аккаунтов, это означает, что с 99% он все равно не получает никаких ответов.

Зарегистрировать больше 100 аккаунтов довольно сложно, т.к. для этого нужно:
1) обойти captcha;
2) использовать разные IP (иначе вся эта деятельность будет выглядеть очень подозрительно).

В общем, метод имеет недостатки и я не думаю, что администрация твиттера когда-нибудь станет применять его в качестве основного средства поиска спамеров. Но в качестве дополнения к методу, о котором я рассказывал в прошлой статье – вполне возможно.

Сложно, конечно, предсказать действия владельцев твиттера. Может, в рассылке спама они видят способ монетизации своего ресурса? И будут продавать специальные спамерские аккаунты? 😉

Но в любом случае, возможность найти спамеров у них есть.

Делайте выводы 🙂

Интересно почитать:

Может ли страдать тетрадка в клеточку,
или моральные проблемы создания искусственного интеллекта

  • izmailovo2009 жжот 😀

    Короче. Проблема с твитерром та же что и проблема с накруткой в SEO с которой непременно сталкиваются поисковики когда пытаются сделать идеальную систему основанную на pagerank'e. Спамеру достаточно создать искусственную сеть (помоему используется термин фермы) которая линкуется между собой и все из них стараются линковать центральные главные сайты на которых он зарабатывает. Для движка сложно отличить настоящий сайт от искусственного. Там надо проводить статистический анализ языка, тем и тп. Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    С твиттером та же хрень. Только мне непонятно зачем там гнаться, если нету мотивации получить Pagerankкучу народа ->реклама-> деньги

    • зачем там гнаться

      За фолловерами, точнее за местом в их лентах. Туда можно вставить свою рекламу и получать с нее деньги.
      Правда, насколько я знаю, на данный момент точно не известна эффективность такой рекламы. Есть прогнозы, что это будет прибыльно… но насчет реальных результатов — не знаю.

      И насчет SEO. Ситуация в твиттере немного отличается. Администрации не нужно анализировать текст твитов. Им нужно анализировать поведение других пользователей по отношению к данному, а эту информацию всегда можно получить со 100% точностью.

  • izmailovo2009 жжот 😀

    Короче. Проблема с твитерром та же что и проблема с накруткой в SEO с которой непременно сталкиваются поисковики когда пытаются сделать идеальную систему основанную на pagerank'e. Спамеру достаточно создать искусственную сеть (помоему используется термин фермы) которая линкуется между собой и все из них стараются линковать центральные главные сайты на которых он зарабатывает. Для движка сложно отличить настоящий сайт от искусственного. Там надо проводить статистический анализ языка, тем и тп. Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    С твиттером та же хрень. Только мне непонятно зачем там гнаться, если нету мотивации получить Pagerankкучу народа ->реклама-> деньги

    • зачем там гнаться

      За фолловерами, точнее за местом в их лентах. Туда можно вставить свою рекламу и получать с нее деньги.
      Правда, насколько я знаю, на данный момент точно не известна эффективность такой рекламы. Есть прогнозы, что это будет прибыльно… но насчет реальных результатов — не знаю.

      И насчет SEO. Ситуация в твиттере немного отличается. Администрации не нужно анализировать текст твитов. Им нужно анализировать поведение других пользователей по отношению к данному, а эту информацию всегда можно получить со 100% точностью.

  • Твиттер еще крайне не популярен в России…

    • Тем не менее, если вы им пользуетесь, то проблема спама (для вас) будет актуальна.

  • Твиттер еще крайне не популярен в России…

    • Тем не менее, если вы им пользуетесь, то проблема спама (для вас) будет актуальна.

  • А есть радикальный выход — просто им не пользоваться 😉

    • Это выход из серии. Болит голова? Гильотина — лучшее лекарство 🙂

    • be3

      Твиттер очень интересен, хотя бы тем, что в короткие сроки можно распиарить любой из своих проектов xD А так же пообщаться с владельцами любимых блоговсайтов. Например с Владимиром +)

      • Спасибо 🙂
        Кстати, в твиттере есть возможность что-то написать многим известным людям. Правда не факт, что они вам ответят. Но в любом случае это проще чем email.

        • be3

          Плюс программисту легко найти подработку, я всего раза 3 написал и люди откликнулись, теперь загружен по самое нехочу +) Возможно это и смахивает на одноклассники, вконтакте, но не мне судить, меня там нет xD

  • А есть радикальный выход — просто им не пользоваться 😉

    • Это выход из серии. Болит голова? Гильотина — лучшее лекарство 🙂

    • be3

      Твиттер очень интересен, хотя бы тем, что в короткие сроки можно распиарить любой из своих проектов xD А так же пообщаться с владельцами любимых блогов\сайтов. Например с Владимиром +)

      • Спасибо 🙂
        Кстати, в твиттере есть возможность что-то написать многим известным людям. Правда не факт, что они вам ответят. Но в любом случае это проще чем email.

        • be3

          Плюс программисту легко найти подработку, я всего раза 3 написал и люди откликнулись, теперь загружен по самое нехочу +) Возможно это и смахивает на одноклассники, вконтакте, но не мне судить, меня там нет xD

  • Интересная мысль. На этом я мог бы закончить свой комент, (может я просто не многословный человек, по натуре)и что исходя из вашего предположения — я спамер, потому что на такую фразу никто отвечать естественно не будет. А мысль действительно интересная, только ИМХО о 100% точности говорить рановато.

    • Со 100% точностью я, конечно, погорячился. Но то, что точность будет выше, чем у почтовых спам фильтров — это однозначно.

      К тому же речь идет не об одной фразе, а об оценке поведения в целом. Причем оценивать поведение я предлагаю пользователей у которых несколько тысяч фолловеров. Если они писали только односложные твиты, то откуда эти фолловеры взялись?

  • Интересная мысль. На этом я мог бы закончить свой комент, (может я просто не многословный человек, по натуре)и что исходя из вашего предположения — я спамер, потому что на такую фразу никто отвечать естественно не будет. А мысль действительно интересная, только ИМХО о 100% точности говорить рановато.

    • Со 100% точностью я, конечно, погорячился. Но то, что точность будет выше, чем у почтовых спам фильтров — это однозначно.

      К тому же речь идет не об одной фразе, а об оценке поведения в целом. Причем оценивать поведение я предлагаю пользователей у которых несколько тысяч фолловеров. Если они писали только односложные твиты, то откуда эти фолловеры взялись?

  • Ненавижу тупых спамеров. Их нужно вычислять и банить!

  • Ненавижу тупых спамеров. Их нужно вычислять и банить!

  • Почему сразу гильотина? Я вот не пользуюсь, и проблем нет, есть же и другие источники информации

    • Другие источники информации есть, но отказываться от одного из них из-за каких-то спамеров — это преребор 🙂

  • Почему сразу гильотина? Я вот не пользуюсь, и проблем нет, есть же и другие источники информации

    • Другие источники информации есть, но отказываться от одного из них из-за каких-то спамеров — это преребор 🙂

  • Как найти? Нужно 3 раза сказать» Спамер, спамер-прийди» и он явиться 🙂

    • А если сказать 33 раза «спамер, спамер — уйди» он уйдет? 🙂

  • Я думаю, что прогграмными методами их хрен найдешь, логику надо применять, они ж тожде не стоят на месте, развиваються

    • Я их программными методами искать и не буду, это могут только админы твиттера 😉
      Но на данный момент (по моим наблыюдениям) все спамеры в действуют по одной схеме и ее можно вычислить программными методами.

  • Как найти? Нужно 3 раза сказать» Спамер, спамер-прийди» и он явиться 🙂

    • А если сказать 33 раза «спамер, спамер — уйди» он уйдет? 🙂

  • Я думаю, что прогграмными методами их хрен найдешь, логику надо применять, они ж тожде не стоят на месте, развиваються

    • Я их программными методами искать и не буду, это могут только админы твиттера 😉
      Но на данный момент (по моим наблыюдениям) все спамеры в действуют по одной схеме и ее можно вычислить программными методами.

  • Возможность найти спамеров у них может и есть, но вот денег на поиск этих возможностей, мне кажется, не хватает. У них много других проблем, чтобы заниматся этой. Остается ждать, пока Твиттер купит какая-то большая компания.

    • be3

      Думаю спам не такая уж и большая проблема, что бы на нее вообще обращать внимание +) В конце концов пользователи сами боряться за чистоту контента.

      • Кстати, да. В твиттере можно легко выкинуть спамера из ленты. Раздражают только уведомления по email о том, что какой-то спамер подписался.
        Отключать email уведомления очень не хочется. Благодаря им я нашел много интересных людей (точнее они нашли меня 😉 )

        • be3

          Потратить минуту дабы кликнуть на ссылку и посмотреть кто стучиться в дверь, тоже не считаю сложным +) Конечно лучше когда вообще не беспокоют, но это уже извините утопия xD

        • Как раз недавно эту тему в твиттере обсуждали. Поводом послужила статья Смертельный спам

        • be3

          Статья, извините, мне показалась бредовой. Мы очень много тратим времени впустую в течении нашей жизни и не стоит обращать на это внимание (если только не собираетесь стать сверхчеловеком). Автору присущ подростковый максимализм.

        • Я примерно так в твиттере и написал 🙂 что за сериалы надо пожизненное давать 🙂

    • Насчет проблем, вы абсолютно правы. К тому же перед продажей выгодно показать большую базу пользователей.

      • be3

        База пользователей… думаю она тут тоже особой роли не играет, так как всем уже известно что большая часть из них просто не активна.
        Мне кажется для продажи им все еще нужно очень многое сделать, скажем есть над чем поработать +)

        • Часть есть часть. 50% от 1000 меньше чем 50% от 1000000. В любом случае это аргумент в сторону увеличения цены.

  • Возможность найти спамеров у них может и есть, но вот денег на поиск этих возможностей, мне кажется, не хватает. У них много других проблем, чтобы заниматся этой. Остается ждать, пока Твиттер купит какая-то большая компания.

    • be3

      Думаю спам не такая уж и большая проблема, что бы на нее вообще обращать внимание +) В конце концов пользователи сами боряться за чистоту контента.

      • Кстати, да. В твиттере можно легко выкинуть спамера из ленты. Раздражают только уведомления по email о том, что какой-то спамер подписался.
        Отключать email уведомления очень не хочется. Благодаря им я нашел много интересных людей (точнее они нашли меня 😉 )

        • be3

          Потратить минуту дабы кликнуть на ссылку и посмотреть кто стучиться в дверь, тоже не считаю сложным +) Конечно лучше когда вообще не беспокоют, но это уже извините утопия xD

        • Как раз недавно эту тему в твиттере обсуждали. Поводом послужила статья Смертельный спам

        • be3

          Статья, извините, мне показалась бредовой. Мы очень много тратим времени впустую в течении нашей жизни и не стоит обращать на это внимание (если только не собираетесь стать сверхчеловеком). Автору присущ подростковый максимализм.

        • Я примерно так в твиттере и написал 🙂 что за сериалы надо пожизненное давать 🙂

    • Насчет проблем, вы абсолютно правы. К тому же перед продажей выгодно показать большую базу пользователей.

      • be3

        База пользователей… думаю она тут тоже особой роли не играет, так как всем уже известно что большая часть из них просто не активна.
        Мне кажется для продажи им все еще нужно очень многое сделать, скажем есть над чем поработать +)

        • Часть есть часть. 50% от 1000 меньше чем 50% от 1000000. В любом случае это аргумент в сторону увеличения цены.

  • be3

    Само собой, но кол-во пользователей так же увеличится когда прибавиться юзабилити.
    Если честно уже сейчас очень не хватает возможности назначать метки(тэги. категории, etc…) для фоловинга. Подумываю написать свой клиент (разумеется на CI xD), где будет возможность как то распределить по каталогом людей, которых я зафоловил.

    • Назначать метки, делать вложенные комментарии, фильтровать ленту и вообще писать сообщения по длиннее. Список можно продолжить 🙂
      А разработчики ответят, что сервис задумывался для отправки сообщений об изменении статуса и все эти функции второстепенные 😉

      • be3

        Так и пусть так отвечают +) У них есть замечательное API, которого для себя одного и пары друзей вполне хватит+)

        • Да, это вариант, хранить метки в своей базе и работать только через свой клиент.

        • be3

          Сейчас изучаю python. Возможно клиент под ubuntu и станет и моим тестовым заданием xD

        • Мне было бы интересно взглянуть на результат. Из существующих клиентов ни один не понравился.

  • be3

    Само собой, но кол-во пользователей так же увеличится когда прибавиться юзабилити.
    Если честно уже сейчас очень не хватает возможности назначать метки(тэги. категории, etc…) для фоловинга. Подумываю написать свой клиент (разумеется на CI xD), где будет возможность как то распределить по каталогом людей, которых я зафоловил.

    • Назначать метки, делать вложенные комментарии, фильтровать ленту и вообще писать сообщения по длиннее. Список можно продолжить 🙂
      А разработчики ответят, что сервис задумывался для отправки сообщений об изменении статуса и все эти функции второстепенные 😉

      • be3

        Так и пусть так отвечают +) У них есть замечательное API, которого для себя одного и пары друзей вполне хватит+)

        • Да, это вариант, хранить метки в своей базе и работать только через свой клиент.

        • be3

          Сейчас изучаю python. Возможно клиент под ubuntu и станет и моим тестовым заданием xD

        • Мне было бы интересно взглянуть на результат. Из существующих клиентов ни один не понравился.

  • На мой взгляд именно спам и убьет Твиттер. Слишком они не защищены от него. И дело даже не в программном обеспечении, которое можно накрутить или не накрутить на сервис. Дело в самой логике и идее заложенной в Твиттер. Она изначальна не защищена от спама и носит несколько романтический характер — свободное и открытое общение любого с любым. Это же малина для спамерства. Начнут накручивать, как по вашему совету, всякие сервисы по ловле спамеров, то ничем не будут отличаться от любых других сервисов. И вообще, когда впервые познакомился с Твиттером, то не был впечатлен и немного не понимаю той шумихи вокруг него. По-моему, это старый добрый чат, с дополнительными возможностями.

    • be3

      Спам не может его убить.
      Вы очень ошибаетесь. поживите в твитере около месяца, тогда вам станет понятно. Твитер уникален, возможно я так говорю потому что не являюсь юзером вконтакте и однокласниках, но все же.

    • свободное и открытое общение любого с любым

      Почему свободное? Вы сами определяете на кого подписываться. Если вы не хотите кого-то читать, то этот человек ничего написать в вашу ленту не сможет. В этом смысле почта более свободная. Спамеру достаточно узнать ваш email.

  • На мой взгляд именно спам и убьет Твиттер. Слишком они не защищены от него. И дело даже не в программном обеспечении, которое можно накрутить или не накрутить на сервис. Дело в самой логике и идее заложенной в Твиттер. Она изначальна не защищена от спама и носит несколько романтический характер — свободное и открытое общение любого с любым. Это же малина для спамерства. Начнут накручивать, как по вашему совету, всякие сервисы по ловле спамеров, то ничем не будут отличаться от любых других сервисов. И вообще, когда впервые познакомился с Твиттером, то не был впечатлен и немного не понимаю той шумихи вокруг него. По-моему, это старый добрый чат, с дополнительными возможностями.

    • be3

      Спам не может его убить.
      Вы очень ошибаетесь. поживите в твитере около месяца, тогда вам станет понятно. Твитер уникален, возможно я так говорю потому что не являюсь юзером вконтакте и однокласниках, но все же.

    • свободное и открытое общение любого с любым

      Почему свободное? Вы сами определяете на кого подписываться. Если вы не хотите кого-то читать, то этот человек ничего написать в вашу ленту не сможет. В этом смысле почта более свободная. Спамеру достаточно узнать ваш email.

  • Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    Я вообще не пойму какая выгода от этих сайтов «пустышек». Постоянных поситителей нет, прироста тоже нет. Кто же будет давать рекламу на такой блог? Зачем он вообще? Только рунет захламляют.

    • Все очень просто. Если получить на них ТИЦ хотя бы 10, можно будет торговать ссылками и чем больше страниц, тем выше доходы.

  • Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    Я вообще не пойму какая выгода от этих сайтов «пустышек». Постоянных поситителей нет, прироста тоже нет. Кто же будет давать рекламу на такой блог? Зачем он вообще? Только рунет захламляют.

    • Все очень просто. Если получить на них ТИЦ хотя бы 10, можно будет торговать ссылками и чем больше страниц, тем выше доходы.

  • Что то мне подсказывает, что это будет зароботок на сигареты.
    Или я не прав?

    • Вполне возможно, конкретных цифр я не видел.

    • Все зависит от количества. Есть несколько таких сайтов, да, миллион не заработать, но и делать ничего не надо. А если таких сайтов сделать тысячу? А две тысячи? А по цифрам — даже нулевик приносит по 2-3 рубля со страницы в месяц. Если на сайте 1000 страниц — вот 2-3 тыс. в месяц. Сто сайтов — 200-300 тыс. в месчц.

      • Теоретически все правильно, но могут возникнуть нюансы.
        Как минимум, сайты не должны попасть под фильтры поисковиков, а с дублированным контентом это довольно сложно.
        Я точно знаю, что есть люди, которые на этом зарабатывают, но не думаю, что они «ничего не делают» 🙂

  • Что то мне подсказывает, что это будет зароботок на сигареты.
    Или я не прав?

    • Вполне возможно, конкретных цифр я не видел.

    • Все зависит от количества. Есть несколько таких сайтов, да, миллион не заработать, но и делать ничего не надо. А если таких сайтов сделать тысячу? А две тысячи? А по цифрам — даже нулевик приносит по 2-3 рубля со страницы в месяц. Если на сайте 1000 страниц — вот 2-3 тыс. в месяц. Сто сайтов — 200-300 тыс. в месчц.

      • Теоретически все правильно, но могут возникнуть нюансы.
        Как минимум, сайты не должны попасть под фильтры поисковиков, а с дублированным контентом это довольно сложно.
        Я точно знаю, что есть люди, которые на этом зарабатывают, но не думаю, что они «ничего не делают» 🙂

  • Be3

    Еще один человек который голословно делает утверждения.
    Расскажите, пожалуйста, из чего сложилось такое мнение?