Как найти спамера в твиттере 2

1 июня, 2009
twitter spam

Что-то последнее время не дает мне покоя twitter :)

Сервис очень интересный и предоставляет интересные возможности как для общения, так и для рассылки спама. Т.к. я рассылкой спама не занимаюсь, то меня больше интересуют методы борьбы со спамерами в твиттере. В одном из предыдущих постов я уже рассказывал о способе поиска «специалистов по продвижению», но за это время возникло ещё несколько идей, которыми я и хочу поделиться.

Идея очень простая – подсчет ответов пользователю.

Обратите внимание, не тех ответов, которые пользователь сам написал, а тех, которые написали ему.

Давайте порассуждаем. Для администрации узнать количество ответов, которые пришли данному пользователю не сложно. Для этого достаточно посчитать количество сообщений в которых есть @ник_пользователя.

Дальше возникает тонкий момент. При каком количестве ответов нужно считать пользователя спамером?

И тут опять приходят на помощь "руководства по продвижению в twitter". В них предлагается интенсивно фолловить других пользователей и, чтобы twitter вас не забанил, отвечать на чужие твиты. Т.е. изображать общение.

Проблема (спамеров) в том, что написать несколько десятков ОСМЫСЛЕННЫХ сообщений, на которые другой пользователь захочет ответить, очень сложно. А на общие фразы типа "спасибо" и "актуально" обычно никто не отвечает.

А дальше все просто. Нужно считать отношение ваших сообщений другим пользователям и сообщений, отправленных вам. Если этот параметр превысит определенное значение – пользователя в бан :)

Администраторы могут взять выборку 100% не спамерских аккаунтов, определить это соотношение для них и использовать его в качестве опорного.

Правда этот метод имеет уязвимость. Спамер может зарегистрировать несколько (десятков или сотен) аккаунтов и отвечать с них на свои же твиты.

Такой подход значительно усложняет ситуацию, но и тут есть решение.

Цель спамера – это не 10-100 фолловеров, а десятки тысяч. Поэтому если даже спамер отвечает сам себе с сотни аккаунтов, это означает, что с 99% он все равно не получает никаких ответов.

Зарегистрировать больше 100 аккаунтов довольно сложно, т.к. для этого нужно:
1) обойти captcha;
2) использовать разные IP (иначе вся эта деятельность будет выглядеть очень подозрительно).

В общем, метод имеет недостатки и я не думаю, что администрация твиттера когда-нибудь станет применять его в качестве основного средства поиска спамеров. Но в качестве дополнения к методу, о котором я рассказывал в прошлой статье – вполне возможно.

Сложно, конечно, предсказать действия владельцев твиттера. Может, в рассылке спама они видят способ монетизации своего ресурса? И будут продавать специальные спамерские аккаунты? ;)

Но в любом случае, возможность найти спамеров у них есть.

Делайте выводы :)

Интересно почитать:

Может ли страдать тетрадка в клеточку,
или моральные проблемы создания искусственного интеллекта

Понравилась статья? Подписывайтесь на продолжение rss link !

Или на мой твиттер twitter link

]]>

Добавьте эту страницу в google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

]]>

Опубликовано в Разное Комментарии (88) »

]]>

Вы можете оставить комментарий. Трекбеки закрыты.

  • http://kurapov.name/ Артём Курапов

    izmailovo2009 жжот :D

    Короче. Проблема с твитерром та же что и проблема с накруткой в SEO с которой непременно сталкиваются поисковики когда пытаются сделать идеальную систему основанную на pagerank'e. Спамеру достаточно создать искусственную сеть (помоему используется термин фермы) которая линкуется между собой и все из них стараются линковать центральные главные сайты на которых он зарабатывает. Для движка сложно отличить настоящий сайт от искусственного. Там надо проводить статистический анализ языка, тем и тп. Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    С твиттером та же хрень. Только мне непонятно зачем там гнаться, если нету мотивации получить Pagerankкучу народа ->реклама-> деньги

    • http://www.simplecoding.org/ Владимир

      зачем там гнаться

      За фолловерами, точнее за местом в их лентах. Туда можно вставить свою рекламу и получать с нее деньги.
      Правда, насколько я знаю, на данный момент точно не известна эффективность такой рекламы. Есть прогнозы, что это будет прибыльно… но насчет реальных результатов – не знаю.

      И насчет SEO. Ситуация в твиттере немного отличается. Администрации не нужно анализировать текст твитов. Им нужно анализировать поведение других пользователей по отношению к данному, а эту информацию всегда можно получить со 100% точностью.

  • http://kurapov.name Артём Курапов

    izmailovo2009 жжот :D

    Короче. Проблема с твитерром та же что и проблема с накруткой в SEO с которой непременно сталкиваются поисковики когда пытаются сделать идеальную систему основанную на pagerank'e. Спамеру достаточно создать искусственную сеть (помоему используется термин фермы) которая линкуется между собой и все из них стараются линковать центральные главные сайты на которых он зарабатывает. Для движка сложно отличить настоящий сайт от искусственного. Там надо проводить статистический анализ языка, тем и тп. Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    С твиттером та же хрень. Только мне непонятно зачем там гнаться, если нету мотивации получить Pagerankкучу народа ->реклама-> деньги

    • http://www.simplecoding.org/ Владимир

      зачем там гнаться

      За фолловерами, точнее за местом в их лентах. Туда можно вставить свою рекламу и получать с нее деньги.
      Правда, насколько я знаю, на данный момент точно не известна эффективность такой рекламы. Есть прогнозы, что это будет прибыльно… но насчет реальных результатов – не знаю.

      И насчет SEO. Ситуация в твиттере немного отличается. Администрации не нужно анализировать текст твитов. Им нужно анализировать поведение других пользователей по отношению к данному, а эту информацию всегда можно получить со 100% точностью.

  • http://cheatsbase.ru/ Наталья

    Твиттер еще крайне не популярен в России…

    • http://www.simplecoding.org/ Владимир

      Тем не менее, если вы им пользуетесь, то проблема спама (для вас) будет актуальна.

  • http://cheatsbase.ru Наталья

    Твиттер еще крайне не популярен в России…

    • http://www.simplecoding.org/ Владимир

      Тем не менее, если вы им пользуетесь, то проблема спама (для вас) будет актуальна.

  • http://www.natalie-uk.ru/ Натали

    А есть радикальный выход – просто им не пользоваться ;)

    • http://www.simplecoding.org/ Владимир

      Это выход из серии. Болит голова? Гильотина – лучшее лекарство :)

    • be3

      Твиттер очень интересен, хотя бы тем, что в короткие сроки можно распиарить любой из своих проектов xD А так же пообщаться с владельцами любимых блоговсайтов. Например с Владимиром +)

      • http://www.simplecoding.org/ Владимир

        Спасибо :)
        Кстати, в твиттере есть возможность что-то написать многим известным людям. Правда не факт, что они вам ответят. Но в любом случае это проще чем email.

        • be3

          Плюс программисту легко найти подработку, я всего раза 3 написал и люди откликнулись, теперь загружен по самое нехочу +) Возможно это и смахивает на одноклассники, вконтакте, но не мне судить, меня там нет xD

  • http://www.natalie-uk.ru Натали

    А есть радикальный выход – просто им не пользоваться ;)

    • http://www.simplecoding.org/ Владимир

      Это выход из серии. Болит голова? Гильотина – лучшее лекарство :)

    • be3

      Твиттер очень интересен, хотя бы тем, что в короткие сроки можно распиарить любой из своих проектов xD А так же пообщаться с владельцами любимых блогов\сайтов. Например с Владимиром +)

      • http://www.simplecoding.org/ Владимир

        Спасибо :)
        Кстати, в твиттере есть возможность что-то написать многим известным людям. Правда не факт, что они вам ответят. Но в любом случае это проще чем email.

        • be3

          Плюс программисту легко найти подработку, я всего раза 3 написал и люди откликнулись, теперь загружен по самое нехочу +) Возможно это и смахивает на одноклассники, вконтакте, но не мне судить, меня там нет xD

  • http://wondercars.ru/ Автоблогер

    Интересная мысль. На этом я мог бы закончить свой комент, (может я просто не многословный человек, по натуре)и что исходя из вашего предположения – я спамер, потому что на такую фразу никто отвечать естественно не будет. А мысль действительно интересная, только ИМХО о 100% точности говорить рановато.

    • http://www.simplecoding.org/ Владимир

      Со 100% точностью я, конечно, погорячился. Но то, что точность будет выше, чем у почтовых спам фильтров – это однозначно.

      К тому же речь идет не об одной фразе, а об оценке поведения в целом. Причем оценивать поведение я предлагаю пользователей у которых несколько тысяч фолловеров. Если они писали только односложные твиты, то откуда эти фолловеры взялись?

  • http://wondercars.ru/ Автоблогер

    Интересная мысль. На этом я мог бы закончить свой комент, (может я просто не многословный человек, по натуре)и что исходя из вашего предположения – я спамер, потому что на такую фразу никто отвечать естественно не будет. А мысль действительно интересная, только ИМХО о 100% точности говорить рановато.

    • http://www.simplecoding.org/ Владимир

      Со 100% точностью я, конечно, погорячился. Но то, что точность будет выше, чем у почтовых спам фильтров – это однозначно.

      К тому же речь идет не об одной фразе, а об оценке поведения в целом. Причем оценивать поведение я предлагаю пользователей у которых несколько тысяч фолловеров. Если они писали только односложные твиты, то откуда эти фолловеры взялись?

  • http://company-foliant.ru/ lockdog

    Ненавижу тупых спамеров. Их нужно вычислять и банить!

  • http://company-foliant.ru lockdog

    Ненавижу тупых спамеров. Их нужно вычислять и банить!

  • http://cmdjs.com/ MaryLee

    Почему сразу гильотина? Я вот не пользуюсь, и проблем нет, есть же и другие источники информации

    • http://www.simplecoding.org/ Владимир

      Другие источники информации есть, но отказываться от одного из них из-за каких-то спамеров – это преребор :)

  • http://cmdjs.com MaryLee

    Почему сразу гильотина? Я вот не пользуюсь, и проблем нет, есть же и другие источники информации

    • http://www.simplecoding.org/ Владимир

      Другие источники информации есть, но отказываться от одного из них из-за каких-то спамеров – это преребор :)

  • http://palatki.info/ Джина

    Как найти? Нужно 3 раза сказать" Спамер, спамер-прийди" и он явиться :)

    • http://www.simplecoding.org/ Владимир

      А если сказать 33 раза "спамер, спамер – уйди" он уйдет? :)

  • http://energygeo.net/ AnAmile

    Я думаю, что прогграмными методами их хрен найдешь, логику надо применять, они ж тожде не стоят на месте, развиваються

    • http://www.simplecoding.org/ Владимир

      Я их программными методами искать и не буду, это могут только админы твиттера ;)
      Но на данный момент (по моим наблыюдениям) все спамеры в действуют по одной схеме и ее можно вычислить программными методами.

  • http://palatki.info Джина

    Как найти? Нужно 3 раза сказать" Спамер, спамер-прийди" и он явиться :)

    • http://www.simplecoding.org/ Владимир

      А если сказать 33 раза "спамер, спамер – уйди" он уйдет? :)

  • http://energygeo.net AnAmile

    Я думаю, что прогграмными методами их хрен найдешь, логику надо применять, они ж тожде не стоят на месте, развиваються

    • http://www.simplecoding.org/ Владимир

      Я их программными методами искать и не буду, это могут только админы твиттера ;)
      Но на данный момент (по моим наблыюдениям) все спамеры в действуют по одной схеме и ее можно вычислить программными методами.

  • http://music-blog.com.ua/ Ukrainian Music Blogger

    Возможность найти спамеров у них может и есть, но вот денег на поиск этих возможностей, мне кажется, не хватает. У них много других проблем, чтобы заниматся этой. Остается ждать, пока Твиттер купит какая-то большая компания.

    • http://be3.su/ be3

      Думаю спам не такая уж и большая проблема, что бы на нее вообще обращать внимание +) В конце концов пользователи сами боряться за чистоту контента.

      • http://www.simplecoding.org/ Владимир

        Кстати, да. В твиттере можно легко выкинуть спамера из ленты. Раздражают только уведомления по email о том, что какой-то спамер подписался.
        Отключать email уведомления очень не хочется. Благодаря им я нашел много интересных людей (точнее они нашли меня ;) )

        • http://be3.su/ be3

          Потратить минуту дабы кликнуть на ссылку и посмотреть кто стучиться в дверь, тоже не считаю сложным +) Конечно лучше когда вообще не беспокоют, но это уже извините утопия xD

        • http://www.simplecoding.org/ Владимир

          Как раз недавно эту тему в твиттере обсуждали. Поводом послужила статья Смертельный спам

        • http://be3.su/ be3

          Статья, извините, мне показалась бредовой. Мы очень много тратим времени впустую в течении нашей жизни и не стоит обращать на это внимание (если только не собираетесь стать сверхчеловеком). Автору присущ подростковый максимализм.

        • http://www.simplecoding.org/ Владимир

          Я примерно так в твиттере и написал :) что за сериалы надо пожизненное давать :)

    • http://www.simplecoding.org/ Владимир

      Насчет проблем, вы абсолютно правы. К тому же перед продажей выгодно показать большую базу пользователей.

      • http://be3.su/ be3

        База пользователей… думаю она тут тоже особой роли не играет, так как всем уже известно что большая часть из них просто не активна.
        Мне кажется для продажи им все еще нужно очень многое сделать, скажем есть над чем поработать +)

        • http://www.simplecoding.org/ Владимир

          Часть есть часть. 50% от 1000 меньше чем 50% от 1000000. В любом случае это аргумент в сторону увеличения цены.

  • http://music-blog.com.ua/ Ukrainian Music Blogger

    Возможность найти спамеров у них может и есть, но вот денег на поиск этих возможностей, мне кажется, не хватает. У них много других проблем, чтобы заниматся этой. Остается ждать, пока Твиттер купит какая-то большая компания.

    • http://be3.su be3

      Думаю спам не такая уж и большая проблема, что бы на нее вообще обращать внимание +) В конце концов пользователи сами боряться за чистоту контента.

      • http://www.simplecoding.org/ Владимир

        Кстати, да. В твиттере можно легко выкинуть спамера из ленты. Раздражают только уведомления по email о том, что какой-то спамер подписался.
        Отключать email уведомления очень не хочется. Благодаря им я нашел много интересных людей (точнее они нашли меня ;) )

        • http://be3.su be3

          Потратить минуту дабы кликнуть на ссылку и посмотреть кто стучиться в дверь, тоже не считаю сложным +) Конечно лучше когда вообще не беспокоют, но это уже извините утопия xD

        • http://www.simplecoding.org/ Владимир

          Как раз недавно эту тему в твиттере обсуждали. Поводом послужила статья Смертельный спам

        • http://be3.su be3

          Статья, извините, мне показалась бредовой. Мы очень много тратим времени впустую в течении нашей жизни и не стоит обращать на это внимание (если только не собираетесь стать сверхчеловеком). Автору присущ подростковый максимализм.

        • http://www.simplecoding.org/ Владимир

          Я примерно так в твиттере и написал :) что за сериалы надо пожизненное давать :)

    • http://www.simplecoding.org/ Владимир

      Насчет проблем, вы абсолютно правы. К тому же перед продажей выгодно показать большую базу пользователей.

      • http://be3.su be3

        База пользователей… думаю она тут тоже особой роли не играет, так как всем уже известно что большая часть из них просто не активна.
        Мне кажется для продажи им все еще нужно очень многое сделать, скажем есть над чем поработать +)

        • http://www.simplecoding.org/ Владимир

          Часть есть часть. 50% от 1000 меньше чем 50% от 1000000. В любом случае это аргумент в сторону увеличения цены.

  • http://be3.su/ be3

    Само собой, но кол-во пользователей так же увеличится когда прибавиться юзабилити.
    Если честно уже сейчас очень не хватает возможности назначать метки(тэги. категории, etc…) для фоловинга. Подумываю написать свой клиент (разумеется на CI xD), где будет возможность как то распределить по каталогом людей, которых я зафоловил.

    • http://www.simplecoding.org/ Владимир

      Назначать метки, делать вложенные комментарии, фильтровать ленту и вообще писать сообщения по длиннее. Список можно продолжить :)
      А разработчики ответят, что сервис задумывался для отправки сообщений об изменении статуса и все эти функции второстепенные ;)

      • http://be3.su/ be3

        Так и пусть так отвечают +) У них есть замечательное API, которого для себя одного и пары друзей вполне хватит+)

        • http://www.simplecoding.org/ Владимир

          Да, это вариант, хранить метки в своей базе и работать только через свой клиент.

        • http://be3.su/ be3

          Сейчас изучаю python. Возможно клиент под ubuntu и станет и моим тестовым заданием xD

        • http://www.simplecoding.org/ Владимир

          Мне было бы интересно взглянуть на результат. Из существующих клиентов ни один не понравился.

  • http://be3.su be3

    Само собой, но кол-во пользователей так же увеличится когда прибавиться юзабилити.
    Если честно уже сейчас очень не хватает возможности назначать метки(тэги. категории, etc…) для фоловинга. Подумываю написать свой клиент (разумеется на CI xD), где будет возможность как то распределить по каталогом людей, которых я зафоловил.

    • http://www.simplecoding.org/ Владимир

      Назначать метки, делать вложенные комментарии, фильтровать ленту и вообще писать сообщения по длиннее. Список можно продолжить :)
      А разработчики ответят, что сервис задумывался для отправки сообщений об изменении статуса и все эти функции второстепенные ;)

      • http://be3.su be3

        Так и пусть так отвечают +) У них есть замечательное API, которого для себя одного и пары друзей вполне хватит+)

        • http://www.simplecoding.org/ Владимир

          Да, это вариант, хранить метки в своей базе и работать только через свой клиент.

        • http://be3.su be3

          Сейчас изучаю python. Возможно клиент под ubuntu и станет и моим тестовым заданием xD

        • http://www.simplecoding.org/ Владимир

          Мне было бы интересно взглянуть на результат. Из существующих клиентов ни один не понравился.

  • http://nordural.ru/ Активный отдых

    На мой взгляд именно спам и убьет Твиттер. Слишком они не защищены от него. И дело даже не в программном обеспечении, которое можно накрутить или не накрутить на сервис. Дело в самой логике и идее заложенной в Твиттер. Она изначальна не защищена от спама и носит несколько романтический характер – свободное и открытое общение любого с любым. Это же малина для спамерства. Начнут накручивать, как по вашему совету, всякие сервисы по ловле спамеров, то ничем не будут отличаться от любых других сервисов. И вообще, когда впервые познакомился с Твиттером, то не был впечатлен и немного не понимаю той шумихи вокруг него. По-моему, это старый добрый чат, с дополнительными возможностями.

    • http://be3.su/ be3

      Спам не может его убить.
      Вы очень ошибаетесь. поживите в твитере около месяца, тогда вам станет понятно. Твитер уникален, возможно я так говорю потому что не являюсь юзером вконтакте и однокласниках, но все же.

    • http://www.simplecoding.org/ Владимир

      свободное и открытое общение любого с любым

      Почему свободное? Вы сами определяете на кого подписываться. Если вы не хотите кого-то читать, то этот человек ничего написать в вашу ленту не сможет. В этом смысле почта более свободная. Спамеру достаточно узнать ваш email.

  • http://nordural.ru/ Активный отдых

    На мой взгляд именно спам и убьет Твиттер. Слишком они не защищены от него. И дело даже не в программном обеспечении, которое можно накрутить или не накрутить на сервис. Дело в самой логике и идее заложенной в Твиттер. Она изначальна не защищена от спама и носит несколько романтический характер – свободное и открытое общение любого с любым. Это же малина для спамерства. Начнут накручивать, как по вашему совету, всякие сервисы по ловле спамеров, то ничем не будут отличаться от любых других сервисов. И вообще, когда впервые познакомился с Твиттером, то не был впечатлен и немного не понимаю той шумихи вокруг него. По-моему, это старый добрый чат, с дополнительными возможностями.

    • http://be3.su be3

      Спам не может его убить.
      Вы очень ошибаетесь. поживите в твитере около месяца, тогда вам станет понятно. Твитер уникален, возможно я так говорю потому что не являюсь юзером вконтакте и однокласниках, но все же.

    • http://www.simplecoding.org/ Владимир

      свободное и открытое общение любого с любым

      Почему свободное? Вы сами определяете на кого подписываться. Если вы не хотите кого-то читать, то этот человек ничего написать в вашу ленту не сможет. В этом смысле почта более свободная. Спамеру достаточно узнать ваш email.

  • http://pavlodarauto.ru/ Сергей

    Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    Я вообще не пойму какая выгода от этих сайтов "пустышек". Постоянных поситителей нет, прироста тоже нет. Кто же будет давать рекламу на такой блог? Зачем он вообще? Только рунет захламляют.

    • http://www.simplecoding.org/ Владимир

      Все очень просто. Если получить на них ТИЦ хотя бы 10, можно будет торговать ссылками и чем больше страниц, тем выше доходы.

  • http://pavlodarauto.ru Сергей

    Я думаю ты уже видел такие вордпресс-сайты пустышки где чей-то материал просто перепубликовывается и непонятно кто его вообще читает.

    Я вообще не пойму какая выгода от этих сайтов "пустышек". Постоянных поситителей нет, прироста тоже нет. Кто же будет давать рекламу на такой блог? Зачем он вообще? Только рунет захламляют.

    • http://www.simplecoding.org/ Владимир

      Все очень просто. Если получить на них ТИЦ хотя бы 10, можно будет торговать ссылками и чем больше страниц, тем выше доходы.

  • http://pavlodarauto.ru/ Сергей

    Что то мне подсказывает, что это будет зароботок на сигареты.
    Или я не прав?

    • http://www.simplecoding.org/ Владимир

      Вполне возможно, конкретных цифр я не видел.

    • http://www.uraltravel.com/ Урал

      Все зависит от количества. Есть несколько таких сайтов, да, миллион не заработать, но и делать ничего не надо. А если таких сайтов сделать тысячу? А две тысячи? А по цифрам – даже нулевик приносит по 2-3 рубля со страницы в месяц. Если на сайте 1000 страниц – вот 2-3 тыс. в месяц. Сто сайтов – 200-300 тыс. в месчц.

      • http://www.simplecoding.org/ Владимир

        Теоретически все правильно, но могут возникнуть нюансы.
        Как минимум, сайты не должны попасть под фильтры поисковиков, а с дублированным контентом это довольно сложно.
        Я точно знаю, что есть люди, которые на этом зарабатывают, но не думаю, что они "ничего не делают" :)

  • http://pavlodarauto.ru Сергей

    Что то мне подсказывает, что это будет зароботок на сигареты.
    Или я не прав?

    • http://www.simplecoding.org/ Владимир

      Вполне возможно, конкретных цифр я не видел.

    • http://www.uraltravel.com/ Урал

      Все зависит от количества. Есть несколько таких сайтов, да, миллион не заработать, но и делать ничего не надо. А если таких сайтов сделать тысячу? А две тысячи? А по цифрам – даже нулевик приносит по 2-3 рубля со страницы в месяц. Если на сайте 1000 страниц – вот 2-3 тыс. в месяц. Сто сайтов – 200-300 тыс. в месчц.

      • http://www.simplecoding.org/ Владимир

        Теоретически все правильно, но могут возникнуть нюансы.
        Как минимум, сайты не должны попасть под фильтры поисковиков, а с дублированным контентом это довольно сложно.
        Я точно знаю, что есть люди, которые на этом зарабатывают, но не думаю, что они "ничего не делают" :)

  • Be3

    Еще один человек который голословно делает утверждения.
    Расскажите, пожалуйста, из чего сложилось такое мнение?

  • Be3

    Еще один человек который голословно делает утверждения.
    Расскажите, пожалуйста, из чего сложилось такое мнение?

]]>
Tweet