6 декабря, 2022

zhukvesti

Находите все последние статьи и смотрите телешоу, репортажи и подкасты, связанные с Россией.

Илон Маск неправильно подходит к подсчету фейковых сообщений и спама в Twitter: эксперты

Тесла Генеральный директор Илон Маск отправил Твиттер Акции упали в пятницу, когда он сказал, что собирается запустить свою машину Приобретение социальной сети за 44 миллиарда долларов «приостановлено» При исследовании процента фейковых аккаунтов и спама на платформе.

Хотя позже Маск пояснил, что по-прежнему привержен сделке, он продолжал говорить о проблеме фейковых аккаунтов. Он написал в Twitter, что его команда проведет собственный анализ, и выразил сомнения в точности цифр, которые Twitter сообщил в своих последних финансовых документах.

в этом Отчет о прибылях и убытках за первый квартал текущего годаTwitter признал наличие на своей платформе ряда «фальшивых или спам-аккаунтов», а также легитимное ежедневное активное использование или пользователей (mDAU). Компания заявила: «Мы провели внутренний аудит выборки учетных записей и подсчитали, что средние поддельные или спам-аккаунты в первом квартале 2022 года составляли менее 5% нашего MDAU в этом квартале».

Твиттер Он также признался, что за последние три года завышал число пользователей на 1,4 млн до 1,9 млн человек. Компания написала: «В марте 2019 года мы запустили функцию, которая позволяет людям связывать несколько отдельных учетных записей вместе, чтобы легко переключаться между учетными записями», — сообщил Twitter. «В то время произошла ошибка, действия, предпринятые в основной учетной записи, привели к тому, что все связанные учетные записи были учтены как mDAU».

Хотя Маск может быть оправданно любопытен, эксперты по социальным сетям, дезинформации и статистическому анализу говорят, что предложенный им подход к дальнейшему анализу крайне неадекватен.

Вот что такое SpaceX и Тесла Генеральный директор сказал, что ограничит количество спама, поддельных и дублирующих аккаунтов, существующих в Твиттере:

«Чтобы узнать ответ, моя команда случайным образом выберет 100 подписчиков в Твиттере. Я предлагаю другим повторить тот же процесс и посмотреть, что они обнаружат». Он объяснил свою методологию в последующих твитах, добавив: «Выберите любую учетную запись с большим количеством подписчиков» и «Откажитесь от первой 1000 подписчиков, затем выберите каждую десятку. Я открыт для лучших идей».

READ  Dow растет, поскольку Сенат голосует по законопроекту об инфраструктуре на 1 триллион долларов; Акции Tesla падают на фоне данных о продажах в Китае

Маск также сказал, не предоставив доказательств, что он выбрал 100 в качестве числа размера выборки для своего исследования, потому что это число, которое Twitter использует для расчета чисел в своих отчетах о доходах.

«Любая разумная случайная выборка допустима. Если несколько человек независимо друг от друга получат одинаковые результаты в процентах фальшивых/фальшивых/дубликатов учетных записей, это будет очевидно. Я выбрал 100 в качестве числа для размера выборки, потому что это то, что Twitter использует для учетной записи < 5 % — фейк/спам/дубликат».

Twitter отказался комментировать, когда его спросили, было ли точным описание его методологии.

Фейсбук Соучредитель Дастин Московиц изучил проблему через свой собственный аккаунт в Твиттере, отметив, что подход Маска на самом деле не является случайным, он использует очень маленькую выборку и оставляет место для серьезных ошибок.

Он написал: «Я также чувствую, что «недоверие к команде Twitter, которая поможет собрать образец» — это своего рода красный флаг».

БотСентинел Основатель и генеральный директор Кристофер Баззи сказал в интервью CNBC, что анализ, проведенный его компанией, показывает, что от 10% до 15% учетных записей в Твиттере потенциально «неверны», включая подделки, спамеров, мошенников и гнусных ботов. Целевые «аккаунты ненависти», которые обычно преследуют и преследуют отдельных лиц, а также других лиц, которые сознательно распространяют дезинформацию.

BotSentinel, работающий в основном за счет краудфандинга, самостоятельно анализирует и выявляет недостоверную активность в Твиттере, используя комбинацию программного обеспечения для машинного обучения и групп рецензентов. Сегодня компания отслеживает более 2,5 млн учетных записей Twitter, большинство из которых англоязычные.

«Я думаю, что Twitter не реально классифицирует «ложные» и спам-аккаунты», — сказал Боззи.

Он также предупреждает, что количество неоригинальных аккаунтов может быть больше или меньше в разных уголках Twitter в зависимости от обсуждаемых тем. Например, BotSentinel обнаружил, что больше неоригинальных аккаунтов твитят о политике, криптовалюте, изменении климата и коронавирусе, чем те, которые обсуждают непротиворечивые темы, такие как кошки и оригами.

READ  Hyundai Palisade с новой решеткой радиатора и фарами просочился перед дебютом

«Я просто не могу понять, что Маск делает что-то кроме троллинга с помощью нелепой схемы выборки».

Карл Т. Бергстрем

Автор книги «Вызов быков—«

Карл Т. Бергстром, профессор Вашингтонского университета, соавтор Книга, которая поможет людям понять данные Избегая ложных заявлений в Интернете, он сказал CNBC, что выборка сотен подписчиков любой одной учетной записи Twitter не должна составлять «должную осмотрительность» для получения 44 миллиардов долларов.

Он сказал, что размер выборки в 100 человек на порядок меньше, чем обычно для исследователей социальных сетей, изучающих подобные вещи. Самая большая проблема, с которой Маск столкнется при таком подходе, известна как систематическая ошибка отбора.

В письме CNBC Бергстром написал: «Нет оснований полагать, что подписчики официальной учетной записи Twitter являются репрезентативной выборкой учетных записей на платформе. Возможно, боты с меньшей вероятностью подпишутся на эту учетную запись, чтобы избежать обнаружения. это выглядит законным. Кто знает? Но я не могу понять, что Маск делает что-то кроме троллинга нас с этой нелепой схемой выборки».