Ученый и исполнительный директор Human Rights Data Analysis Group Патрик Болл назвал результаты машинного обучения, на которые полагалось АНБ США во время бомбардировок Пакистана при помощи беспилотников, "абсолютно ерундовыми" и научно несостоятельными, пишет TJ. Жертвами ошибок системы могли стать тысячи невиновных людей.
Как сообщает портал Arstechnica, начиная с 2004 года в Пакистане в результате атак беспилотников погибло от 2,5 до четырех тысяч человек, большинство из которых были определены правительством США как экстремисты.
Эти данные основывались на результатах работы программы Skynet, информация о которой была обнародована бывшим сотрудником АНБ Эдвардом Сноуденом. Согласно документам, Skynet участвовала в массовом наблюдении за мобильной телефонной сетью Пакистана, собирала метаданные и использовала алгоритмы машинного обучения, чтобы оценить вероятность того, что тот или иной человек является террористом.
В общей сложности система оценивала более 80 параметров, включая шаблоны повседневного поведения человека и его путешествия в другие страны. При этом алгоритм исходил из предположения, что поведение террористов существенно отличается от поведения рядовых граждан.
Однако весной прошлого года стало известно, что самый высокий рейтинг по принятым системой показателям получил Ахмад Заидан, руководитель телекомпании "Аль-Джазира" в Исламабаде. Заидан часто путешествовал по регионам, в которых действовали террористы, и в итоге его фото попало во внутреннюю презентацию результатов работы Skynet с пометкой "член "Аль-Каиды".
Узнав об этом, журналист резко раскритиковал работу Skynet. Он отметил, что делать выводы на основе контактов, записей телефонных разговоров или других источников абсурдно и такой подход свидетельствует о полном непонимании журналистской профессии.
Еще одной важной частью программы Skynet являлось изучение алгоритмов поведения известных террористов. В ходе тестирования алгоритм получал информацию о 100 тысячах случайно выбранных человек и шести террористах, а задача программы состояла в том, чтобы вычислить седьмого террориста.
Однако Болл считает такой подход несостоятельным, поскольку в распоряжении спецслужб имеются данные о небольшом числе террористов. "Существует слишком мало известных террористов, чтобы использовать данные о них для тренировки и проверки модели. Если они используют одни и те же данные и для обучения, и для тестов, их оценка – полная ерунда", – отметил Болл.
В документах АНБ сообщалось, что Skynet ошибочно записывала в террористы обычных людей в 0,18% случаев (настоящих террористов система не обнаруживала в 50% случаев), при этом общее число пакистанцев, чьи метаданные изучались системой, составило 55 миллионов человек.
Эти данные, по словам Болла, свидетельствуют о том, что Skynet могла маркировать 99 тысяч невинных людей как террористов, и часть из них могла или может быть убита во время атак беспилотников.