Мне голос был….

Прямо по Булгакову: никогда не разговаривайте с незнакомцами, да и со знакомцами тоже поосторожней

Автор этих строк на себе испытала попытку обмана новым, весьма неожиданным способом телефонного мошенничества и решила в нем разобраться досконально.

Что произошло

Можно было бы сразу обратить внимание на то, как странно выглядит телефонный номер, отразившийся на экране монитора: он начинался с +44… Ну, не обратила и услышала … голос своей дочери, которая рыдающим голосом говорила о том, что переходила улицу в неположенном месте (и тут можно было насторожиться, так как Луна должна была упасть на Землю, чтобы такое случилось), ее сбила машина, поломаны ребра, разбита губа. И где-то на десятой секунде что-то щелкнуло в голове: ну, не хнычет обычно она по телефону, если что случилось. Как правило, сначала долго меня успокаивает, а потом рассказывает про свои неприятности. Но голос-то дочки!

Узнаю из разговора, что она в приемном покое больницы № 4 и говорю уже с умыслом: «Это близко, сейчас приду!». В ответ опять хныкание: «Тебя сюда не пустят, идут следственные действия!». И это она, которая вроде бы в курсе, что я, журналист, пройду, куда мне надо, в любом случае!… Пора отключать трубку.

А рядом сотрудники редакции, которые все слышат и уже давно машут руками: мол, отключись ты, наконец, от этих мошенников! И отключилась, а шок не проходит: голос-то тот самый, что слышу каждый день. Но это я, взрослый человек, который спустя лишь несколько секунд засомневался в том, что услышано, а если ребенку, который один дома, мамин голос в телефоне предложит открыть дверь незнакомой тете….

Чтобы как-то разобраться в случившемся, пришлось обратиться к эксперту, которого посоветовали коллеги — Олегу Витальевичу Седову, директору по развитию ГК «Солар» направления «Кибербезопасность для населения», со-директору программ кибербезопасности Школы управления Сколково. И вот его объяснения и советы.

Как это делается

Олег Седов

— Начнем с технологии. Технология дипфейка (deepfake) очень быстро развивается, и чем больше оцифрованных данных есть, тем лучше. Слабым местом ее был голос и жесты руками на экране, то сейчас у deepfake в этих пробелах колоссальный прорыв. Для этого нужно найти в сети необходимое количество фото, видео и аудио примеров подлинника, чтобы в версии deepfake создать его цифровую копию, которую будет трудно отличить от оригинала. Это объясняет причину того, что больше всему подвержены deepfake известные и популярные персоны. В нашем случае одной из задач дипфейка было найти голос человека и его повторить.

Но где взять ваш голос?

Да поговорить с вами по телефону! Когда вам звонит какой-нибудь «сотрудник полиции», это может быть даже не человек, а робот, который и какой-нибудь голосовой дефект сможет смоделировать. Между вами и вашим собеседником, живым человеком, может находиться какой-нибудь дипфейк, который сымитирует голос, вам знакомый.

Жертвы же выбираются очень просто. Если раньше можно было обратиться по телефону просто со словом «мама!», то сейчас злоумышленники могут назвать даже чье-то знакомое вам имя, чтобы завоевать максимум доверия. Откуда это берется? Огромное количество данных утекло из интернета, а анализ больших данных позволяет выявлять определенные группы потенциальных жертв для мошеннических сценариев.

Если раньше звонили и говорили, что на вас оформлена некая кредитная история, иногда даже называя вас по фамилии, то теперь могут позвонить и представиться вашим начальником. Очень мало у кого есть мужество, чтобы сказать, услышав голос генерального директора: «А чем вы докажете, что вы — генеральный директор?!».

Большинство же, не думая, бежит и выполняет требование. А ведь сведения собираются просто: список топ-менеджеров обычно на виду, как и их телефоны. И опять же мало кто задумается: «А зачем генеральный директор будет мне звонить?».

Сомневаться!

— Ваша сильная сторона оказалась в том, что вы стали сомневаться. Вообще члены семьи должны договориться о каком-то контрольном слове, чтобы понимать: разговор идет со своими.

Одного мальчика из частной гимназии (за ним приезжала машина с водителем) мы готовили к следующему: что ты будешь делать, если за тобой приедет другая машина и другой водитель? Как ты поймешь, что эта машина от мамы? Потому должно быть контрольное слово или слова, например, накормил ли ты кота Ваську. И это можно считать паролем: кота могут звать не Васькой или вообще в доме не кот, а собака. Услышишь неоговоренный ответ — беги к первому увиденному полицейскому.

Еще один вариант в случае звонка. Можно взять паузу и сказать: «Плохо слышно, перезвони мне через минуту». Этого времени вам хватит, чтобы кому-то стоящему рядом пересказать эту историю своими словами. Тогда вы поймете, что где-то проскакивает некий слом в логике. И уже можно не на эмоциях, а на здравом смысле проанализировать ситуацию.

И должно быть такое понятие, как домашнее обучение — оговорить с членами семьи, что будет, если… Если нет кого-то рядом, кому можно рассказать, что произошло с ним в данный момент, пусть ребенок расскажет эту историю себе самому, стоя перед зеркалом.

В киберсреде важно не доверять случайным друзьям, знакомым и сомнительным авторитетам. Поэтому дети не должны забывать простую жизненную истину: самый мощный внедорожник — это родители, они вытащат из любой грязи!

А если копнуть глубже

После прошедшего шока и разговора с экспертом таки пришлось порыться в интернете, чтобы окончательно поставить точки над «i».

Само слово «дипфейк» родилось из синтеза английских слов: deep learning — «глубинное обучение», и fake — «подделка». Словом, это изображение, где лицо или голос человека не настоящие, а сотворены искусственным интеллектом. Да, хорошее дело фейком не назовут.

Создают дипфейки нейронные сети. Сами эти создания человеческого разума винить не в чем: это инструмент, который может быть использован как во благо, так и наоборот.

Одна из технологий такова: на входе в создаваемый файл соединяются две аудиозаписи, и голос со второй записи переносится на первую. Из первого аудиоролика с помощью Content Encoder выделяется, ЧТО было сказано, из второго с использованием Speaker Encoder берется то, КАК сказано. Оба эти представления — что и как — объединяются, в итоге синтезируется результат: сказанное в первой записи озвучивается голосом из записи второй.

Есть еще один вариант. В 2017 году появились генеративные состязательные сети (GAN). Эта технология объединяет две нейросети: одна с названием «дискриминатор» играет роль цензора и «критикует» модель, созданную другой нейронной сетью. То есть, они как бы соревнуются между собой. В результате очень правдоподобный дипфейк отправляется к своей «жертве».

Настроить общественное мнение

Какие же технические варианты возможны для защиты от дипфейков? После того как Марк Цукерберг столкнулся с подделкой своей личности, его социальная сеть (признана в нашей стране нежелательной социальной сетью — прим. автора) вместе с Мичиганским университетом создала свой «детектор» фальшивых изображений. Но попробуйте найти такие программы в открытом доступе!

А, может быть, дело вовсе не в технике? Ведь и голос, и изображение человеческого лица являются, по сути, персональными данными человека. А закон «О персональных данных» в нашей стране принят уже давно, и за их хищение следует вовсе неслабое наказание. Так почему бы российским законодателям такие человеческие характеристики, как голос и изображение лица, не защитить законом?!…

Самое интересное, что уже защищены — постановлением Правительства Российской Федерации от 30 июня 2018 г. № 772. Оно выделяет следующие виды биологических персональных данных: изображение лица человека, полученное с применением фото- либо видеоустройств; голосовые данные, полученные в результате работы звукозаписывающих устройств.

И осталось всего-ничего: правоприменительная практика. Пара очень громких процессов даст старт формированию общественного мнения о нетерпимости подобных действий: ведь что может быть хуже подделки личности?!…

Вот на какой уровень изысканий и размышлений навел звонок от злоумышленников, которым не удалось довести свое «грязное» дело до конца.

Фото — с сайта gelios-t.ryimages

Читайте также...

Яндекс.Метрика