Один из простых способов сохранить анонимность — размыть свое лицо, номера, названия улиц и т д в программе для редактирования фотографий. Но этот метод оказывается бессильным против современных алгоритмов.
Исследователи из Техасского университета и Корнеллского университета утверждают, что технологии машинного обучения могут легко угадать реальные данные, скрывающиеся за размытыми пикселями, пишет Wired.
Исследователи показали, что сокрытие конфиденциальных данных на изображении только мешает людям увидеть информацию — они угадывают пиксельное лицо с вероятностью 0,19%. С другой стороны, для стандартного набора данных алгоритм программного обеспечения имеет точность 71% в одном испытании и улучшается до 83%, если программе разрешено угадать пять раз. При этом алгоритм не убирает размытие с изображения — он догадывается, что за ним скрывается.
Исследователи также пытались использовать свою технологию в настоящей атаке — распознавать людей, чьи лица размыты в видеороликах YouTube. Сначала они взяли базу данных изображений людей и размыли их лица с помощью инструментов YouTube. Это позволило обучить систему машинного обучения на основе глубокой нейронной сети. После этого алгоритм распознавал людей с размытыми лицами с точностью 57% после однократной обработки и с точностью 85%, если машина предприняла пять попыток.
«Это довольно простой механизм», — говорит один из исследователей Ричард Макферсон. «Единственное реальное ограничение — это набор данных, на котором можно обучать машинное обучение». Но это можно решить».