Facebook опроверг причастность к акции #10yearchallenge

Флешмоб способен помочь в обучении систем распознавания лиц, считают эксперты
Фотографии людей в теории могут использоваться для обучения нейросетей, если во флешмобе поучаствует больше тысячи человек/ Максим Стулов / Ведомости

Facebook опроверг свое авторство популярного в социальной сети флешмоба #10yearchallenge, где пользователи сравнивают свои актуальные фотографии с собственными изображениями десятилетней давности. Социальная сеть ответила в Twitter редактору издания Wired Николасу Томпсону, который предположил, что флешмоб весьма удобен, чтобы обучать алгоритмы распознавания лиц определять возраст людей. «10 year challenge – это флешмоб, который начался сам по себе, без нашего участия. Это свидетельство того, что люди развлекаются на Facebook, и не более того», – ответила ему социальная сеть. За сообщением последовало более сотни ответов, в которых пользователи выражали недоверие к соцсети.

Ранее Wired опубликовал колонку эксперта Кэти О’Нилл, в которой она описывает, как флешмоб может пригодиться разработчикам алгоритмов распознавания лиц. Чтобы тренировать алгоритм распознавать возраст и влияние старения на внешний вид человека, нужен большой набор фотографий людей и желательно, чтобы эти фотографии были сделаны с разницей за фиксированный период времени, например за 10 лет, отмечает О’Нилл. Для обучения нейросети эти фотографии должны быть четко и ясно размечены: «тогда» и «сейчас». Facebook мог бы использовать для этих целей уже существующие в социальной сети изображения, но в них много «шума»: люди не публикуют фотографии в хронологическом порядке, их возраст на изображении может не совпадать с датой публикации фотографии, метаданные (когда изображение было сделано) могут отсутствовать. А в ходе флешмоба на Facebook большинство людей сами добавляют к изображениям нужный контекст «я в 2008 г. и я в 2018 г.» и дополнительную информацию – где и когда была сделана фотография, пишет О’Нилл. То есть благодаря флешмобу можно собрать большой набор специально отобранных фотографий людей, сделанных с разницей в десять лет.

Возраст – больная тема для распознавания лиц, соглашается технический директор разработчика систем распознавания лиц Vocord Алексей Кадейшвили. Сложность состоит в том, чтобы собрать релевантные данные для обучения с необходимыми тегами, поясняет он. Десять лет – небольшой срок, интересно отслеживать изменения за 15 лет и более, причем данные должны размечать пользователи вручную, говорит он.

Фотографии людей в теории могут использоваться для обучения нейросетей, если во флешмобе поучаствует больше тысячи человек, рассуждает основатель компании NtechLab Артем Кухаренко. В то же время современные алгоритмы (например, принадлежащий компании FindFace) уже способны определять возраст по фото с погрешностью в несколько лет, говорит Кухаренко. И этого вполне достаточно для сбора обезличенной статистики, указывает он. Но за 15 лет существования у Facebook было достаточно времени собрать данные для обучения своих алгоритмов: пользователи каждую минуту загружают свои фото и файлы содержат информацию о дате и времени съемок, замечает директор научно-исследовательского департамента группы компаний ЦРТ Кирилл Левин. Некоторые смартфоны оснащены алгоритмами распознавания лиц, которые способны определять возраст человека; лишь из-за яркого макияжа и освещения они могут ошибиться на несколько лет, указывает Левин.

Задача обучения нейросетей, в том числе для распознавания возраста, сегодня достаточно успешно решается с помощью готовых как публичных, так и закрытых библиотек, которые предоставляют различные компании и исследовательские университеты, спорит ведущий эксперт по разработке программного обеспечения Microsoft Commercial Software Engineering Константин Кичинский. Данные в этих наборах размечены единообразно и отвечают требованиям по защите персональных данных, указывает он.

В любом случае фотографии флешмоба не смогут использовать сторонние компании, солидарны эксперты. Facebook запрещает сторонним разработчикам использовать фотографии своих пользователей, объясняет Кухаренко из NtechLab. Политика конфиденциальности соцсети после недавних скандалов из-за утечек только ужесточилась, говорит Левин из ЦРТ. Пользователи в основном выкладывают фотографии в эту социальную сеть и в Instagram, который также принадлежит Facebook, отметил корреспондент «Ведомостей».

Представитель Facebook в комментарии для Wired также подчеркнул, что фотографии, которые выкладывают во время флешмоба, уже существуют на Facebook и социальная сеть ничего не выиграет. Он также напомнил, что пользователи могут отключить функцию распознавания лиц в любое время. Во флешмобе поучаствовала и операционный директор Facebook Шерил Сандберг. В среду она опубликовала две фотографии со своей сестрой, указав соответствующий хэштег.