Ценность данных

1413

D-Russia.ru публикует выдержки из эссе Виктории Харт (Vi Hart) – американского математика, исследовательницы и философа. Широкое признание получили её работы по популяризации математики, такие как «Рисование каракулей в математическом классе», «Гексафлексагоны», «Двенадцать тонов и притча о полигонах». Она окончила Stony Brook University (бакалавр, музыкальное образование). Недолго работала композитором, одновременно публикуя исследования по геометрии, математике и музыке. Была главным исследователем в группе разработки коммуникаций в SAP, затем работала в Y Combinator Research. В настоящее время исследователь в Microsoft (офис технического директора). Публикуется в New York Times, NPR, Wired, New Scientist. Лауреат JPBM Communications Award.

Если попытаться продать свои данные прямо сейчас, вы вряд ли получите много. Потому что данные легкодоступны, предложение превышает спрос.

В книге Джарона Ланье (Jaron Lanier) «Кому принадлежит будущее?» приводятся убедительные доказательства, что данные уже чрезвычайно ценны, а вскоре их реальная цена вырастет настолько, что позволит человеку жить на эти средства, пока его данные используются.

Проблема в том, что люди не могут выходить со своими данными на открытый рынок. Сегодня мы можем только ожидать, что кто-то возьмёт наши данные. Такое положение не позволяет включить нормальные рыночные механизмы. Поэтому мы не знаем истинную ценность данных, а она значительна.

Создание справедливого рынка данных – непростая задача. Существующий рынок данных, безусловно, будет этому противиться. Низкая цена данных и нечёткий правовой статус этого рынка препятствуют тому, чтобы данные стали экономическим локомотивом для человечества.

Если бы рынок данных был по-настоящему честным, любой человек мог бы участвовать в продаже своих данных и покупке данных других людей. Тогда справедливый рынок сложился бы сам собой. Однако сегодня рынок сильно асимметричен: несколько влиятельных компаний (и правительств) извлекают большую ценность из данных, а люди являются лишь источниками этих данных. Сложившаяся культура убеждает людей, что их данные ничего не стоят, поэтому люди – владельцы данных – находятся вне рыночных отношений, или принадлежащие им данные покупаются по самым низким ценам, независимо от их реальной ценности для покупателя.

Реальность такова, что хороший рынок – это не свободный рынок и не рынок с фиксированными ценами, а рынок, постоянно пересматривающий стоимость информации. Честные и прозрачные правила, сильные профсоюзы и гарантированная минимальная заработная плата – эти элементы мы использовали в прошлом для создания справедливых рынков в других областях. Что-то подобное необходимо и сегодня [для рынка данных]. Бизнесу нужно отказаться от очень опасного принципа «если люди могут работать только за гроши, то они будут работать за гроши».

Монопсония данных

Термин «монопсония» означает положение на рынке, где оперируют многие продавцы и есть единственный покупатель, который и диктует цены. Полезно сравнить историю и современное состояние монопсонии данных и труда.

Монопсония на рынке труда приводит к тому, что рыночные механизмы не в состоянии исправить острый дисбаланс между себестоимостью производства и тем, по какой цене продаётся произведённое. Результат – несправедливо высокие цены и эксплуатация покупателей.

При монопсонии труда работники не могут найти работу, за которую платят столько, сколько на самом деле стоит этот труд, независимо от того, какую прибыль получит работодатель. У большинства людей нет выбора, за какую работу им браться. Их знания и навыки, а также место жительства обычно ограничивают варианты трудоустройства. Иногда возникает ситуация, когда люди работают за сумму, которая ниже прожиточного минимума.

История снова и снова показывает, что монопсония труда приводит к тому, что компании не только платят крайне низкую зарплату, но заставляют работать в небезопасных условиях и без отдыха (сегодня это происходит, например, «благодаря» Amazon – ред.).

Трудовое законодательство США поддерживает высокие стандарты только для некоторых категорий работников, но по-прежнему допускает практику, при которой чрезвычайно богатые и успешные компании платят своим работникам меньше прожиточного минимума. Такое положение дел ещё больше укрепляет власть работодателей над своими работниками, поскольку долги работников увеличиваются и они не могут позволить себе отстаивать свои интересы, вести переговоры с работодателем, организовывать профсоюзы или переходить на другую работу.

Монопсония данных – это не совсем то же самое, что и монопсония труда, потому что люди производят данные одновременно с выполнением другой работы и не считают, что это их единственный доход. Тем более, если принять во внимание тот факт, что почти все люди производят данные и не придают этому большого значения.

Но все чётче просматривается тенденция увеличения задолженности работников, а также перевода их с полной занятости на временную или сдельную работу. Пока люди могут позволить себе не обращать внимания на безграничную эксплуатацию своих данных со стороны бизнеса. Вероятно, так будет продолжаться до тех пор, пока люди имеют традиционные рабочие места со всеми гарантиями и защитой, закрепленными в законодательстве. Но мнение людей может быстро измениться, как только большинство из них сможет получить только временную или сдельную работу.

Однако монопсония данных – это не только результат асимметрии власти и малое время занятости. Это ещё и культура трудовых отношений. Из истории промышленной революции мы знаем, что у этой культуры есть «слепые пятна». Например, женский или детский труд долгое время оплачивался существенно хуже, чем та же работа мужчин, то же относится и к сдельной работе.

К этому же ряду явлений можно отнести примеры, когда людей убеждают в незначительной ценности данных именно те компании, которые на основе этих данных подвергают людей обширным манипуляциям, чтобы они продолжали тратить свое время на производство таких данных и обмен ими.

Кому нужны чужие данные – примеры

Биржевая стоимость Facebook, компании, которая не предлагает людям ничего, кроме возможности делиться данными, в марте превысила 50 миллиардов долларов. Существование сложной IT-инфраструктуры социальной сети, тысячи высококвалифицированных IT-специалистов – нанятых в большинстве своём, впрочем, по временным контрактам – имеют экономическим обоснованием только пользовательские данные, фактически торговлю этими данными. Успех Facebook измеряется прежде всего количеством пользователей – курс акций компании идёт следом за ним.

Отсутствие официального, регулируемого рынка данных, о котором пишет Ви Харт, не мешает существовать нелегальному рынку. В России такой рынок есть, и стоимость персональных данных на нём известна. Товар на этот рынок поставляют онлайн-компании, завладевшие данными своих клиентов, а также преступники – инсайдеры, хакеры.

Большинство из нас так привыкли к статус-кво «культуры обмена», что не замечают несообразность такого положения вещей.

Посредничество при управлении данными

История появления трудовых прав показывает, что для изменения нынешнего положения нам нужно что-то наподобие профсоюза. Коллективные переговоры могут защитить людей от монопсонии на рынке труда. Поэтому, если все сделать правильно, это будет беспроигрышно [и на рынке данных].

Данные полезны для машинного обучения тогда, когда их много. Их ценность повышается, если они собираются и организуются с использованием одних и тех же стандартов для всего набора данных («размечаются» — ред.). Изолированные данные отдельного человека стоят очень мало, поэтому у разобщённых людей нет переговорной силы. Однако коллективные переговоры по большим наборам данных могут привести не только к более справедливой оценке набора данных и вклада каждого человека, но и созданию более крупных, более качественных наборов данных, которые помогут избежать ошибок искусственного интеллекта, обусловленных «плохими» данными.

Люди должны обращаться к посредническим организациям, специализирующимся на продаже данных (Mediators of Individuals’ Data, MIDs), выбирать одного или нескольких таких посредников из множества, например, отдавая предпочтение тем, которые хотя и платят меньше, но гарантируют бо́льшую конфиденциальность. Одни посредники будут управляться как корпорации, другие как кооперативы (НКО, в принятом у нас смысле – ред.). Вместо того, чтобы договариваться или принимать индивидуальные условия различных приложений и услуг, посредническая организация должна выработать комплексное, более выгодное пользователям соглашение. Помимо прочего, такой подход позволит пользователям отказаться от необходимости изучения и принятия множества соглашений об использовании.

Необходимо разработать нормативное регулирование в отношении того, как обеспечивается контроль за данными и их конфиденциальностью. Это крайне важно, потому что использование посредников, которые собирают и управляют данными людей, не должно быть больше выбором. Это обязанность. Даже если человек не использует социальные сети, его данные собираются и продаются такими учреждениями, как больницы и банки. Эти учреждения могут заявлять, что они не делятся персональными данными, а предоставляют третьим лицам только анонимизированную статистику и основные демографические данные.

Но уверения в анонимизации ничего не значат: как только достаточное количество данных о человеке было собрано и продано, даже если это «невинные» статистические данные, они могут быть проанализированы на предмет установления их настоящего владельца.

Больше нет оснований для утверждения, что агрегированные данные существуют вне интересов тех, кто их создал. Это должно быть отражено в законе.

Уязвимости агрегированных данных влияют не только на отдельных людей, но и на общественное здравоохранение, безопасность и конфиденциальность данных. Можно утверждать, что, как и в случае с автострахованием и прививками, это не индивидуальный выбор. Человек, который решит бесплатно отдавать свои данные за какие-то услуги, снизит стоимость данных других людей и поможет быстрее деанонимизировать других лиц.

Выбор, связанный с данными, их конфиденциальностью и экономической значимостью, чересчур сложен для индивида, но слишком важен для общества в целом и может крайне негативно отразиться на каждом. Поэтому принятие индивидуальных решений по этому вопросу не может оправдываться свободой личного выбора. Вряд ли стоит ожидать, что каждый человек сможет быть профессиональным адвокатом, который в состоянии разобраться во всех тонкостях соглашений о конфиденциальности и оценить всё многообразие юридических последствий своих решений.

Подобная практика ограничения личного выбора уже используется обществом. Например, сегодня закон запрещает работать полный рабочий день при минимальной зарплате и делает автострахование обязательным.

Джарон Ланье выдвигает идею об обязательности передачи контроля над данными посредническим организациям или, по крайней мере, чтобы отказ от услуг такой организации был достаточно сложным.

Необходимо, чтобы «быстрый клик» на пользовательском соглашении больше не был методом окончательной легимитизации выбора пользователя.

Нельзя оставлять пользователя незащищённым, даже если он сам на это согласен. Это не вопрос удобства или бизнеса.

Формирующиеся подходы

Описанные предложения по организации продажи данных и контроля за ними могут оказаться недостаточными или даже в корне неверными, потому что они основаны на механизмах, созданных для физического мира и физического труда.

Возможно, люди продают не просто данные, а возможность улучшить модели машинного обучения. Возможно, необходимо отслеживать источники всех данных и получать отчисления от фактического использования ИИ-систем, обученных на этих данных.

Цифровые товары и собственность не работают так же, как физические товары. Возможно, настало время для совершенно новой экономической модели, которая лучше приспособлена для учёта этих особенностей. Это особенно важно для цифровой экономики, где цифровые товары и услуги составляют всё возрастающую долю.

Мы можем стремиться к будущему, в котором обычный человек будет иметь доступ к вычислительным мощностям и знаниям, которые позволят ему выступать на рынке данных как продавцом, так и покупателем. Это позволит разрушить монопсонию и создать более справедливый рынок. Если бы кто-то, кроме крупных компаний, мог воспользоваться преимуществами недооценённых данных, он создал бы более здоровые рыночные отношения.

Точно так же, как использование недооценённого сельскохозяйственного труда требует владения сельскохозяйственным оборудованием и производственными площадями, существенно большими, чем большинство людей могли себе когда-либо позволить, использование недооценённого информационного труда требует огромных вычислительных ресурсов, к которым в настоящее время имеют доступ только несколько очень крупных компаний. Как следствие, монополия вычислительных ресурсов приводят к монополизации данных.

Трагедия владельцев данных и работников информационной сферы

Сегодня сотрудники уже не могут рассчитывать на полный рабочий день в одной компании и на то, что вся их карьера пройдет в одной компании. Однако трудовое законодательство предполагает, что это так. Необходимо выяснить, где работа по краткосрочному контракту и сдельная работа вписываются в наши законы, а где нет. Вероятно, нам необходимы новые законы, которые отражают новую реальность и лучше соответствуют трудовым отношениям в будущем. Если в будущем вся работа будет краткосрочной, нам необходимы законы, которые, с одной стороны, удовлетворят потребности бизнеса, а с другой – сохранят здоровье сотрудников.

Текущее регулирование допускает возможность перегружать сотрудников работой и при этом оставлять их без льгот, медицинского страхования или прожиточного минимума. Необходимо новое трудовое законодательство, всеобщее здравоохранение и надзор, которые гарантируют сохранение трудовых ресурсов, удовлетворяющих возрастающие потребности бизнеса.

Уже сейчас владельцы технологических компаний и рекрутёры, занимающиеся подбором программистов, жалуются на невозможность найти хороших наёмных работников, которые имеют необходимые навыки и опыт. При этом ни одна компания не хочет инвестировать в обучение сотрудников (автор пишет о ситуации в США, в России это не так – ред.), потому что никто не ожидает, что сотрудник останется на той же работе более чем на несколько лет. Каждая компания предполагает, что программисты будут работать день и ночь, придерживаясь крайне сжатых сроков разработки продукта. После проекта сотрудники остаются выгоревшими, без возможности и желания развивать свои навыки. Выполнив работу, сотрудники возвращаются в пул трудовых ресурсов, где им придется бежать изо всех сил, чтобы доказать свою ценность для следующего работодателя, который ожидает, что они сделают работу смыслом своей жизни.

Технологическая индустрия не одинока в устоявшейся практике выжимать из людей всё что можно и после этого оставлять проблему «выгоревшего» человека кому-то ещё. Это трагедия всего трудового сообщества. Но именно технологическая отрасль обеспечивает масштабность этой проблемы.

Такие платформы, как Instagram и YouTube, работающие на алгоритмах, требуют, чтобы люди как можно лучше соответствовали тому, чего алгоритм хочет в данный момент. Люди жертвуют всем, вкладываясь в то, что модно сейчас, и зарабатывая на этом в краткосрочной перспективе. Эти алгоритмы стимулируют работу до предела человеческих возможностей, заставляют отказываться от здоровых привычек, посещений врача и личной жизни, ведь они мешают недостижимой мечте об успехе. (Ещё боле яркий пример – торговля артефактами многопользовательских компьютерных игр – ред.)

Алгоритмы убивают креативное или необычное мышление, не позволяют развивать уникальные навыки, не дают права на ошибку. Все мысли человека должны быть выстроены точно в правильном направлении, и направление это – имитация уникальности, это обеспечивает клики и внимание миллионов пользователей, которым насаждается та же – ложная — мысль об уникальности и независимости их суждений. Новый контент должен появляться часто и без каких-либо изменений по сути, т.к. эти изменения могут оттолкнуть текущую аудиторию и вызвать немилость алгоритмов.

Трагедия заключается в том, что любой намёк на инновационность, развитие и всё то, что человечество ценит больше всего и что даст возможность искусственному интеллекту достигнуть нового уровня зрелости, уничтожается ещё до того, как будет выявлено и оценено. Когда системы стимулируют постоянное участие в процессе, а успех – это победа в конкурентной борьбе за рабочие места, клики, внимание, тогда никакое количество навыков, достижений или успехов не позволяют замедлиться, остановиться, осмотреться, попробовать новые подходы или получить новые навыки.

Поэтому безусловный базовый доход (Ви Харт имеет в виду традиционный подход к регулированию, продемонстрированный выше на примере рынка труда – ред.) является необходимостью. Альтернатива – плата за фактическое использование искусственным интеллектом данных человека.

Если искусственный интеллект действительно способен автоматизировать 99% человеческой работы, то люди должны договориться об очень хорошей цене за выполнение «работы по требованию» последнего 1%, а также за данные, которые делают первые 99% возможными. На справедливом рынке данных люди, которые создают хорошие наборы данных или необычные данные, должны зарабатывать много денег. Но даже минимальное участие людей в создании данных, например, в демографических данных или публичных записях, ценно, потому что эти данные реальны, истинны и уникальны для них.

Идеи об искусственном интеллекте и безусловном базовом доходе должны перестать концентрироваться вокруг искусственных ценностей, т.е. ценностей искусственного интеллекта, и начать концентрироваться вокруг ценности человечества.

Следите за нашим Телеграм-каналом, чтобы не пропускать самое важное!

Поделиться: