Битва за последний человеческий датасет
Битва за последний человеческий датасет Что общего у нигерийского студента, который надевает Айфон на лоб и снимает, как стелит постель; у индийской швеи в цеху с экшн-камерой над бровью; и у двадцатилетнего китайца, который в VR-шлеме открывает дверцу микроволновки сто раз на дню? Все трое работают на одну индустрию. Эта индустрия уже вполне взрослая, и одного из её главных игроков зовут micro1. Micro1 - это стартап из Пало-Альто. Он даёт гиг-задачки около 4000 "робототехнических универсалам" в 70 странах, и эта небольшая армия сливает в систему почти 200 000 часов видео в месяц. CEO micro1 Али Ансари говорит, что робо-компании (Tesla, Figure AI, Agility) платят ему и конкурентам по сотне миллионов в год за этот контент. Но тут же добавляет: "На самом деле Нам нужны миллиарды часов". Параллельно другие компании, вроде Scale AI или Encord собирают собственные армии. DoorDash платит курьерам, чтобы те снимали каждый свой шаг и все свои домашние дела. А в Китае вообще есть более 40 "школ для роботов" - там тренеры в экзоскелетах учат гуманоидов протирать стол. Если вам показалось, что все эти кожаные антиутопично тренируют своих железных сменщиков, то вам не показалось. Но это не всё: В 1958-м философ Майкл Полани ввёл понятие "неявного знания" (tacit knowledge) - , знания, которое живёт где-то в теле, а не в словах. К примеру, все умеют ездить на велосипеде, но записать вело-езду в виде инструкции - ну, не так уж просто. А швея чувствует пальцами вес ткани и поворачивает запястье ровно в нужный момент - но если попросить её объяснить, как именно, то она скажет "ну, вот как-то так". То есть, это то знание, которое точно есть, но его сложно формализовать. И вот что интересно. Раньше ИИ кушал то, что кожаные сами заранее оцифровали и принесли ему на блюдечке. Это "лёгкий" датасет - он готов, лежит и ждёт. А теперь индустрия добралась до того, что можно добывать только одним способом - нанимая живых людей с камерами на лбу. И кстати, заметили, что с камерами бегают не американцы или европейцы, а африканцы и индусы? И ещё китайцы, но у них своя атмосфера. Для этого уже успели придумать термин "дата-колониализм". Повседневная жизнь людей в "третьем мире" становится сырьём для капитала в "золотом миллиарде". Раньше так добывали каучук и тростник, а теперь вот, видосы с открыванием микроволновки. Тут можно ехидно поржать над индийскими швеями, которые отдают тацитное знание (последний неоцифрованный актив человечества) всего за 100-200 баксов в месяц. Но, положа руку на сердца, лично с меня все нужные данные сняли ещё в 2022, когда я просто сидел и печатал тексты. И мне за это заплатили нуль. Так что, даже не знаю, кто и над кем тут должен смеяться 😈 https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/