Мерч AW-Therm інтернет магазин

Як відео монтажників систем ОВК навчають штучний інтелект

Д. Гарник

У квітні 2021 року я давав інтерв'ю для рубрики «В гостях у REHAU» з Максимом Солоненком (REHAU Water Technologies). Мене запитали: не страшно, що технології захоплять усе? Я відповів: «Роботи нас захоплять не найпершими. Сюди це просто докотиться — ми встигнемо підготуватися». Минуло п'ять років. Я публікую аналітичну статтю про те, як роботи навчаються по відео інсталяторів

Зображення як роботи замінять монтажника

Розвиток AI-інфраструктури вже зараз створює структурний попит фахівців з ОВК (опалення, вентиляції та кондиціювання), монтажників санітарно-технічних систем і обладнання для будівництва дата-центрів — і водночас фінансує розробку роботів, які навчаються на відео людей за роботою. McKinsey прямо називає зварювання і сантехніку серед задач для гуманоїдів у будівництві. Wired у січні 2026-го: «справжня битва за AI-таланти точиться за сантехніків і електриків». Два процеси відбуваються одночасно.

Парадокс: AI потребує тих, кого планує замінити

AI-інфраструктура — це насамперед фізична інфраструктура: дата-центри, системи охолодження, трубопроводи, електромережі. І саме тут виникає дефіцит, якого ніхто не очікував.

«AI-бум загострює дефіцит технічних фахівців»,— Wired, січень 2026

У січні 2026 року Wired опублікував матеріал про структурний дефіцит skilled trades у США на тлі буму будівництва дата-центрів.

Що відбувається на ринку:

81 000
Електриків/рік
рогнозований дефіцит США 2024–2034 (Bureau of Labor Statistics (BLS) — Бюро статистики праці)
130 000
Додаткових електриків
потрібно до 2030 (McKinsey)
?
Сантехніків / HVAC
«просто не вистачає» — РНСС

Зображення Дан Кіньонес, виконавчий директор Association of Plumbing-Heating-Cooling Contractors (PHCC) «Є велика конкуренція. І частина проблеми — просто не вистачає сантехніків і HVAC-фахівців», — Дан Кіньонес, виконавчий директор Association of Plumbing-Heating-Cooling Contractors (PHCC)

Дата-центри вже зараз пропонують інсталяторам вищу оплату, ніж традиційне будівництво — через щільні графіки та понаднормові. Попит варіюється регіонально, але загальна тенденція: AI-інфраструктура конкурує з усіма іншими секторами за одних і тих самих людей.

Для HVAC-ринку це означає конкретний контекст: системи охолодження дата-центрів — охолодження водяними контурами та прецизійне кондиціювання повітря — це пряма спеціалізація. Сьогодні дефіцит таких фахівців є структурною проблемою AI-індустрії.

Як роботи навчаються на відео людей

Навчання роботів завжди було дорогим: потрібне спеціальне обладнання, оператори та тисячі годин демонстрацій. Дослідники вирішили цю проблему, використовуючи відео звичайних людей за роботою.

У 2023 році NYU та Meta створили датасет із 13 годин відео від першої особи: люди в 216 будинках знімали себе за побутовими справами. Мета — навчити AI-системи керувати роботами в життєвих умовах.

У грудні 2025 року Figure AI відкрила Helix Lab —лабораторію для збору великомасштабних egocentric-відеоданих під час взаємодії людини з фізичним середовищем. Ці дані навчають модель Helix — «зір-мова-дія» систему для гуманоїдного робота Figure 03 (висота 173 см, вага 61 кг, 30 ступенів свободи, тактильні сенсори на кінчиках пальців від 3 г).

Дослідники Стенфорда опублікували метод Phantom: навчання роботів без роботизованого обладнання — лише на відео людей. Система прибирає людину з кадру, вставляє роботизовану руку і використовує відеопари для навчання. Запуск на роботизованій платформі — без додаткового навчання.

«Будь-яка людина з RGBD-камерою може зробити внесок у навчання робота. Це радикально знижує вартість збору даних», — Stanford Phantom

Між відео та роботом: що всередині

Відео від першої особи — лише вхідні дані. Сучасні роботизовані системи для монтажних і сервісних робіт використовують кілька базових підходів машинного навчання.

Перший етап — навчання через імітацію дій людини (imitation learning). Система аналізує рухи монтажника, послідовність операцій, положення інструмента та повторює ці дії у власній моделі поведінки.

Далі застосовується перенесення навичок із симуляції у робоче середовище (sim-to-real transfer). Робот відпрацьовує сценарії у цифровій симуляції, де може виконати тисячі повторень без ризику пошкодження обладнання. Після цього модель переноситься на фізичну платформу.

Окремий напрямок — прогнозування наступного руху (motion policy learning). У цьому випадку система навчається визначати, яку дію потрібно виконати далі залежно від положення інструмента, конфігурації вузла та зовнішніх умов.

Проте для повноцінної роботи у життєвих умовах цього недостатньо.

Роботизовані системи також потребують:

  • систем зворотного силового зв’язку та тактильного сприйняття для контролю зусилля й контакту з поверхнею;
  • комплексу навігації та орієнтації в незнайомому просторі;
  • механізмів захоплення й роботи з інструментами різної форми та призначення.

Шлях від публічного відео до робота-монтажника значно складніший. Але кожен із цих компонентів є предметом активних досліджень — Stanford Phantom (2025) уже усунув потребу в роботизованому обладнанні для збору даних.

Масштаб: ключові датасети для навчання роботів

Верифіковані датасети (офіційні джерела)

  • Open X-Embodiment (Google DeepMind + 33 інститути, 2023–2024) — відкритий. 1M+ траєкторій руху роботів, 160 266 задач, 22 типи роботів, 60 датасетів від 34 лабораторій.
  • DROID — 350 годин відео, 76 000 демонстрацій у робочих умовах — від кухонь до промислових задач.
  • GEN-0 → GEN-1 (Generalist AI, закритий комерційний, 2025–2026) — GEN-0: 270 000 годин маніпуляцій, зростання +10 000 год/тиждень. GEN-1 (квітень 2026): понад 500 000 годин. Перше емпіричне підтвердження scaling laws для фізичного AI.
  • Figure AI Helix (закритий) — egocentric-відео з Helix Lab; використовується для навчання VLA-моделі Helix для Figure 03.

На яких відео роботи навчаються найкраще

Не кожне відео однаково придатне для навчання. Характеристики оптимальних тренувальних даних:

Що робить відео цінним для навчання робота

  • POV від першої особи — руки та інструмент у фокусі, без обрізаних кадрів.
  • Повторювані дії в різних умовах — різний кут, освітлення, матеріал — підвищують стійкість моделі.
  • Інструмент у кадрі протягом усієї операції — захват → використання → відпускання як єдина послідовність.
  • Безперервний запис без монтажних вирізів — дозволяє моделі засвоїти весь ланцюжок рухів.
  • Помилки людини та виправлення у кадрі — нетипові ситуації підвищують надійність моделі в робочих умовах.

@awtherm Тепла підлога водяна монтаж ♬ оригінальний аудіозапис – @awtherm - @awtherm

Відео. Приклад відео майстрів на YouTube та TikTok: POV-зйомка, повторювані операції, інструмент у кадрі протягом усієї операції

Будівництво та монтаж: що вже в плануванні

McKinsey у жовтні 2025 року прямо назвав зварювання і сантехніку серед задач для гуманоїдних роботів у будівництві:

«Універсальні роботи можуть бути корисними в широкому спектрі будівельних робіт — від переміщення важких бетонних блоків до зварювання та сантехнічних робіт», — McKinsey, жовтень 2025

В окремому розборі McKinsey зазначає, що майбутні можливості включатимуть прокладку комунікацій та монтаж труб у важкодоступних і небезпечних локаціях.

Scientific Reports (грудень 2025) фіксує: у ряді прототипів роботи вже тренуються в симуляціях на прокладанні кабелю, зав'язуванні арматури та монтажі з'єднань трубопроводів — з подальшим відпрацюванням у робочих умовах.

Фінансовий масштаб: інвестиції в гуманоїдів зросли у п'ять разів з 2022 по 2024 рік (понад $1 млрд/рік). McKinsey оцінює ринок роботів загального призначення у $370 млрд до 2040 року (звіт «Will embodied AI create robotic coworkers», червень 2025). Ринок будівельних роботів: $168 млн у 2022 р. → прогноз $774 млн до 2032 р. (+360%).

Що роботам поки не вдається: обмеження

McKinsey: масштабне використання гуманоїдів у будівництві — горизонт десяти і більше років.

Для монтажного ринку конкретні обмеження такі:

Технічні обмеження Специфіка українського ринку
  • Робота у вузьких шахтах і технічних ніша.
  • Нестандартні різьби та застарілі з'єднання.
  • Мокрі та слизькі поверхні.
  • Контроль зусилля затягування без тактильних сенсорів.
  • Навігація на завантажених, неструктурованих майданчиках.
  • Висока частка реконструкцій старого фонду без цифрових моделей.
  • Нестандартизований монтаж у наявному житловому фонді.
  • Відсутність BIM-моделей на більшості об'єктів.
  • Адаптація до систем 1970–2000-х років.
  • Відновлення пошкодженої інфраструктури — ситуативні задачі без шаблону.

Саме ці обмеження визначають поточну межу автоматизації в монтажній галузі. Жодне з них не є постійним: кожне є предметом активних досліджень.

Що це означає: відео, авторські права та стратегія

Кожен майстер, який публікує POV-відео роботи на YouTube, створює матеріал, технічно придатний для навчання роботів. Чи використовуються такі відео зараз — публічних підтверджень немає. Але механіка збору, яку описують дослідники, технічно доступна для публічно розміщеного контенту.

Юридична зона: питання використання публічних відео для навчання AI активно обговорюється в Європейському Союзі у рамкахавторсько-правового регулювання AI Act (Artificial Intelligence Act). Ряд платформ вже дозволяє авторам встановлювати мета-теги noai, що забороняють AI-парсинг. Зона активних правових дискусій без усталеного регулювання — залежно від країни, платформи і типу ліцензії.

Практичні кроки для інсталятора вже сьогодні:

  • Освоювати складні нетипові системи — індивідуальні теплові пункти (ІТП), автоматизація, Smart Home, системи охолодження — де робот без CAD-моделі і тактильних сенсорів не справляється ще дуже довго.
  • Будувати технічну репутацію: майстер, якого знають і якому довіряють, не замінюється платформою — він стає частиною системи, яка нею керує.
  • Розвивати навички читання технічної документації англійською — інтерфейси перших роботизованих систем та документація до них будуть англомовними.
  • Освоювати цифрові інструменти: BIM, IoT, AI-діагностика — компетенції, що підвищують цінність у гібридній команді людина + автоматизована платформа.

Таймлайн

2023 NYU + Meta: датасет із 13 год. POV-відео людей для навчання домашніх роботів (216 будинків). Open X-Embodiment: 1M+ траєкторій від 34 лабораторій.
2025 Stanford Phantom: навчання роботів лише на відео людей.
2025 Figure AI Helix Lab відкрито для збору egocentric-відео. Figure 03: 173 см, 61 кг, тактильні сенсори від 3 г
2025 Generalist AI GEN-0: 270 000 годин робочих маніпуляцій, +10 000 год/тиждень. Перше підтвердження scaling laws для фізичного AI
2025 McKinsey: «welding and plumbing» — прямо в переліку задач для гуманоїдів у будівництві
2026 Wired: дефіцит сантехніків і HVAC-техніків названо ключовим обмеженням AI-інфраструктури. Generalist AI GEN-1: 500 000 годин
2027 Прогноз McKinsey: прототипи гуманоїдів на будівельних майданчиках
2030 Прогноз McKinsey: масове впровадження роботів у будівництві
2040 Прогноз McKinsey: ринок роботів загального призначення — $370 млрд

Висновок

Два одночасні процеси перебудовують монтажний ринок: AI-інфраструктура потребує HVAC-фахівців прямо зараз — і фінансує розробку роботів, які навчаються на їхніх відео.

Парадокс 2026 року: AI-індустрія критично потребує сантехніків і HVAC-техніків прямо зараз — для будівництва тієї самої інфраструктури, яка фінансує розробку роботів для їхньої заміни у майбутньому. Wired назвав це «справжньою битвою за AI-таланти». McKinsey зафіксував сантехніку у списку цільових задач для гуманоїдів. Відеозаписи монтажних робіт стають навчальними даними для AI-моделей, які формують алгоритми руху та роботи з інструментом.

Структура вже визначена: ті, хто опанує роботу поруч із автоматизованими системами, залишаться затребуваними незалежно від темпу впровадження.

Більше важливих статей і новин в Telegram-каналі та корисні відео на Youtube-каналі та у TikTok.  Долучайтесь!

Переглянуто: 1 410


Залишити коментар

Telegram