Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường

0:00 / 0:00
0:00
(Ngày Nay) - Giấc mơ đưa robot nhân dạng vào đời sống thường nhật của mọi gia đình đã tạo ra một loại hình công việc mới. Điều kiện ứng tuyển chỉ bao gồm một bộ dây đeo đầu, một chiếc điện thoại thông minh và một danh sách các việc vặt cần làm.
Quang cảnh buổi huấn luyện robot nhân dạng tại trung tâm đào tạo của X-humanoid, ngoại ô thành phố Bắc Kinh hôm 19/3.
Quang cảnh buổi huấn luyện robot nhân dạng tại trung tâm đào tạo của X-humanoid, ngoại ô thành phố Bắc Kinh hôm 19/3.

Cùng với sự bùng nổ của trí tuệ nhân tạo (AI), robot nhân dạng (humanoid robot) đã trở thành “chiến tuyến” mới nhất trong cuộc đua thống trị công nghệ cao. Các nhà sản xuất liên tiếp tung ra những mẫu robot mới có thể đi lại, nhảy múa và thậm chí chiến đấu với độ linh hoạt ngày càng cao.

Tuy nhiên, việc tạo ra một robot đa năng có thể hoạt động tại các cửa hàng, văn phòng và nhà cửa đòi hỏi một lượng dữ liệu khổng lồ. Để robot học cách thay thế con người an toàn và hiệu quả, các hãng công nghệ đang ráo riết thu thập dữ liệu từ những video ghi lại các cảnh làm việc nhà hằng ngày của con người.

Điều này tạo nên cơn “khát dữ liệu” với các đoạn video góc nhìn thứ nhất dùng để huấn luyện robot. Trong vài tháng gần đây, các công ty khởi nghiệp đã nhanh chóng đáp ứng nhu cầu này bằng cách thu thập và gán nhãn video từ hàng nghìn lao động hợp đồng trên khắp thế giới.

“Chúng tôi cần dữ liệu hoạt động trong mọi môi trường, tại các nhà máy sản xuất, kho bãi, cửa hàng bán lẻ, viện dưỡng lão, bệnh viện,v.v., bởi các chuyển động rất khác nhau”, ông Arian Sadeghi, Phó Chủ tịch phụ trách dữ liệu robot tại công ty Micro1, cho biết. Công ty này bắt đầu tuyển dụng đội ngũ quay video từ xa từ năm 2025.

Mỗi cộng tác viên được cấp thiết bị gắn camera lên đầu kèm hướng dẫn quay và danh sách nhiệm vụ như nấu ăn, dọn dẹp, làm vườn hay chăm sóc thú cưng. Họ phải luân phiên các đầu việc và gửi ít nhất 10 giờ video mỗi tuần.

Dù hiện tại các cảnh quay chủ yếu xoay quanh việc nhà, ông Sadeghi cho biết công ty khuyến khích người tham gia quay thêm các hoạt động khác để giúp robot có thể nhanh chóng thích nghi với môi trường và nhiệm vụ mới trong tương lai. “Chúng tôi nói với họ rằng: “Hãy cứ quay bất cứ việc gì bạn muốn robot làm thay cho mình”, vị Phó Chủ tịch chia sẻ.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 1
Những thước phim thực tế từ cộng tác viên toàn cầu được Micro1 sử dụng để xây dựng thuật toán cho robot đa năng.

“Hàng tỷ giờ dữ liệu”

Dù đặt trụ sở tại thành phố Palo Alto (bang California, Mỹ), Micro1 hiện có khoảng 4.000 “chuyên gia robot tổng quát” tại 71 quốc gia, cung cấp hơn 160.000 giờ video mỗi tháng. Tuy nhiên, theo ông Sadeghi, con số này vẫn chưa đủ: “Có lẽ sẽ phải cần tới hàng tỷ giờ. Chúng ta thậm chí còn chưa chạm đến các tương tác giữa con người. Hiện mới chỉ là những việc nhà đơn giản”. Ông cho rằng nhu cầu dữ liệu trong lĩnh vực robot đang đi theo quỹ đạo tương tự giai đoạn đầu của các chatbot AI như ChatGPT. Nếu ChatGPT học từ hàng trăm tỷ từ ngữ trên internet để đưa ra phản hồi thì robot cũng cần một kho thư viện tương đương nhưng với độ đặc thù cao hơn nhiều về chuyển động vật lý.

Điều này mở ra cơ hội kinh doanh trị giá hàng tỷ USD cho các startup như Micro1, vốn không chỉ thu thập mà còn gán nhãn video để robot phân biệt vật thể, khoảng cách và chuyển động. Các công ty nghiên cứu thị trường ước tính ngành thu thập và gắn nhãn dữ liệu sẽ tăng trưởng trung bình khoảng 30% mỗi năm, đạt quy mô ít nhất 10 tỷ USD vào năm 2030, dẫn đầu bởi khu vực châu Á.

Ông Ravi Rajalingam, nhà sáng lập công ty gán nhãn dữ liệu Objectways, cho biết trước đây ông từng cung cấp dữ liệu âm thanh và hình ảnh để huấn luyện trợ lý ảo và xe tự lái, trước khi chuyển hướng sang robot từ năm 2025. Tuy nhiên, kể từ khi thuê lao động thu thập dữ liệu con người, chỉ khoảng một nửa số video gửi về là có thể sử dụng.

Nhà sáng lập Objectways cho biết dù chi phí thuê lao động tại Mỹ cao gấp ba lần so với Việt Nam hay Ấn Độ, một số khách hàng vẫn sẵn sàng chi trả để có dữ liệu từ các hộ gia đình Mỹ. Lý do là vì robot cần hiểu đúng bối cảnh nơi chúng sẽ được triển khai đầu tiên. “Căn bếp ở Ấn Độ rất khác căn bếp ở Mỹ. Cây chổi cũng khác. Đó là lý do chúng tôi thu thập dữ liệu trên toàn thế giới”, ông Rajalingam chia sẻ.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 2
Công nhân huấn luyện robot nhân dạng bên trong trung tâm đào tạo của X-humanoid tại ngoại ô Bắc Kinh vào ngày 19/3.

Cách huấn luyện robot

Trong nhiều thập kỷ, robot chủ yếu được huấn luyện thông qua điều khiển từ xa bởi con người - một phương pháp đòi hỏi phần cứng đắt đỏ. Một lựa chọn khác rẻ hơn mới xuất hiện không lâu là sử dụng phần mềm mô phỏng các kịch bản ảo, song hiệu quả thường thấp hơn khi tương tác với vật thể thực, ví dụ như khi robot phải nhặt một chiếc ly.

“Dữ liệu luôn là bài toán đánh đổi giữa chất lượng và số lượng”, bà Alicia Veneziani, Phó Chủ tịch mở rộng thị trường của công ty Sharpa - startup chuyên về bàn tay robot tại Singapore nhận định.

Tại Trung Quốc, Chính phủ đang rót vốn mạnh mẽ vào ngành này với kế hoạch lập ít nhất 60 trung tâm đào tạo robot trên toàn quốc. Theo ông Marco Wang, nhà phân tích tại công ty nghiên cứu thị trường Interact Analysis, phần lớn robot nhân dạng sản xuất hàng loạt tại quốc gia này hiện được mua cho mục đích đào tạo và nghiên cứu.

Tuy nhiên, từ cuối năm 2025, ngành công nghiệp bắt đầu ưa chuộng dữ liệu con người như một giải pháp trung gian, bởi chi phí chỉ bao gồm thiết bị ghi hình như GoPro, kính thông minh của Meta hoặc điện thoại, cùng tiền công từ 5-20 USD/giờ tùy khu vực.

“Thay vì để robot thực hiện nhiệm vụ, chúng ta muốn con người trực tiếp làm việc đó. Bằng cách này, doanh nghiệp không phải tốn chi phí vận hành robot mà chỉ cần chi trả cho thiết bị ghi hình và nhân công”, nhà phân tích giải thích. Chuyên gia này cũng cho biết các mô hình thu thập dữ liệu tương tự đã xuất hiện tại Nhật Bản và Hàn Quốc nhưng thường đặt trụ sở tại Đông Nam Á để tối ưu hóa chi phí lao động.

Trong khi đó, công ty Tesla hiện đang huấn luyện robot nhân dạng Optimus tại các cơ sở ở thành phố Fremont (bang California, Mỹ) và có kế hoạch mở rộng sang thành phố Austin (bang Texas, Mỹ). Ngược lại, các khu vực như Mỹ và châu Âu lại ưu tiên phương pháp huấn luyện mô phỏng ảo, với sự dẫn dắt của gã khổng lồ chip Nvidia.

Dù vậy, chính Nvidia trong báo cáo hồi tháng 2/2026 cũng thừa nhận tầm quan trọng của dữ liệu thực tế. Việc tích hợp hơn 20.000 giờ video góc nhìn thứ nhất đã giúp nâng tỷ lệ thành công của các tác vụ phức tạp như gấp áo phông, phân loại bài tây, mở nắp chai hay sử dụng ống tiêm lên thêm hơn 50%.

“Việc chỉ phụ thuộc vào một phương pháp thu thập dữ liệu duy nhất có lẽ không phải là hướng đi tối ưu. Tương lai của ngành sẽ là sự kết hợp linh hoạt giữa nhiều phương thức tiếp cận khác nhau”, ông Wang nhận định.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 3
Công nhân huấn luyện robot nhân dạng bên trong trung tâm đào tạo của X-humanoid tại ngoại ô Bắc Kinh vào ngày 19/3.

Chặng cuối của quá trình tự động hóa

Bước ngoặt của robot tự động xảy ra vào năm 2023, khi các mô hình ngôn ngữ lớn - nền tảng tạo nên ChatGPT khai sinh ra thuật toán mới có khả năng chuyển đổi tín hiệu thị giác thành hành động vật lý. Theo ông Puneet Jindal, nhà đồng sáng lập công ty gán nhãn dữ liệu Labellerr AI, nhờ bước tiến này, robot từ chỗ chỉ biết thực hiện các tác vụ lặp đi lặp lại đã bắt đầu biết nhận thức và điều hướng trong thế giới thực.

Năm 2026, Labellerr AI đã bắt đầu thu thập video góc nhìn thứ nhất từ các công nhân nhà máy tại Ấn Độ. Ông Jindal nhận định, trong ba năm tới, việc ưu tiên dữ liệu con người là một “lựa chọn hiển nhiên”, dù làn sóng này có thể không kéo dài mãi. Nguồn dữ liệu thực tế này có thể được dùng để hoàn thiện các môi trường mô phỏng, hoặc trong tương lai, AI có thể tự chuyển đổi các video trên YouTube thành góc nhìn thứ nhất để thay thế. “Ngay cả các phòng thí nghiệm robot hiện cũng không dám chắc 12 tháng tới họ sẽ cần loại dữ liệu nào trong 12 tháng tới”, nhà đồng sáng lập chia sẻ.

Sở dĩ robot đa năng cần lượng dữ liệu huấn luyện khổng lồ là do tính biến động cực cao của môi trường gia đình - nơi đồ đạc, thiết bị và con người luôn thay đổi vị trí. Theo ông Rutav Shah, nhà nghiên cứu robot tại Đại học Texas ở thành phố Austin (Mỹ): “Thứ robot còn thiếu là trực giác về lực, ma sát và những yếu tố bất định mà con người phải tích lũy cả đời. Việc có thể biến robot thành trợ thủ nấu ăn, dọn dẹp thực thụ chính là chặng cuối đầy thách thức của hành trình tự động hóa”.

Theo ông Alexander Verl, Chủ tịch nghiên cứu của Liên đoàn Robot Quốc tế, hiện nay, robot nhân dạng chủ yếu được triển khai trong môi trường kiểm soát như nhà máy - nơi chúng có thể hoàn thành nhiệm vụ với tỷ lệ thành công 99,9%. “Đối với những việc nhà như gấp quần áo, xác suất robot làm nhiệm vụ thành công thường chỉ dao động quanh mức 70 - 80%. Trong tiêu chuẩn sản xuất công nghiệp, con số đó là không thể chấp nhận được”, ông Verl nói.

Bên cạnh đó, nhà sáng lập công ty gán nhãn dữ liệu Objectways cũng cảnh báo về những rủi ro an toàn nghiêm trọng, ví dụ như việc robot dọn dẹp không thể phân biệt giữa búp bê và trẻ em. Nếu robot bế nhầm con tôi bỏ vào thùng rác, Bên cạnh đó, nhà sáng lập công ty gán nhãn dữ liệu Objectways cũng cảnh báo về những rủi ro an toàn nghiêm trọng, ví dụ như việc robot dọn dẹp không thể phân biệt giữa búp bê và trẻ em. Nếu robot bế nhầm con tôi bỏ vào thùng rác, đó sẽ là khởi đầu cho một vụ kiện triệu đô”, ông Rajalingam nói. Theo chuyên gia này, việc thử nghiệm robot với trẻ em vẫn còn là chuyện của tương lai xa, nhưng hiện tại, họ đã bắt đầu cho chúng “thực tập” với những chú chó.

Theo CNN
Ảnh minh hoạ.
Sóng nhiệt đại dương đe dọa hệ sinh thái biển California
(Ngày Nay) - Nhiệt độ nước biển tại khu vực Nam California (Mỹ) đang liên tiếp phá vỡ các kỷ lục lịch sử, dấy lên lo ngại về một đợt sóng nhiệt đại dương bất thường. Các nhà nghiên cứu cảnh báo rằng tình trạng áp cao khí quyển có thể phá hủy hệ sinh thái biển nếu còn tiếp diễn.
OPEC+ tiếp tục nới hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày
OPEC+ tiếp tục nới hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày
(Ngày Nay) - Tổ chức Các nước xuất khẩu dầu mỏ (OPEC) và các đồng minh - còn gọi là OPEC+ - ngày 5/4 đã nhất trí tăng hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày từ tháng 5 tới. Đây là mức tăng khiêm tốn và chủ yếu chỉ mang tính biểu tượng, do các thành viên chủ chốt trong liên minh không thể tăng sản lượng thực tế bởi cuộc chiến giữa Mỹ và Israel với Iran.
EU triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới từ ngày 10/4
EU triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới từ ngày 10/4
(Ngày Nay) - Từ ngày 10/4/2026, Liên minh châu Âu (EU) sẽ triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới mang tên EES (Entry/Exit System), đánh dấu bước chuyển quan trọng trong hoạt động quản lý biên giới khu vực Schengen. Việc áp dụng kiểm tra 100% đối với hành khách ngoài EU được dự báo sẽ gây ra tình trạng ùn tắc tại các sân bay, nhà ga quốc tế và cảng biển ngay trong những ngày đầu triển khai.