Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường

0:00 / 0:00
0:00
(Ngày Nay) - Giấc mơ đưa robot nhân dạng vào đời sống thường nhật của mọi gia đình đã tạo ra một loại hình công việc mới. Điều kiện ứng tuyển chỉ bao gồm một bộ dây đeo đầu, một chiếc điện thoại thông minh và một danh sách các việc vặt cần làm.
Quang cảnh buổi huấn luyện robot nhân dạng tại trung tâm đào tạo của X-humanoid, ngoại ô thành phố Bắc Kinh hôm 19/3.
Quang cảnh buổi huấn luyện robot nhân dạng tại trung tâm đào tạo của X-humanoid, ngoại ô thành phố Bắc Kinh hôm 19/3.

Cùng với sự bùng nổ của trí tuệ nhân tạo (AI), robot nhân dạng (humanoid robot) đã trở thành “chiến tuyến” mới nhất trong cuộc đua thống trị công nghệ cao. Các nhà sản xuất liên tiếp tung ra những mẫu robot mới có thể đi lại, nhảy múa và thậm chí chiến đấu với độ linh hoạt ngày càng cao.

Tuy nhiên, việc tạo ra một robot đa năng có thể hoạt động tại các cửa hàng, văn phòng và nhà cửa đòi hỏi một lượng dữ liệu khổng lồ. Để robot học cách thay thế con người an toàn và hiệu quả, các hãng công nghệ đang ráo riết thu thập dữ liệu từ những video ghi lại các cảnh làm việc nhà hằng ngày của con người.

Điều này tạo nên cơn “khát dữ liệu” với các đoạn video góc nhìn thứ nhất dùng để huấn luyện robot. Trong vài tháng gần đây, các công ty khởi nghiệp đã nhanh chóng đáp ứng nhu cầu này bằng cách thu thập và gán nhãn video từ hàng nghìn lao động hợp đồng trên khắp thế giới.

“Chúng tôi cần dữ liệu hoạt động trong mọi môi trường, tại các nhà máy sản xuất, kho bãi, cửa hàng bán lẻ, viện dưỡng lão, bệnh viện,v.v., bởi các chuyển động rất khác nhau”, ông Arian Sadeghi, Phó Chủ tịch phụ trách dữ liệu robot tại công ty Micro1, cho biết. Công ty này bắt đầu tuyển dụng đội ngũ quay video từ xa từ năm 2025.

Mỗi cộng tác viên được cấp thiết bị gắn camera lên đầu kèm hướng dẫn quay và danh sách nhiệm vụ như nấu ăn, dọn dẹp, làm vườn hay chăm sóc thú cưng. Họ phải luân phiên các đầu việc và gửi ít nhất 10 giờ video mỗi tuần.

Dù hiện tại các cảnh quay chủ yếu xoay quanh việc nhà, ông Sadeghi cho biết công ty khuyến khích người tham gia quay thêm các hoạt động khác để giúp robot có thể nhanh chóng thích nghi với môi trường và nhiệm vụ mới trong tương lai. “Chúng tôi nói với họ rằng: “Hãy cứ quay bất cứ việc gì bạn muốn robot làm thay cho mình”, vị Phó Chủ tịch chia sẻ.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 1
Những thước phim thực tế từ cộng tác viên toàn cầu được Micro1 sử dụng để xây dựng thuật toán cho robot đa năng.

“Hàng tỷ giờ dữ liệu”

Dù đặt trụ sở tại thành phố Palo Alto (bang California, Mỹ), Micro1 hiện có khoảng 4.000 “chuyên gia robot tổng quát” tại 71 quốc gia, cung cấp hơn 160.000 giờ video mỗi tháng. Tuy nhiên, theo ông Sadeghi, con số này vẫn chưa đủ: “Có lẽ sẽ phải cần tới hàng tỷ giờ. Chúng ta thậm chí còn chưa chạm đến các tương tác giữa con người. Hiện mới chỉ là những việc nhà đơn giản”. Ông cho rằng nhu cầu dữ liệu trong lĩnh vực robot đang đi theo quỹ đạo tương tự giai đoạn đầu của các chatbot AI như ChatGPT. Nếu ChatGPT học từ hàng trăm tỷ từ ngữ trên internet để đưa ra phản hồi thì robot cũng cần một kho thư viện tương đương nhưng với độ đặc thù cao hơn nhiều về chuyển động vật lý.

Điều này mở ra cơ hội kinh doanh trị giá hàng tỷ USD cho các startup như Micro1, vốn không chỉ thu thập mà còn gán nhãn video để robot phân biệt vật thể, khoảng cách và chuyển động. Các công ty nghiên cứu thị trường ước tính ngành thu thập và gắn nhãn dữ liệu sẽ tăng trưởng trung bình khoảng 30% mỗi năm, đạt quy mô ít nhất 10 tỷ USD vào năm 2030, dẫn đầu bởi khu vực châu Á.

Ông Ravi Rajalingam, nhà sáng lập công ty gán nhãn dữ liệu Objectways, cho biết trước đây ông từng cung cấp dữ liệu âm thanh và hình ảnh để huấn luyện trợ lý ảo và xe tự lái, trước khi chuyển hướng sang robot từ năm 2025. Tuy nhiên, kể từ khi thuê lao động thu thập dữ liệu con người, chỉ khoảng một nửa số video gửi về là có thể sử dụng.

Nhà sáng lập Objectways cho biết dù chi phí thuê lao động tại Mỹ cao gấp ba lần so với Việt Nam hay Ấn Độ, một số khách hàng vẫn sẵn sàng chi trả để có dữ liệu từ các hộ gia đình Mỹ. Lý do là vì robot cần hiểu đúng bối cảnh nơi chúng sẽ được triển khai đầu tiên. “Căn bếp ở Ấn Độ rất khác căn bếp ở Mỹ. Cây chổi cũng khác. Đó là lý do chúng tôi thu thập dữ liệu trên toàn thế giới”, ông Rajalingam chia sẻ.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 2
Công nhân huấn luyện robot nhân dạng bên trong trung tâm đào tạo của X-humanoid tại ngoại ô Bắc Kinh vào ngày 19/3.

Cách huấn luyện robot

Trong nhiều thập kỷ, robot chủ yếu được huấn luyện thông qua điều khiển từ xa bởi con người - một phương pháp đòi hỏi phần cứng đắt đỏ. Một lựa chọn khác rẻ hơn mới xuất hiện không lâu là sử dụng phần mềm mô phỏng các kịch bản ảo, song hiệu quả thường thấp hơn khi tương tác với vật thể thực, ví dụ như khi robot phải nhặt một chiếc ly.

“Dữ liệu luôn là bài toán đánh đổi giữa chất lượng và số lượng”, bà Alicia Veneziani, Phó Chủ tịch mở rộng thị trường của công ty Sharpa - startup chuyên về bàn tay robot tại Singapore nhận định.

Tại Trung Quốc, Chính phủ đang rót vốn mạnh mẽ vào ngành này với kế hoạch lập ít nhất 60 trung tâm đào tạo robot trên toàn quốc. Theo ông Marco Wang, nhà phân tích tại công ty nghiên cứu thị trường Interact Analysis, phần lớn robot nhân dạng sản xuất hàng loạt tại quốc gia này hiện được mua cho mục đích đào tạo và nghiên cứu.

Tuy nhiên, từ cuối năm 2025, ngành công nghiệp bắt đầu ưa chuộng dữ liệu con người như một giải pháp trung gian, bởi chi phí chỉ bao gồm thiết bị ghi hình như GoPro, kính thông minh của Meta hoặc điện thoại, cùng tiền công từ 5-20 USD/giờ tùy khu vực.

“Thay vì để robot thực hiện nhiệm vụ, chúng ta muốn con người trực tiếp làm việc đó. Bằng cách này, doanh nghiệp không phải tốn chi phí vận hành robot mà chỉ cần chi trả cho thiết bị ghi hình và nhân công”, nhà phân tích giải thích. Chuyên gia này cũng cho biết các mô hình thu thập dữ liệu tương tự đã xuất hiện tại Nhật Bản và Hàn Quốc nhưng thường đặt trụ sở tại Đông Nam Á để tối ưu hóa chi phí lao động.

Trong khi đó, công ty Tesla hiện đang huấn luyện robot nhân dạng Optimus tại các cơ sở ở thành phố Fremont (bang California, Mỹ) và có kế hoạch mở rộng sang thành phố Austin (bang Texas, Mỹ). Ngược lại, các khu vực như Mỹ và châu Âu lại ưu tiên phương pháp huấn luyện mô phỏng ảo, với sự dẫn dắt của gã khổng lồ chip Nvidia.

Dù vậy, chính Nvidia trong báo cáo hồi tháng 2/2026 cũng thừa nhận tầm quan trọng của dữ liệu thực tế. Việc tích hợp hơn 20.000 giờ video góc nhìn thứ nhất đã giúp nâng tỷ lệ thành công của các tác vụ phức tạp như gấp áo phông, phân loại bài tây, mở nắp chai hay sử dụng ống tiêm lên thêm hơn 50%.

“Việc chỉ phụ thuộc vào một phương pháp thu thập dữ liệu duy nhất có lẽ không phải là hướng đi tối ưu. Tương lai của ngành sẽ là sự kết hợp linh hoạt giữa nhiều phương thức tiếp cận khác nhau”, ông Wang nhận định.

Cuộc "chạy đua" huấn luyện robot qua những thước phim đời thường ảnh 3
Công nhân huấn luyện robot nhân dạng bên trong trung tâm đào tạo của X-humanoid tại ngoại ô Bắc Kinh vào ngày 19/3.

Chặng cuối của quá trình tự động hóa

Bước ngoặt của robot tự động xảy ra vào năm 2023, khi các mô hình ngôn ngữ lớn - nền tảng tạo nên ChatGPT khai sinh ra thuật toán mới có khả năng chuyển đổi tín hiệu thị giác thành hành động vật lý. Theo ông Puneet Jindal, nhà đồng sáng lập công ty gán nhãn dữ liệu Labellerr AI, nhờ bước tiến này, robot từ chỗ chỉ biết thực hiện các tác vụ lặp đi lặp lại đã bắt đầu biết nhận thức và điều hướng trong thế giới thực.

Năm 2026, Labellerr AI đã bắt đầu thu thập video góc nhìn thứ nhất từ các công nhân nhà máy tại Ấn Độ. Ông Jindal nhận định, trong ba năm tới, việc ưu tiên dữ liệu con người là một “lựa chọn hiển nhiên”, dù làn sóng này có thể không kéo dài mãi. Nguồn dữ liệu thực tế này có thể được dùng để hoàn thiện các môi trường mô phỏng, hoặc trong tương lai, AI có thể tự chuyển đổi các video trên YouTube thành góc nhìn thứ nhất để thay thế. “Ngay cả các phòng thí nghiệm robot hiện cũng không dám chắc 12 tháng tới họ sẽ cần loại dữ liệu nào trong 12 tháng tới”, nhà đồng sáng lập chia sẻ.

Sở dĩ robot đa năng cần lượng dữ liệu huấn luyện khổng lồ là do tính biến động cực cao của môi trường gia đình - nơi đồ đạc, thiết bị và con người luôn thay đổi vị trí. Theo ông Rutav Shah, nhà nghiên cứu robot tại Đại học Texas ở thành phố Austin (Mỹ): “Thứ robot còn thiếu là trực giác về lực, ma sát và những yếu tố bất định mà con người phải tích lũy cả đời. Việc có thể biến robot thành trợ thủ nấu ăn, dọn dẹp thực thụ chính là chặng cuối đầy thách thức của hành trình tự động hóa”.

Theo ông Alexander Verl, Chủ tịch nghiên cứu của Liên đoàn Robot Quốc tế, hiện nay, robot nhân dạng chủ yếu được triển khai trong môi trường kiểm soát như nhà máy - nơi chúng có thể hoàn thành nhiệm vụ với tỷ lệ thành công 99,9%. “Đối với những việc nhà như gấp quần áo, xác suất robot làm nhiệm vụ thành công thường chỉ dao động quanh mức 70 - 80%. Trong tiêu chuẩn sản xuất công nghiệp, con số đó là không thể chấp nhận được”, ông Verl nói.

Bên cạnh đó, nhà sáng lập công ty gán nhãn dữ liệu Objectways cũng cảnh báo về những rủi ro an toàn nghiêm trọng, ví dụ như việc robot dọn dẹp không thể phân biệt giữa búp bê và trẻ em. Nếu robot bế nhầm con tôi bỏ vào thùng rác, Bên cạnh đó, nhà sáng lập công ty gán nhãn dữ liệu Objectways cũng cảnh báo về những rủi ro an toàn nghiêm trọng, ví dụ như việc robot dọn dẹp không thể phân biệt giữa búp bê và trẻ em. Nếu robot bế nhầm con tôi bỏ vào thùng rác, đó sẽ là khởi đầu cho một vụ kiện triệu đô”, ông Rajalingam nói. Theo chuyên gia này, việc thử nghiệm robot với trẻ em vẫn còn là chuyện của tương lai xa, nhưng hiện tại, họ đã bắt đầu cho chúng “thực tập” với những chú chó.

Theo CNN
Lễ cấp sắc của người Dao Đỏ xã Mỏ Vàng, tỉnh Lào Cai tạo điểm nhấn du lịch hấp dẫn.
Khai thác nguồn lực văn hóa dân tộc thiểu số
(Ngày Nay) - Sau sắp xếp đơn vị hành chính, trên nền tảng nguồn lực di sản được bổ sung và không gian văn hóa giàu bản sắc, các địa phương kết hợp hài hòa giữa bảo tồn và khai thác giá trị truyền thống, từng bước hình thành các sản phẩm công nghiệp văn hóa phục vụ phát triển du lịch.
“Vé về thanh xuân” - Chuyến tàu tái hiện ký ức tuổi trẻ
“Vé về thanh xuân” - Chuyến tàu tái hiện ký ức tuổi trẻ
(Ngày Nay) - Tối 25/4, tại Cung Thể thao Điền kinh (Hà Nội), đêm nhạc “Vé về thanh xuân” đã tái hiện hành trình ký ức đầy cảm xúc, từ những rung động đầu đời học sinh đến những chiêm nghiệm sâu sắc tuổi trưởng thành. Đêm nhạc không chỉ là sân khấu hội ngộ của nhiều thế hệ nghệ sĩ, mà còn tạo nên không gian trải nghiệm đặc biệt cho công chúng yêu nhạc.
Mô hình hoạt động 'Ngày thứ 6 không hẹn" tại Đồng Nai đã đáp ứng nhu cầu nhận kết quả ngay trong ngày của người dân.
Nâng cao hiệu quả hoạt động của chính quyền cấp cơ sở, năng lực cán bộ cấp xã
(Ngày Nay) - Song hành cùng lộ trình sắp xếp, tổ chức tinh gọn bộ máy đảm bảo hoạt động hiệu năng, hiệu lực, hiệu quả và đưa đất nước phát triển, ngày 24/4 vừa qua, tại Kỳ họp thứ Nhất, Quốc hội khoá XVI đã biểu quyết thông qua Nghị quyết về Chương trình giám sát của Quốc hội năm 2027 và Nghị quyết về thành lập Đoàn giám sát chuyên đề về “việc thực hiện chính sách, pháp luật trong quản lý, sử dụng tài sản công là trụ sở làm việc sau khi sắp xếp tổ chức bộ máy và đơn vị hành chính”.
Ảnh minh họa
Nghiên cứu hoàn thiện thể chế phát triển hệ thống giáo dục
(Ngày Nay) - Trong bối cảnh đổi mới đòi hỏi những đột phá về phát triển giáo dục, việc nghiên cứu, xác lập cơ sở khoa học và đề xuất giải pháp hoàn thiện thể chế hệ thống giáo dục là yêu cầu cấp thiết, nhằm tạo động lực cho sự phát triển nhanh và bền vững của đất nước.
Cơ quan chức năng kiểm tra an toàn thực phẩm tại một cơ sở sản xuất, kinh doanh thực phẩm ở Hà Nội.
Siết chặt quản lý an toàn thực phẩm
(Ngày Nay) - Hằng năm ngành y tế đã phát hiện, xử lý hàng trăm nghìn tổ chức, cá nhân vi phạm về vệ sinh an toàn thực phẩm, nhưng số vụ ngộ độc thực phẩm tại các bếp ăn tập thể, ngộ độc thức ăn đường phố đang có xu hướng gia tăng. Để giải quyết vấn đề nêu trên mang tính dài hạn, chiến lược và xuyên suốt, Bộ Y tế, các bộ, ngành liên quan cần chuyển mạnh tư duy quản lý an toàn thực phẩm từ “kiểm soát từng khâu riêng lẻ” sang “quản lý toàn bộ chuỗi giá trị thực phẩm”.