Trong một bài đăng trên blog vào thứ Tư, OpenAI cho biết Sora có khả năng tạo video với độ dài lên tới 60 giây từ hướng dẫn bằng văn bản, với khả năng cung cấp các cảnh có nhiều nhân vật, các loại chuyển động cụ thể và khung nền chi tiết.
“Mô hình này không chỉ hiểu những gì người dùng yêu cầu trong lời gợi ý, mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới vật chất”, phía OpenAI cho biết và thông báo họ dự định đào tạo các mô hình AI để có thể “giúp mọi người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực”.
Đây là nỗ lực mới nhất của công ty đứng sau chatbot ChatGPT, tiếp tục thúc đẩy phong trào nghiên cứu AI tạo sinh.
Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, nhận định mặc dù “các mô hình đa phương thức” không phải là mới và các mô hình chuyển văn bản thành video đã tồn tại, nhưng điều làm nên sự khác biệt của Sora là độ dài và độ chính xác mà OpenAI tuyên bố.
Ông Hayden cho biết những loại mô hình AI này có thể có tác động lớn đến thị trường giải trí kỹ thuật số với nội dung được cá nhân hóa mới được truyền trực tuyến trên các kênh.
Đồng thời, OpenAI cho biết Sora vẫn đang trong quá trình hoàn thiện với những “điểm yếu” rõ ràng, đặc biệt là các chi tiết không gian của lời nhắc, ví dụ như lẫn lộn giữ trái và phải, cũng như nguyên nhân và kết quả.
Công ty này đưa ra ví dụ về việc tạo một video quay cảnh ai đó cắn một miếng bánh quy nhưng lại không có vết cắn ngay sau đó.
Hiện tại, thông điệp của OpenAI vẫn tập trung vào sự an toàn. Công ty cho biết họ có kế hoạch hợp tác với một nhóm chuyên gia để thử nghiệm mô hình mới nhất và xem xét kỹ lưỡng các lĩnh vực khác nhau bao gồm thông tin sai lệch, nội dung thù địch và thành kiến. Công ty cho biết họ cũng đang xây dựng các công cụ giúp phát hiện thông tin sai lệch.
Sora trước tiên sẽ được cung cấp cho các chuyên gia an ninh mạng, những người có thể đánh giá sản phẩm về tác hại hoặc rủi ro. Nó cũng cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để thu thập phản hồi về cách các chuyên gia sáng tạo có thể sử dụng nó.
Bản cập nhật mới nhất được đưa ra khi OpenAI tiếp tục phát triển ChatGPT.
Đầu tuần này, công ty cho biết họ đang thử nghiệm một tính năng trong đó người dùng có thể kiểm soát bộ nhớ của ChatGPT, cho phép họ yêu cầu nền tảng ghi nhớ các cuộc trò chuyện để làm cho các cuộc trò chuyện trong tương lai được cá nhân hóa hơn hoặc yêu cầu AI quên những gì đã thảo luận trước đó.