Những tính năng mới của OpenAI nâng cấp quá trình tạo giọng nói

(Ngày Nay) - OpenAI đã hé lộ một loạt các công cụ mới giúp các lập trình viên dễ dàng tạo ra những phần mềm ứng dụng dựa trên công nghệ trí tuệ nhân tạo (AI). Đặc biệt là trong bối cảnh khi ChatGPT đang phải cạnh tranh với những “ông lớn công nghệ” khác để theo kịp cuộc đua AI.
Hình logo OpenAI được chụp vào ngày 20/5/2024. Ảnh: Reuters.
Hình logo OpenAI được chụp vào ngày 20/5/2024. Ảnh: Reuters.

Một công ty của Microsoft cho biết, họ đang thử nghiệm một loại công cụ mới cho phép các lập trình viên tạo các phần mềm ứng dụng giọng nói AI chỉ bằng một bộ lệnh duy nhất. Trước đây, quá trình này yêu cầu phải trải qua ít nhất 3 bước: đầu tiên là chuyển đổi giọng nói; sau đó chạy mô hình tạo văn bản để đưa ra câu trả lời cho câu hỏi; và cuối cùng là sử dụng mô hình chuyển đổi văn bản thành giọng nói riêng biệt.

Một phần lớn doanh thu của OpenAI đến từ việc có nhiều doanh nghiệp sử dụng công nghệ của công ty này, nhằm tạo nên các phần mềm ứng dụng AI của riêng họ. Điều này khiến việc nâng cấp các khả năng của AI trở thành điểm cốt lõi để kinh doanh. Cuộc chạy đua trí tuệ nhân tạo ngày càng nóng lên khi các “ông lớn công nghệ” như Alphabet - công ty mẹ của Google, tích hợp các mô hình AI có khả năng xử lý các dạng thông tin khác nhau như video, ghi âm và văn bản trên toàn bộ nền tảng của họ.

Doanh thu của OpenAI vào năm 2024 là 3,7 tỷ USD, theo Reuters, dự kiến ​​doanh thu sẽ tăng lên 11,6 tỷ USD vào năm tới. Công ty này cũng đang trong quá trình gây quỹ 6,5 tỷ USD để có thể định giá công ty ở mức 150 tỷ USD.

Từ đợt triển khai kế hoạch vào ngày 1/10/2024, OpenAI giới thiệu một công cụ “fine-tunning” - tinh chỉnh, giúp mô hình chuyên môn hóa và tối ưu hóa cho một nhiệm vụ cụ thể, cho phép các lập trình viên cải thiện những kết quả mà AI tạo ra bằng hình ảnh và văn bản. Quá trình tinh chỉnh này bao gồm nhận phản hồi từ người dùng, chính người dùng sẽ huấn luyện cho AI bằng việc cung cấp các mẫu câu trả lời.

Việc cung cấp hình ảnh cho quá trình tinh chỉnh sẽ giúp AI còn giúp hình dung rõ hơn, nâng cao khả năng của các ứng dụng như tìm kiếm bằng hình ảnh và phát hiện đối tượng cho việc phát triển loại xe lái tự động.

Công ty của Microsoft cũng tiết lộ sẽ có một công cụ cho phép các mô hình nhỏ hơn học hỏi từ các mô hình lớn hơn, cùng với "Prompt Caching" - bộ nhớ đệm nhắc nhở, giúp cắt giảm một nửa chi phí phát triển bằng cách sử dụng lại các phần văn bản mà AI đã xử lý trước đó.

Theo Reuters
UNESCO công bố cẩm nang mới, tái định hình cách thức quản trị di sản thế giới
UNESCO công bố cẩm nang mới, tái định hình cách thức quản trị di sản thế giới
(Ngày Nay) - Trong bối cảnh các Di sản Thế giới phải đối mặt với sức ép ngày càng gia tăng từ phát triển kinh tế, biến đổi khí hậu đến những hạn chế trong quản trị, UNESCO cùng ba Cơ quan Tư vấn của Ủy ban di sản thế giới là ICCROM, ICOMOS và IUCN đã công bố ấn phẩm mới mang tên Quản lý Di sản Thế giới (Managing World Heritage). Ấn phẩm được xác định là tài liệu nền tảng, định hình khung hệ thống quản lý và bảo tồn không chỉ cho các Di sản Thế giới mà còn cho các địa điểm di sản nói chung.
Bali. Ảnh: Outlook Travel Magazine
Từ Bali nghĩ tới Vân Đồn - Thương cảng đệ nhất Đông Nam Á
(Ngày Nay) - Trong lúc Bali ngột ngạt trong dòng người và hiểm họa ô nhiễm môi trường vẫn là điểm đến của 6,5 triệu du khách mỗi năm, thì Vân Đồn với những lợi thế du lịch tương đồng lại vẫn đang như nàng tiên cá nép mình dưới biển xanh, như viên ngọc quý ẩn trong lớp vỏ trai.