Viettel huấn luyện mô hình ai chủ quyền tiếng Việt 120 tỷ tham số, đạt hiệu suất thuộc nhóm dẫn đầu cùng quy mô

0:00 / 0:00
0:00
(Ngày Nay) - Viettel AI phát triển VT-Super-120B-A12B - mô hình ngôn ngữ lớn tiếng Việt 120 tỷ tham số, hướng tới xây dựng các hệ thống AI am hiểu sâu dữ liệu, ngôn ngữ và tri thức tiếng Việt.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đang thúc đẩy phát triển AI chủ quyền tại Việt Nam, đồng thời ghi nhận kết quả rõ rệt về năng lực mô hình thông qua quá trình huấn luyện và tinh chỉnh trên các mô hình mở NVIDIA Nemotron.

Thông qua các bài kiểm tra, VT-Super-120B-A12B - mô hình ngôn ngữ lớn (Large Language Model - LLM) tiếng Việt do Viettel AI nghiên cứu và làm chủ đạt hiệu suất cao, nằm trong nhóm dẫn đầu về độ chính xác so với các mô hình có cùng quy mô. Đây là kết quả của việc mô hình được huấn luyện trên dữ liệu bản địa và tối ưu cho các bài toán nghiệp vụ trong nước. Đáng chú ý, VT-Super-120B-A12B tăng cường năng lực xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng quên kiến thức cũ (catastrophic forgetting) thường gặp trong quá trình huấn luyện và tinh chỉnh mô hình AI.

VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super với quy mô 120 tỷ tham số, do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện, tinh chỉnh và tối ưu cho tiếng Việt. Khả năng xử lý ngữ cảnh dài của kiến trúc NVIDIA Nemotron cho phép mô hình duy trì mạch thông tin xuyên suốt giữa nhiều tài liệu, quy trình và hội thoại phức tạp trong cùng một tác vụ.

Viettel huấn luyện mô hình ai chủ quyền tiếng Việt 120 tỷ tham số, đạt hiệu suất thuộc nhóm dẫn đầu cùng quy mô ảnh 1
VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super, có khả năng xử lý ngữ cảnh dài (Ảnh: NVIDIA)

Đây là năng lực đặc biệt quan trọng với các bài toán vận hành đặc thù tại Việt Nam, nơi nhiều quy định và quy trình có thể thay đổi tùy theo loại hồ sơ, đối tượng liên quan hoặc bối cảnh thực thi cụ thể. Việc sở hữu một mô hình lõi có khả năng ghi nhớ và thích ứng linh hoạt với dữ liệu thực tế tạo tiền đề để Viettel AI tinh chỉnh LLM đạt độ chính xác cao, giải quyết triệt để việc tối ưu hóa ứng dụng AI cho từng tổ chức, doanh nghiệp Việt Nam.

Bên cạnh việc kế thừa năng lực từ kiến trúc NVIDIA Nemotron 3 Super, Viettel AI cũng xây dựng quy trình huấn luyện LLM dựa trên các nguồn dữ liệu mang tính bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và hệ thống văn bản chuyên ngành tại Việt Nam. Quá trình này bao gồm nhiều giai đoạn huấn luyện; trong đó, giai đoạn tiếp tục tiền huấn luyện (continued pre-training) mở rộng năng lực ngôn ngữ và tri thức tiếng Việt trên kho dữ liệu quy mô lớn. Tiếp theo, mô hình được tinh chỉnh có giám sát (supervised fine-tuning) nhằm cải thiện khả năng suy luận, sau đó được học tăng cường (reinforcement learning) để nâng cao độ chính xác trong phản hồi và khả năng xử lý nghiệp vụ.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định: “AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ có lợi thế tạo ra những hệ thống phục vụ đúng nhu cầu phát triển của mình. Với Viettel, làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền có khả năng đồng hành thực sự cùng các tổ chức, doanh nghiệp Việt Nam.”

Làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền tại Việt Nam

Shilpa Kolhatkar, Giám đốc AI Nations của NVIDIA cho biết: “Thông qua việc thúc đẩy phát triển AI chủ quyền và AI chuyên biệt theo từng lĩnh vực, Viettel đang góp phần phổ cập khả năng tiếp cận trí tuệ nhân tạo trên quy mô toàn xã hội, đồng thời chuyển hóa ngôn ngữ và dữ liệu bản địa thành những giá trị ứng dụng thực tiễn cho cơ quan chính phủ và doanh nghiệp.”

Trên nền tảng mô hình này, Viettel AI đang phát triển nền tảng AI Agent dành cho người Việt với khả năng tự thực hiện chuỗi tác vụ trong cùng một không gian làm việc. Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên, được kỳ vọng sẽ sở hữu khả năng hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đề xuất giải pháp xử lý theo bài toán cụ thể của người dùng, với chất lượng được nâng cao đáng kể so với các phiên bản trước đây.

Từ hành chính công, chăm sóc khách hàng đến vận hành doanh nghiệp và phân tích dữ liệu, VT-Super-120B-A12B được định hướng trở thành công nghệ lõi cho các hệ thống AI hiểu và phục vụ đúng nhu cầu thực tế của tổ chức, doanh nghiệp Việt Nam.

Viettel huấn luyện mô hình ai chủ quyền tiếng Việt 120 tỷ tham số, đạt hiệu suất thuộc nhóm dẫn đầu cùng quy mô

Viettel AI phát triển VT-Super-120B-A12B - mô hình ngôn ngữ lớn tiếng Việt 120 tỷ tham số, hướng tới xây dựng các hệ thống AI am hiểu sâu dữ liệu, ngôn ngữ và tri thức tiếng Việt.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đang thúc đẩy phát triển AI chủ quyền tại Việt Nam, đồng thời ghi nhận kết quả rõ rệt về năng lực mô hình thông qua quá trình huấn luyện và tinh chỉnh trên các mô hình mở NVIDIA Nemotron.

Thông qua các bài kiểm tra, VT-Super-120B-A12B - mô hình ngôn ngữ lớn (Large Language Model - LLM) tiếng Việt do Viettel AI nghiên cứu và làm chủ đạt hiệu suất cao, nằm trong nhóm dẫn đầu về độ chính xác so với các mô hình có cùng quy mô. Đây là kết quả của việc mô hình được huấn luyện trên dữ liệu bản địa và tối ưu cho các bài toán nghiệp vụ trong nước. Đáng chú ý, VT-Super-120B-A12B tăng cường năng lực xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng quên kiến thức cũ (catastrophic forgetting) thường gặp trong quá trình huấn luyện và tinh chỉnh mô hình AI.

VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super với quy mô 120 tỷ tham số, do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện, tinh chỉnh và tối ưu cho tiếng Việt. Khả năng xử lý ngữ cảnh dài của kiến trúc NVIDIA Nemotron cho phép mô hình duy trì mạch thông tin xuyên suốt giữa nhiều tài liệu, quy trình và hội thoại phức tạp trong cùng một tác vụ.

Viettel huấn luyện mô hình ai chủ quyền tiếng Việt 120 tỷ tham số, đạt hiệu suất thuộc nhóm dẫn đầu cùng quy mô ảnh 2
VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super, có khả năng xử lý ngữ cảnh dài (Ảnh: NVIDIA)

Đây là năng lực đặc biệt quan trọng với các bài toán vận hành đặc thù tại Việt Nam, nơi nhiều quy định và quy trình có thể thay đổi tùy theo loại hồ sơ, đối tượng liên quan hoặc bối cảnh thực thi cụ thể. Việc sở hữu một mô hình lõi có khả năng ghi nhớ và thích ứng linh hoạt với dữ liệu thực tế tạo tiền đề để Viettel AI tinh chỉnh LLM đạt độ chính xác cao, giải quyết triệt để việc tối ưu hóa ứng dụng AI cho từng tổ chức, doanh nghiệp Việt Nam.

Bên cạnh việc kế thừa năng lực từ kiến trúc NVIDIA Nemotron 3 Super, Viettel AI cũng xây dựng quy trình huấn luyện LLM dựa trên các nguồn dữ liệu mang tính bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và hệ thống văn bản chuyên ngành tại Việt Nam. Quá trình này bao gồm nhiều giai đoạn huấn luyện; trong đó, giai đoạn tiếp tục tiền huấn luyện (continued pre-training) mở rộng năng lực ngôn ngữ và tri thức tiếng Việt trên kho dữ liệu quy mô lớn. Tiếp theo, mô hình được tinh chỉnh có giám sát (supervised fine-tuning) nhằm cải thiện khả năng suy luận, sau đó được học tăng cường (reinforcement learning) để nâng cao độ chính xác trong phản hồi và khả năng xử lý nghiệp vụ.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định: “AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ có lợi thế tạo ra những hệ thống phục vụ đúng nhu cầu phát triển của mình. Với Viettel, làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền có khả năng đồng hành thực sự cùng các tổ chức, doanh nghiệp Việt Nam.”

Làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền tại Việt Nam

Shilpa Kolhatkar, Giám đốc AI Nations của NVIDIA cho biết: “Thông qua việc thúc đẩy phát triển AI chủ quyền và AI chuyên biệt theo từng lĩnh vực, Viettel đang góp phần phổ cập khả năng tiếp cận trí tuệ nhân tạo trên quy mô toàn xã hội, đồng thời chuyển hóa ngôn ngữ và dữ liệu bản địa thành những giá trị ứng dụng thực tiễn cho cơ quan chính phủ và doanh nghiệp.”

Trên nền tảng mô hình này, Viettel AI đang phát triển nền tảng AI Agent dành cho người Việt với khả năng tự thực hiện chuỗi tác vụ trong cùng một không gian làm việc. Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên, được kỳ vọng sẽ sở hữu khả năng hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đề xuất giải pháp xử lý theo bài toán cụ thể của người dùng, với chất lượng được nâng cao đáng kể so với các phiên bản trước đây.

Từ hành chính công, chăm sóc khách hàng đến vận hành doanh nghiệp và phân tích dữ liệu, VT-Super-120B-A12B được định hướng trở thành công nghệ lõi cho các hệ thống AI hiểu và phục vụ đúng nhu cầu thực tế của tổ chức, doanh nghiệp Việt Nam.

 nhiếp ảnh gia người Pháp Nicolas Cornet là Olivier Jeandel trong buổi trò chuyện tại Hà Nội
Ký ức, tâm linh và con người Việt Nam qua ống kính của Nicolas Cornet
(Ngày Nay) - Sáng ngày 14/5 tại không gian nhà sách quốc tế Inbook Hà Nội, nhiếp ảnh gia người Pháp Nicolas Cornet - người đã gắn bó, yêu thương và liên tục ghi lại những khoảnh khắc đổi thay của Việt Nam từ cuối những năm 1980 đến nay – đã có những chia sẻ vô cùng xúc động. 
Nghệ sĩ Quyền Thiện Đắc và các nghệ sĩ Bình Minh Jazz Club đã mang đến không gian nghệ thuật đáng nhớ. Ảnh: SVHTT
"Jazz xuống phố" với công chúng Hà Nội
(Ngày Nay) - Chiều cuối tuần tại khu vực Nhà Bát Giác bên hồ Hoàn Kiếm, những âm thanh của saxophone, keyboard và trống vang lên hòa vào không gian phố đi bộ Hoàn Kiếm. Không gian biểu diễn ngoài trời không có khoảng cách giữa nghệ sĩ và khán giả nhưng lại thu hút sự chú ý của đông đảo người dân và du khách. 
Ảnh minh họa.
Bộ Y tế: Trẻ dưới 6 tuổi phải khám sức khỏe định kỳ ít nhất một lần mỗi năm
(Ngày Nay) - Theo hướng dẫn mới được Bộ Y tế ban hành kèm theo Quyết định 1675/QĐ-BYT, trẻ em Việt Nam dưới 6 tuổi trên phạm vi toàn quốc phải được khám sức khỏe định kỳ với tần suất tối thiểu một lần mỗi năm. Quy định có hiệu lực từ ngày 10/6/2026 và thay thế hướng dẫn trước đó ban hành hồi tháng 5/2026.
Xã Mường Lát (Thanh Hóa) thực hiện đồng bộ các chương trình mục tiêu quốc gia giảm nghèo bền vững, phát triển kinh tế xã hội vùng đồng bào dân tộc thiểu số và miền núi.
Phân cấp thực hiện Chương trình mục tiêu quốc gia
(Ngày Nay) - Việc tăng cường phân cấp thực hiện hiệu quả Chương trình mục tiêu quốc gia xây dựng nông thôn mới, giảm nghèo bền vững và phát triển kinh tế xã hội vùng đồng bào dân tộc thiểu số là sẽ giúp cho vùng lõi khó khăn của cả nước phát triển bền vững và hiệu quả hơn
Với chính sách mới, người học có thể tích lũy kết quả học tập theo từng chặng. (Ảnh minh họa)
Kỳ vọng đổi mới đào tạo đại học
(Ngày Nay) - Giữa làn sóng chuyển đổi số, trí tuệ nhân tạo (AI) và yêu cầu học tập suốt đời ngày càng trở nên cấp thiết, Bộ Giáo dục và Đào tạo đang lấy ý kiến đối với Dự thảo Thông tư ban hành Quy chế đào tạo trình độ đại học với nhiều nội dung được đánh giá là mang tính đột phá, đáp ứng đòi hỏi thực tiễn.
Việt Nam tham gia Nhóm Bạn bè tại LHQ về phòng, chống mua bán người sử dụng công nghệ
Việt Nam tham gia Nhóm Bạn bè tại LHQ về phòng, chống mua bán người sử dụng công nghệ
(Ngày Nay) - Ngày 12/6, tại Trụ sở Liên hợp quốc (LHQ) ở New York, đã diễn ra Lễ ra mắt Nhóm Bạn bè tại LHQ về phòng, chống mua bán người sử dụng công nghệ. Đây là sáng kiến do Hàn Quốc khởi xướng, với sự hỗ trợ của Cơ quan LHQ về ma túy và tội phạm (UNODC), thu hút sự tham gia của nhiều nước thành viên LHQ.
Cuba công bố một loạt cải cách kinh tế
Cuba công bố một loạt cải cách kinh tế
(Ngày Nay) - Ngày 13/6, Chủ tịch Cuba Miguel Díaz-Canel đã công bố một loạt biện pháp cải cách các khía cạnh quan trọng của nền kinh tế, trong một quá trình mà nhà lãnh đạo mô tả là "thông minh" để giải quyết tình hình hiện tại của đất nước và các lệnh trừng phạt mới do chính phủ Mỹ áp đặt.
Thêm cú sốc pháp lý với cựu Tổng thống Hàn Quốc Yoon Suk Yeol
Thêm cú sốc pháp lý với cựu Tổng thống Hàn Quốc Yoon Suk Yeol
(Ngày Nay) - Tòa án Quận Trung tâm Seoul ngày 12/6 đã tuyên phạt cựu Tổng thống Hàn Quốc Yoon Suk Yeol 30 năm tù giam với các tội danh lạm dụng quyền lực và tiếp tay cho đối phương liên quan đến cáo buộc chỉ đạo hoạt động đưa thiết bị bay không người lái xâm nhập Triều Tiên năm 2024.