Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

0:00 / 0:00
0:00
(Ngày Nay) - Tại NAACL 2025 , một trong những hội nghị AI hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph -phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025

Sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến, đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh quốc gia. Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, thì bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không, thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong ba hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy VeGraph cải thiện độ chính xác từ 2-5% so với các phương pháp hiện có.

Hầu hết các phương pháp kiểm chứng thông tin hiện nay vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả, đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân hoàn toàn có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vắc-xin, dược phẩm, hay các quy định pháp luật...

Trong tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là một diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán. Năm nay, hội nghị thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Viettel AI là đơn vị trực thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel), tiên phong làm chủ và phát triển các sản phẩm, dịch vụ thuộc lĩnh vực AI, Big Data, Robotics và Digital Twin. Hiện nay, hệ sinh thái Viettel AI bao gồm nhiều dòng sản phẩm có chất lượng dẫn đầu tại Việt Nam, được nhiều tổ chức, doanh nghiệp lớn trong nước và quốc tế tin tưởng sử dụng.

Người gieo chữ bằng yêu thương ở làng Hữu Nghị
Người gieo chữ bằng yêu thương ở làng Hữu Nghị
(Ngày Nay) - Làng Hữu nghị Việt Nam được biết đến là nơi cưu mang những nạn nhân chất độc da cam. Ở đó, suốt 13 năm qua, cô giáo Nguyễn Thị Loan đã kiên nhẫn gieo từng con chữ, từng kỹ năng sống và từng niềm hy vọng cho những đứa trẻ mang nhiều khiếm khuyết nhưng luôn khao khát được lớn lên như bao người khác.
Khoảng trống nhận thức về HPV ở nam giới
Khoảng trống nhận thức về HPV ở nam giới
(Ngày Nay) - Từ năm 2026, Chính phủ chính thức đưa vắc xin HPV vào chương trình Tiêm chủng mở rộng quốc gia. Trong bối cảnh đó, việc phòng ngừa các bệnh do virus HPV gây ra không chỉ là câu chuyện của nữ giới còn là mối quan tâm chung của cả cộng đồng. Tuy nhiên, trên thực tế, nam giới - nhóm đối tượng cũng chịu nhiều nguy cơ từ HPV - vẫn đang đứng ngoài các chiến lược truyền thông và phòng bệnh.
Độc lập và hạnh phúc trong các doanh nghiệp xã hội NICE
Độc lập và hạnh phúc trong các doanh nghiệp xã hội thuộc Mạng lưới NICE
(Ngày Nay) - Có bao giờ bạn tự hỏi liệu những người khuyết tật thật sự cần gì? Họ cần lòng thương cảm? Hay họ cần các món quà vật chất từ các chương trình cứu trợ? Đều không phải. Thứ người khuyết tật cần hơn cả là được nhìn nhận như những công dân bình thường. Họ không muốn bản thân mình trở thành gánh nặng cho gia đình và xã hội. Họ muốn được thể hiện bản thân, được cống hiến hết mình cho cuộc sống này, để được độc lập và hạnh phúc.
Triển khai bảo hiểm y tế bổ sung là tất yếu
Triển khai bảo hiểm y tế bổ sung là tất yếu
(Ngày Nay) - Hiện nay, quyền lợi của người tham gia bảo hiểm y tế (BHYT) mặc dù được đánh giá khá toàn diện so với mức đóng, tuy nhiên chưa đủ để đáp ứng nhu cầu ngày càng cao và đa dạng của toàn bộ người dân.
Ảnh minh hoạ.
Tạo môi trường pháp lý thuận lợi để phát triển giáo dục nghề nghiệp
(Ngày Nay) - Bộ Giáo dục và Đào tạo đang dự thảo Nghị định quy định chi tiết một số điều của Luật Giáo dục nghề nghiệp nhằm hướng dẫn các quy định mới của Luật Giáo dục nghề nghiệp, kiến tạo môi trường pháp lý thuận lợi để phát triển giáo dục nghề nghiệp, đáp ứng nhu cầu của người học, thị trường lao động.
Hoạt động nghiên cứu khoa học tại trường Trường Đại học Khoa học và Công nghệ Hà Nội (USTH). Ảnh: VGP.
Đầu tư khoa học cơ bản đúng hướng, hiệu quả được đo đếm rõ ràng
(Ngày Nay) - Sau hơn 5 năm triển khai, Chương trình 562 về phát triển khoa học cơ bản đã ghi dấu bằng những kết quả cụ thể: Số lượng và chất lượng công bố quốc tế tăng đều, nhiều nhóm nghiên cứu mạnh được hình thành, vị thế khoa học Việt Nam tiếp tục được củng cố trên bản đồ khu vực và thế giới.