Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

0:00 / 0:00
0:00
(Ngày Nay) - Tại NAACL 2025 , một trong những hội nghị AI hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph -phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025

Sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến, đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh quốc gia. Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, thì bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không, thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong ba hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy VeGraph cải thiện độ chính xác từ 2-5% so với các phương pháp hiện có.

Hầu hết các phương pháp kiểm chứng thông tin hiện nay vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả, đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân hoàn toàn có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vắc-xin, dược phẩm, hay các quy định pháp luật...

Trong tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là một diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán. Năm nay, hội nghị thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Viettel AI là đơn vị trực thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel), tiên phong làm chủ và phát triển các sản phẩm, dịch vụ thuộc lĩnh vực AI, Big Data, Robotics và Digital Twin. Hiện nay, hệ sinh thái Viettel AI bao gồm nhiều dòng sản phẩm có chất lượng dẫn đầu tại Việt Nam, được nhiều tổ chức, doanh nghiệp lớn trong nước và quốc tế tin tưởng sử dụng.

"Cơn sóng" mới đối với kinh tế toàn cầu
"Cơn sóng" mới đối với kinh tế toàn cầu
(Ngày Nay) - Giá dầu thế giới tăng vọt vượt ngưỡng 100 USD/thùng trong bối cảnh căng thẳng địa chính trị tại Trung Đông leo thang, làm dấy lên những lo ngại mới về triển vọng kinh tế toàn cầu.
Chọn ngành học đại học: Rộng cửa xét tuyển nhưng cần tính đường dài
Chọn ngành học đại học: Rộng cửa xét tuyển nhưng cần tính đường dài
(Ngày Nay) - Nhiều ngành đào tạo tại các trường đại học hiện nay có cơ hội xét tuyển khá rộng với nhiều phương thức và tổ hợp môn khác nhau. Tuy nhiên, theo các chuyên gia giáo dục, việc chọn ngành không chỉ dừng ở khả năng trúng tuyển mà cần cân nhắc kỹ năng lực bản thân, yêu cầu nghề nghiệp và sự cạnh tranh của thị trường lao động trong tương lai.
Dùng máy tính nhiều làm tăng nguy cơ mắc bệnh Glôcôm gây mù lòa
Dùng máy tính nhiều làm tăng nguy cơ mắc bệnh Glôcôm gây mù lòa
(Ngày Nay) - Glôcôm hiện là nguyên nhân gây mù lòa đứng thứ hai tại Việt Nam, chỉ sau đục thủy tinh thể. Ngành y tế khuyến cáo người dân, đặc biệt là những nhóm có nguy cơ cao, cần chủ động khám mắt định kỳ để phát hiện sớm và điều trị kịp thời.
Cuba đối mặt khủng hoảng nhân đạo nghiêm trọng do thiếu nhiên liệu
Cuba đối mặt khủng hoảng nhân đạo nghiêm trọng do thiếu nhiên liệu
(Ngày Nay) - Ngày 10/3, người phát ngôn Tổng thư ký LHQ, ông Stephane Dujarric, cho biết tình trạng thiếu nhiên liệu kéo dài tại Cuba đang đẩy hệ thống y tế và mạng lưới an sinh xã hội của quốc đảo này vào tình trạng “báo động đỏ” và khiến hàng triệu người dân phải đối mặt với nguy cơ thiếu nước sạch, lương thực.