Khi AI biết kiểm chứng sự thật: Bước tiến mới từ Viettel AI tại NAACL 2025

0:00 / 0:00
0:00
(Ngày Nay) - Tại NAACL 2025 , một trong những hội nghị AI hàng đầu thế giới tổ chức tại Hoa Kỳ, Viettel AI đã giới thiệu VeGraph -phương pháp kiểm chứng thông tin giúp tăng độ chính xác lên tới 5% so với các phương pháp hiện có.
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025
VeGraph là phương pháp kiểm chứng thông tin do Viettel AI nghiên cứu, phát triển và trình bày tại hội nghị NAACL 2025

Sự bùng nổ của Internet và mạng xã hội khiến các nội dung do người dùng tự tạo ngày càng phổ biến, đồng thời kéo theo làn sóng tin giả, tin không chính thống lan rộng. Những thông tin sai lệch này không chỉ gây hoang mang cho người dân trong các lĩnh vực nhạy cảm như sức khỏe, thiên tai, chính sách công… mà còn dẫn đến hậu quả nghiêm trọng như thiệt hại kinh tế, suy giảm uy tín tổ chức và đe dọa an ninh quốc gia. Nếu trước kia, những thông tin này chỉ gây tác động đến một thời điểm và phạm vi nhất định, thì bây giờ, chúng đang trở nên ngày càng nguy hiểm khi trở thành một phần dữ liệu đầu vào cho các hệ thống trí tuệ nhân tạo (AI). Trong quá trình tìm kiếm, thu thập thông tin để phản hồi người dùng, các hệ thống như chatbot, trợ lý ảo hoàn toàn có khả năng sử dụng, tạo ra hoặc lan truyền thông tin sai lệch nếu không có khả năng tự kiểm chứng.

Kiểm chứng thông tin là quá trình xác minh tính đúng - sai của một thông tin. Ví dụ, mục tiêu của việc kiểm chứng câu nói “NASA đã tìm thấy sự sống trên sao Hỏa” là kiểm tra xem thông tin này có dựa trên sự thật được công bố hay không, thông qua các nguồn đáng tin cậy như báo chí, dữ liệu khoa học hay cơ sở tri thức. Để tự kiểm chứng được thông tin, các hệ thống AI phải có khả năng hiểu câu, tìm kiếm thông tin liên quan và kết luận một cách logic dựa trên dữ liệu khách quan.

VeGraph (Verify-in-the-Graph) là phương pháp kiểm chứng thông tin do đội ngũ kỹ sư tại Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu, phát triển và trình bày tại NAACL 2025 - một trong ba hội nghị quốc tế danh giá nhất về xử lý ngôn ngữ tự nhiên. Kết quả thử nghiệm trên hai bộ dữ liệu kiểm chứng phổ biến là HoVer và FEVEROUS cho thấy VeGraph cải thiện độ chính xác từ 2-5% so với các phương pháp hiện có.

Hầu hết các phương pháp kiểm chứng thông tin hiện nay vẫn gặp khó khi xử lý các phát ngôn mơ hồ, ẩn dụ hoặc nhiều tầng nghĩa, vốn thường được dùng để “ngụy trang” thông tin giả, đồng thời chưa thể lý giải rõ vì sao một nội dung bị đánh giá là sai, khiến người dùng khó tin tưởng kết quả. Nhiều phương pháp cũng dựa chủ yếu vào mô hình ngôn ngữ lớn (LLM) mà thiếu khả năng kiểm tra chéo với các nguồn tri thức chính thống, dẫn tới nguy cơ tạo ra kết luận sai lệch hay còn gọi là hiện tượng “ảo giác” (hallucination).

Khác với các công cụ chỉ suy luận nội bộ trong mô hình, VeGraph chủ động phân tách yêu cầu kiểm chứng thông tin thành từng mệnh đề nhỏ rồi đối chiếu với các nguồn tham khảo đáng tin cậy như văn bản pháp luật, cơ sở dữ liệu chính phủ, tài liệu chuyên ngành… Toàn bộ quá trình kiểm chứng được hệ thống hóa thành từng bước rõ ràng, giúp người dùng dễ dàng theo dõi và kiểm tra, tăng độ chính xác và minh bạch - yếu tố ngày càng quan trọng trong các ứng dụng AI. Tính năng này còn tạo điều kiện để các tổ chức nhanh chóng điều chỉnh, cải tiến hệ thống khi cần.

Hướng tới một môi trường số minh bạch và an toàn, VeGraph được đánh giá cao về tính ứng dụng thực tiễn. Ngoài khả năng tích hợp vào các hệ thống AI để tăng độ chính xác và tin cậy, công nghệ này có thể được phát triển thành hệ thống kiểm chứng thông tin trong nhiều lĩnh vực như y tế, báo chí, pháp luật hay quản lý nhà nước… Nhờ đó, người dân hoàn toàn có thể tự kiểm chứng những thông tin quan trọng, yêu cầu tính chính thống cao như tin tức thời sự, thông tin về thuốc, vắc-xin, dược phẩm, hay các quy định pháp luật...

Trong tương lai, VeGraph sẽ được mở rộng theo hướng xử lý đa dạng các định dạng dữ liệu như hình ảnh, video, âm thanh…, nhận diện các dạng ngôn ngữ phức tạp như ẩn dụ, hàm ý và kết hợp thêm các đồ thị tri thức nhằm nâng cao khả năng suy luận.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) là một diễn đàn khoa học uy tín hàng đầu thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên và ngôn ngữ học tính toán. Năm nay, hội nghị thu hút một số lượng bài nghiên cứu kỷ lục, lên đến hơn 3.000 bài, tỷ lệ chấp nhận cho các bài báo chính rất cạnh tranh (khoảng 22%), quy tụ những nghiên cứu đột phá nhất. NAACL 2025 đặc biệt tập trung vào các tiến bộ vượt bậc trong phát triển mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên đa dạng văn hóa và đa ngôn ngữ, các khả năng suy luận mới nổi và AI có trách nhiệm.

Viettel AI là đơn vị trực thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel), tiên phong làm chủ và phát triển các sản phẩm, dịch vụ thuộc lĩnh vực AI, Big Data, Robotics và Digital Twin. Hiện nay, hệ sinh thái Viettel AI bao gồm nhiều dòng sản phẩm có chất lượng dẫn đầu tại Việt Nam, được nhiều tổ chức, doanh nghiệp lớn trong nước và quốc tế tin tưởng sử dụng.

Tổng thống Vladimir Putin.
Ông Putin: Nga không tìm cách tái gia nhập G7
(Ngày Nay) - Tổng thống Vladimir Putin nói Nga không có kế hoạch quay lại Nhóm 7 nước công nghiệp phát triển (G7), đồng thời cho rằng tầm quan trọng của nhóm này tiếp tục suy giảm.
Ảnh minh hoạ.
Nhật Bản cấm cấy phôi thai đã qua chỉnh sửa gene
(Ngày Nay) - Ngày 4/12, một hội đồng chuyên gia của Chính phủ Nhật Bản cho biết nước này sẽ xây dựng quy định pháp lý cấm tuyệt đối việc cấy phôi thai đã chỉnh sửa gene vào cơ thể người hoặc động vật có vú, đồng thời áp dụng chế tài xử phạt đối với các vi phạm. Đây được xem là bước đi nhằm lấp khoảng trống pháp lý hiện nay và ngăn chặn việc tạo ra trẻ sơ sinh đã chỉnh sửa gene.
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
(Ngày Nay) - Nvidia đã công bố dữ liệu mới nhất cho thấy máy chủ trí tuệ nhân tạo (AI) mới của hãng có khả năng nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với thế hệ máy chủ trước đó.
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
(Ngày Nay) -“Thị trường BĐS bị các đối tượng đầu cơ thao túng, đẩy giá, chính sách nhà ở xã hội bị trục lợi, giá nhà đất liên tục leo thang, vượt xa tầm với của người dân có nhu cầu ở thực dẫn tới tình trạng nhà, đất chủ yếu rơi vào tay giới đầu cơ và trục lợi chính sách”, là những vấn đề trăn trở được các chuyên gia BĐS và hoạch định chính sách bàn luận tại Diễn đàn “Xây dựng thị trường BĐS lành mạnh, bền vững – năm 2025” của Đài PTTH Hà Nội, nhằm tìm ra giải pháp chấn chỉnh, khắc phục.