Khả năng AI phân tích tài liệu khoa học

0:00 / 0:00
0:00
(Ngày Nay) - Khi còn là nghiên cứu sinh ngành thần kinh học, Sam Rodriques đã nhận ra một giới hạn cơ bản của khoa học. Ngay cả khi các nhà nghiên cứu đã tạo ra đủ thông tin để hiểu về tế bào hay bộ não con người, "chúng ta có thể vẫn chưa nhận ra điều đó", anh nói, "bởi không ai có khả năng đọc và hiểu hết tất cả tài liệu để có cái nhìn toàn diện."
Khả năng AI phân tích tài liệu khoa học

Năm năm sau, Rodriques cho biết anh đã tiến gần hơn đến việc giải quyết vấn đề này nhờ trí tuệ nhân tạo (AI). Vào tháng 9/2023, nhóm của anh tại công ty khởi nghiệp FutureHouse (Mỹ) đã công bố một hệ thống AI có thể tổng hợp kiến thức khoa học chính xác hơn cả Wikipedia chỉ trong vài phút. Nhóm đã nhanh chóng tạo ra các bài viết kiểu Wikipedia về khoảng 17.000 gen của người, trong đó đa số trước đây chưa có trang chi tiết.

Công cụ tìm kiếm thông minh

Các công cụ tìm kiếm khoa học được hỗ trợ AI như Consensus và Elicit đang ngày càng phổ biến. Chúng hoạt động bằng cách chuyển đổi câu hỏi của người dùng thành tìm kiếm tự động trên các cơ sở dữ liệu học thuật như Semantic Scholar và PubMed, sau đó trả về kết quả phù hợp nhất.

Mô hình ngôn ngữ lớn (LLM) sẽ tóm tắt từng nghiên cứu và tổng hợp chúng thành câu trả lời có trích dẫn nguồn; người dùng có nhiều tùy chọn để lọc công trình họ muốn đưa vào. "Chúng trước hết là công cụ tìm kiếm," Aaron Tay, người đứng đầu dịch vụ dữ liệu tại Đại học Quản lý Singapore nhận định.

Tuy nhiên, các chuyên gia cũng cảnh báo rằng việc yêu cầu ChatGPT hay các chatbot AI viết tổng quan tài liệu học thuật là một ý tưởng ngây thơ và thiếu khôn ngoan.

"Những mô hình này có thể dựa vào cả nghiên cứu có uy tín lẫn các blog thiếu chính xác mà không có sự phân biệt về chất lượng", Iain Marshall từ Đại học King's College London nhận định.

Một cách tiếp cận tiên tiến hơn là tải trước một bộ tài liệu đã được chọn lọc vào LLM và yêu cầu nó phân tích. Phương pháp này giúp giảm thiểu việc "ảo tưởng" - tạo ra thông tin sai lệch, dù vẫn không thể ngăn chặn hoàn toàn.

Thách thức trong tổng hợp có hệ thống

Các đánh giá tổng quan có hệ thống (systematic review) - tiêu chuẩn vàng trong tổng hợp nghiên cứu - là thách thức lớn nhất. Quy trình này đòi hỏi tối thiểu 25 bước kỹ lưỡng, từ tìm kiếm tài liệu đến sàng lọc, trích xuất dữ liệu và đánh giá độ tin cậy.

Giáo sư Paul Glasziou, chuyên gia về đánh giá có hệ thống tại Đại học Bond (Úc) cho rằng: "Chúng ta chắc chắn sẽ đạt được việc tự động hóa hoàn toàn quy trình này. Tôi chỉ không chắc liệu phải mất 10 năm hay 100 năm."

Rủi ro tiềm ẩn

Tự động hóa việc tổng hợp thông tin cũng tiềm ẩn rủi ro. Các nhà nghiên cứu đã biết từ nhiều năm nay rằng nhiều bài tổng quan có hệ thống bị trùng lặp hoặc chất lượng kém, và AI có thể làm trầm trọng thêm những vấn đề này.

GS Glasziou nhìn nhận tình hình như một cán cân hai lực: công cụ AI có thể giúp các nhà khoa học tạo ra những bài tổng quan chất lượng cao, nhưng cũng có thể thúc đẩy việc tạo ra những bài kém chất lượng một cách nhanh chóng. "Tôi không biết tác động thực sự đến các tài liệu được công bố sẽ như thế nào", ông nói.

Một số chuyên gia cho rằng khả năng tổng hợp và hiểu biết tri thức của thế giới không nên chỉ nằm trong tay các công ty vì lợi nhuận thiếu minh bạch. Justin Clark, người phát triển công cụ tự động hóa tổng quan, muốn thấy các tổ chức phi lợi nhuận xây dựng và kiểm tra kỹ lưỡng các công cụ AI. "Chúng tôi chỉ muốn thận trọng và cẩn thận", Clark nói. "Chúng tôi muốn đảm bảo rằng những câu trả lời mà công nghệ giúp cung cấp là chính xác".

Tổng thống Vladimir Putin.
Ông Putin: Nga không tìm cách tái gia nhập G7
(Ngày Nay) - Tổng thống Vladimir Putin nói Nga không có kế hoạch quay lại Nhóm 7 nước công nghiệp phát triển (G7), đồng thời cho rằng tầm quan trọng của nhóm này tiếp tục suy giảm.
Ảnh minh hoạ.
Nhật Bản cấm cấy phôi thai đã qua chỉnh sửa gene
(Ngày Nay) - Ngày 4/12, một hội đồng chuyên gia của Chính phủ Nhật Bản cho biết nước này sẽ xây dựng quy định pháp lý cấm tuyệt đối việc cấy phôi thai đã chỉnh sửa gene vào cơ thể người hoặc động vật có vú, đồng thời áp dụng chế tài xử phạt đối với các vi phạm. Đây được xem là bước đi nhằm lấp khoảng trống pháp lý hiện nay và ngăn chặn việc tạo ra trẻ sơ sinh đã chỉnh sửa gene.
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
(Ngày Nay) - Nvidia đã công bố dữ liệu mới nhất cho thấy máy chủ trí tuệ nhân tạo (AI) mới của hãng có khả năng nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với thế hệ máy chủ trước đó.
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
(Ngày Nay) -“Thị trường BĐS bị các đối tượng đầu cơ thao túng, đẩy giá, chính sách nhà ở xã hội bị trục lợi, giá nhà đất liên tục leo thang, vượt xa tầm với của người dân có nhu cầu ở thực dẫn tới tình trạng nhà, đất chủ yếu rơi vào tay giới đầu cơ và trục lợi chính sách”, là những vấn đề trăn trở được các chuyên gia BĐS và hoạch định chính sách bàn luận tại Diễn đàn “Xây dựng thị trường BĐS lành mạnh, bền vững – năm 2025” của Đài PTTH Hà Nội, nhằm tìm ra giải pháp chấn chỉnh, khắc phục.