Trí tuệ nhân tạo: Cảnh báo những hành vi đáng lo ngại từ AI

0:00 / 0:00
0:00
(Ngày Nay) - Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN

Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại: hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này.

Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng. Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Tổng thống Vladimir Putin.
Ông Putin: Nga không tìm cách tái gia nhập G7
(Ngày Nay) - Tổng thống Vladimir Putin nói Nga không có kế hoạch quay lại Nhóm 7 nước công nghiệp phát triển (G7), đồng thời cho rằng tầm quan trọng của nhóm này tiếp tục suy giảm.
Ảnh minh hoạ.
Nhật Bản cấm cấy phôi thai đã qua chỉnh sửa gene
(Ngày Nay) - Ngày 4/12, một hội đồng chuyên gia của Chính phủ Nhật Bản cho biết nước này sẽ xây dựng quy định pháp lý cấm tuyệt đối việc cấy phôi thai đã chỉnh sửa gene vào cơ thể người hoặc động vật có vú, đồng thời áp dụng chế tài xử phạt đối với các vi phạm. Đây được xem là bước đi nhằm lấp khoảng trống pháp lý hiện nay và ngăn chặn việc tạo ra trẻ sơ sinh đã chỉnh sửa gene.
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
(Ngày Nay) - Nvidia đã công bố dữ liệu mới nhất cho thấy máy chủ trí tuệ nhân tạo (AI) mới của hãng có khả năng nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với thế hệ máy chủ trước đó.
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
(Ngày Nay) -“Thị trường BĐS bị các đối tượng đầu cơ thao túng, đẩy giá, chính sách nhà ở xã hội bị trục lợi, giá nhà đất liên tục leo thang, vượt xa tầm với của người dân có nhu cầu ở thực dẫn tới tình trạng nhà, đất chủ yếu rơi vào tay giới đầu cơ và trục lợi chính sách”, là những vấn đề trăn trở được các chuyên gia BĐS và hoạch định chính sách bàn luận tại Diễn đàn “Xây dựng thị trường BĐS lành mạnh, bền vững – năm 2025” của Đài PTTH Hà Nội, nhằm tìm ra giải pháp chấn chỉnh, khắc phục.