Trí tuệ nhân tạo: Cảnh báo những hành vi đáng lo ngại từ AI

0:00 / 0:00
0:00
(Ngày Nay) - Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN

Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại: hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này.

Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng. Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Tiếp tục sáng tạo, thực hiện cam kết của Thành phố Sáng tạo UNESCO
Tiếp tục sáng tạo, thực hiện cam kết của Thành phố Sáng tạo UNESCO
(Ngày Nay) - Tối 31/1 tại phường Xuân Hương- Đà Lạt (Lâm Đồng), Không gian Sáng tạo Phố Bên Đồi (Công ty TNHH Nghệ thuật Số Bảy) ra mắt Dự án âm nhạc Phố Bên Đồi (Phố Bên Đồi Music Project) và khai mạc chương trình biểu diễn âm nhạc cộng đồng. Đây là hoạt động thực hiện các cam kết quốc tế khi Đà Lạt (cũ) khi gia nhập Mạng lưới Thành phố Sáng tạo UNESCO (UCCN) ở lĩnh vực Âm nhạc vào năm 2023.
Thủ tướng Phạm Minh Chính: Xem xét cả 3 phương thức công tư với Dự án đường sắt tốc độ cao trên trục Bắc – Nam
Thủ tướng Phạm Minh Chính: Xem xét cả 3 phương thức công tư với Dự án đường sắt tốc độ cao trên trục Bắc – Nam
(Ngày Nay) - Chiều 31/1, tại Trụ sở Chính phủ, Thủ tướng Phạm Minh Chính, Trưởng ban Chỉ đạo các công trình trọng điểm, dự án quan trọng quốc gia lĩnh vực đường sắt chủ trì phiên họp thứ 6 của Ban Chỉ đạo; trực tuyến với 18 tỉnh, thành phố có các dự án đường sắt đi qua.
Cận cảnh phòng học “5 sao” tại trường liên cấp chuẩn quốc tế đầu tiên vùng biên giới Điện Biên
Cận cảnh phòng học “5 sao” tại trường liên cấp chuẩn quốc tế đầu tiên vùng biên giới Điện Biên
(Ngày Nay) - Bên cạnh các môn văn hóa cơ bản, học sinh vùng biên giới Si Pa Phìn (Điện Biên) sẽ được tiếp cận chương trình giáo dục toàn diện Đức – Trí – Thể – Mỹ…tại ngôi trường khang trang chuẩn 5 sao khánh thành ngày 31/1/2026. Ngôi trường được xây dựng thần tốc trong hơn 5 tháng bởi liên danh Tập đoàn Sun Group và Công ty Thương mại và Xây dựng số 6.
Ảnh minh hoạ.
TP HCM: Rà soát dữ liệu học sinh phục vụ tuyển sinh đầu cấp trực tuyến
(Ngày Nay) - Triển khai công tác tuyển sinh các lớp đầu cấp theo hình thức trực tuyến tại Thành phố Hồ Chí Minh, từ ngày 3/2-3/3, phụ huynh có con chuẩn bị vào lớp 1 và lớp 6 truy cập hệ thống tuyển sinh đầu cấp tại địa chỉ https://tuyensinhdaucap.hcm.edu.vn để kiểm tra và xác nhận thông tin học sinh.
Tổng Bí thư Tô Lâm trao Quyết định của Bộ Chính trị cho các đồng chí Lê Minh Trí (bên trái) và Đoàn Minh Huấn (bên phải). Ảnh: Thống Nhất/TTXVN.
Bộ Chính trị quyết định phân công, bổ nhiệm cán bộ
(Ngày Nay) - Tổng Bí thư Tô Lâm trao Quyết định của Bộ Chính trị phân công, bổ nhiệm ông Lê Minh Trí giữ chức Trưởng Ban Nội chính Trung ương và ông Đoàn Minh Huấn giữ chức Giám đốc Học viện Chính trị Quốc gia Hồ Chí Minh.
Học sinh TP Hồ Chí Minh trong một buổi tư vấn hướng nghiệp.
Chuyển đổi giáo dục nghề nghiệp đáp ứng nhu cầu nhân lực TP HCM
(Ngày Nay) - TP Hồ Chí Minh đặt mục tiêu đến cuối năm 2026 nâng tỷ lệ lao động trình độ cao đẳng, đại học và tăng mạnh người học các ngành khoa học, kỹ thuật, công nghệ. Điều này đặt ra yêu cầu cấp thiết phải tái cấu trúc hệ thống giáo dục nghề nghiệp, gắn đào tạo với chuyển đổi số, kinh tế tri thức và nhu cầu thực tế của thị trường lao động.