Trí tuệ nhân tạo: Cảnh báo những hành vi đáng lo ngại từ AI

0:00 / 0:00
0:00
(Ngày Nay) - Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN

Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại: hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này.

Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng. Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Học giả Trung Quốc: Hoạt động của Quốc hội Việt Nam cởi mở, minh bạch và hiệu quả
Học giả Trung Quốc: Hoạt động của Quốc hội Việt Nam cởi mở, minh bạch và hiệu quả
(Ngày Nay) - Cuộc bầu cử đại biểu Quốc hội khóa XVI và Hội đồng nhân dân (HĐND) các cấp nhiệm kỳ 2026-2031, được tổ chức trong bối cảnh Đại hội đại biểu toàn quốc lần thứ XIV (Đại hội XIV) của Đảng Cộng sản Việt Nam vừa diễn ra thành công tốt đẹp, nhằm thực hiện các mục tiêu phát triển trong tương lai do Đại hội XIV đề ra. Điều này bao gồm việc lồng ghép các mục tiêu đó vào các kế hoạch 5 năm và cả các chương trình phát triển kinh tế - xã hội dài hạn.
MIK Group khởi công dự án hơn 5 ha tại Bắc Ninh
MIK Group khởi công dự án hơn 5 ha tại Bắc Ninh
(Ngày Nay) - Ngày 14/3/2026, MIK Group tổ chức Lễ khởi công Dự án Khu dân cư kết hợp Thương mại Dịch vụ và Nhà ở cao tầng II-HH11 thuộc phân khu số 2, thành phố Bắc Giang tại phường Tân Tiến (Bắc Ninh). Đây là lần đầu tiên Tập đoàn hiện diện tại thị trường Bắc Ninh, đánh dấu bước tiến mới trong chiến lược mở rộng hệ sinh thái bất động sản tại khu vực công nghiệp giáp Đông Bắc Thủ đô.
Thủ tướng Chính phủ Phạm Minh Chính tiếp Đại sứ Thái Lan tại Việt Nam
Thủ tướng Chính phủ Phạm Minh Chính tiếp Đại sứ Thái Lan tại Việt Nam
(Ngày Nay) - Chiều 13/3, tại Trụ sở Chính phủ, Thủ tướng Chính phủ Phạm Minh Chính đã tiếp Bà Urawadee Sriphiromaya, Đại sứ Vương quốc Thái Lan tại Việt Nam trao đổi về các biện pháp thúc đẩy quan hệ Đối tác Chiến lược toàn diện Việt Nam - Thái Lan cũng như hợp tác nhằm bảo đảm an ninh năng lượng hai nước.
Thái Lan củng cố vị thế là trung tâm dịch vụ lưu trú, ăn uống và giải trí hàng đầu châu Á
Thái Lan củng cố vị thế là trung tâm dịch vụ lưu trú, ăn uống và giải trí hàng đầu châu Á
(Ngày Nay) - Từ ngày 11-13/3 , triển lãm thương mại toàn diện nhất châu Á dành cho ngành khách sạn, dịch vụ ăn uống và nhà hàng, THAIFEX-HORECASIA 2026, đã diễn ra tại Trung tâm tổ chức sự kiện IMPACT Muang Thong Thani, Thái Lan, thu hút hút hơn 20.000 lượt khách tham quan thương mại, người mua và chuyên gia kinh doanh từ khắp thế giới, đồng thời tạo ra giá trị thương mại hơn 3,5 tỷ baht (khoảng 110 triệu USD).
Ảnh minh họa
Đảm bảo thông tin liên lạc phục vụ bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp
(Ngày Nay) - Để chủ động ứng phó với không khí lạnh, mưa dông, gió mạnh trên biển và các tình huống thiên tai có thể xảy ra trong thời gian diễn ra bầu cử, ngày 13/3, Bộ Khoa học và Công nghệ có văn bản yêu cầu các doanh nghiệp viễn thông thực hiện nghiêm chế độ trực lãnh đạo, trực ban chỉ huy phòng thủ dân sự và trực ứng cứu thông tin 24/24; theo dõi chặt chẽ diễn biến thời tiết, thiên tai, chủ động các biện pháp ứng phó nhằm đảm bảo thông tin liên lạc thông suốt.