Để đáp lại, sinh viên, bao gồm cả những người ban đầu không sử dụng chatbot, đang chuyển sang sử dụng các công cụ AI để đảm bảo thầy cô không phát giác ra việc sử dụng AI.
Chỉ 3 ngày trước thời hạn, Wen Suyu đang chạy đua với thời gian để sửa lại bản luận văn gần 30.000 chữ. Mặc dù tự mình viết hầu hết nội dung, nhưng cô lo ngại nó vẫn có thể bị "gắn cờ" là văn bản do AI tạo ra.
Sau 8 giờ chỉnh sửa, tỷ lệ phát hiện AI chỉ giảm nhẹ, từ 17% xuống 14%. Tuyệt vọng, Wen chuyển sang sử dụng PaperPass, một dịch vụ hứa hẹn giảm tỷ lệ phát hiện AI và trả 360 nhân dân tệ (1,2 triệu đồng).
Wen, sinh viên năm cuối tại một trường đại học ở tỉnh Quảng Đông, cho biết: “Tỷ lệ phát hiện của AI đã giảm xuống 7%, nhưng văn bản hoàn toàn không giống ngôn ngữ của con người”.
Trên khắp Trung Quốc, nhiều sinh viên đang phải vật lộn với tình thế tiến thoái lưỡng nan tương tự khi việc áp dụng nhanh chóng phần mềm AI đáp ứng các tiêu chuẩn học thuật ngày càng nghiêm ngặt.
Để duy trì tính liêm chính trong học thuật, các trường đại học Trung Quốc hiện đang sử dụng các hệ thống tiên tiến để xác định nội dung do AI tạo ra trong luận văn của sinh viên.
Động thái này bắt nguồn từ một dự thảo luật đượccập nhật vào tháng 8 năm ngoái đề xuất thu hồi bằng tốt nghiệp của những sinh viên bị phát hiện đã sử dụng AI để viết luận văn.
Kể từ đó, một số cơ sở dữ liệu học thuật đã phát triển hệ thống phát hiện AI để đáp lại mối lo ngại ngày càng tăng về gian lận trong học thuật.
Chỉ riêng trong năm nay, ít nhất 15 trường đại học đã thông báo rằng họ sẽ đánh giá tỷ lệ phần trăm nội dung do AI tạo ra trong luận án của sinh viên, trong đó một số trường yêu cầu sinh viên tiết lộ bất kỳ hành vi sử dụng AI nào.
Hầu hết đều sử dụng VIP Paper Check System (VPCS), một công cụ kiểm tra đạo văn lâu đời được sử dụng trong các trường đại học cũng đã bổ sung chức năng phát hiện nội dung AI vào năm ngoái.
VPCS tuyên bố sẽ phát hiện văn bản được tạo bởi các mô hình AI như ChatGPT, Ernie Bot của Baidu và SparkDesk của iFlytek và đưa ra tỷ lệ lạm dụng AI theo các mức nhẹ, trung bình hoặc cao.
Khi các hệ thống phát hiện trở nên phức tạp hơn và áp lực phải vượt trội hơn những công nghệ này ngày càng tăng, nhiều sinh viên đang chuyển sang các cộng đồng trực tuyến để được trợ giúp. Chỉ riêng trên ứng dụng Xiaohongshu, hơn 10.000 bài đăng chia sẻ mẹo về cách giảm “tỷ lệ phát hiện AI”, trong đó một số sinh viên báo cáo tỷ lệ phát hiện trên 60%.
Các dịch vụ nhằm giảm tỷ lệ AI, thường được cung cấp bởi các công ty viết luận văn, cũng có nhu cầu cao trên các nền tảng thương mại điện tử như Taobao.
Cụ thể, một văn bản 10.000 ký tự với tỷ lệ phát hiện AI 40% thường cần 150 nhân dân tệ để giảm xuống dưới 10% và 180 nhân dân tệ để giảm xuống dưới 5%. Trên các nền tảng mạng xã hội, cư dân mạng sử dụng cụm từ “đánh bại ma thuật bằng ma thuật” để chia sẻ các mẹo vượt qua khả năng phát hiện của AI.
Mặc dù trường đại học của Wen vẫn chưa chính thức triển khai hệ thống phát hiện nội dung AI, nhưng các cuộc thảo luận rộng rãi và sự lo lắng trên mạng xã hội khiến cô không yên tâm.
Lo sợ có thể bị kiểm tra đột xuất, nữ sinh viên nafyt đã tự mình giải quyết vấn đề, chi 40 nhân dân tệ để sử dụng VPCS và CNKI, một cơ sở dữ liệu học thuật lớn khác cung cấp dịch vụ phát hiện nội dung AI.
Khả năng phát hiện AI cho luận án của Wen đạt 17% trên VPCS, trong khi gần như 0% trên CNKI.
“Tôi nghĩ hầu hết mọi người đều sử dụng AI. Tôi sử dụng AI để đánh bóng bài viết của mình. Cấu trúc, dữ liệu, nội dung tổng thể của bài viết đều do tôi viết nhưng đôi khi tôi cảm thấy cách diễn đạt của mình chưa lý tưởng nên dùng AI để tinh chỉnh lại một chút”, Wen thừa nhận.
Các công cụ AI phổ biến ở Trung Quốc bao gồm Ernie Bot của gã khổng lồ tìm kiếm Baidu, Tongyi Qianwen của Alibaba, TianGong AI của Kunlun Tech và Kimi Chatbot của Moonshot. Với Wen, cô sử dụng kết hợp Claude, Ernie và Tongyi Qianwen.
“Claude tạo ra ngôn ngữ chính xác hơn, trong khi các mô hình trong nước hỗ trợ nghiên cứu và sử dụng cách diễn đạt phù hợp hơn với văn bản tiếng Trung”, Wen nói.
Trên ứng dụng Xiaohongshu, các bài đăng phổ biến chia sẻ các phương pháp "ngụy trang" luận văn. Ví dụ: văn bản do AI tạo ra thường có cấu trúc câu nhất quán, bỏ qua chủ đề, sử dụng các cụm từ ngắn để kết nối các câu và ưu tiên dấu hai chấm và số để liệt kê các điểm.
Cao, sinh viên năm cuối tại một trường đại học ở tỉnh Giang Tây, đã nhận được thông báo chính thức vào tháng 5 yêu cầu luận văn của cô phải dưới 20% nội dung do AI tạo ra mới được chấp thuận.
Mặc dù Cao không gặp khó khăn gì khi viết lại bài luận của mình, nhưng bài luận do bạn cùng phòng của Cao viết ra đã bị xác định có 50% nội dung do AI tạo ra trên CNKI. Với sự giúp đỡ của Cao, người bạn này đã giảm tỷ lệ phát hiện xuống gần như bằng 0 trong vòng 2 tuần.
Quá trình này đã giúp Cao khám phá ra những chiến lược hữu ích để giảm tỷ lệ bị phát giác. “Tôi nghĩ thuật toán phát hiện AI của CNKI bắt đầu từ đầu và cuối câu nên tôi sắp xếp lại ngôn ngữ để giảm tỷ lệ. Ví dụ: loại bỏ các từ như 'thứ nhất', 'thứ hai' và 'mặt khác' khỏi đầu câu sẽ có hiệu quả,” Cao chỉ ra.
Nhưng việc sửa đổi vă phong tốn nhiều thời gian và không phải lúc nào cũng mang lại kết quả đáng chú ý. Đó là lý do tại sao nhiều sinh viên chuyển sang sử dụng nhiều công cụ AI hơn để xóa dấu vết nội dung do máy tạo ra trong bài viết của họ.
Zong Chengqing, nhà nghiên cứu tại Viện Tự động hóa (Viện Khoa học Trung Quốc), cho rằng văn bản do AI tạo ra dựa trên các quy tắc toán học được tính toán bởi các mô hình lớn.
Ông giải thích, bằng cách phân tích các từ ngữ, máy có thể tạo ra văn bản trực tiếp. AI sử dụng công thức tính toán để dự đoán từ nào sẽ theo sau dựa trên ngữ cảnh và phương pháp toán học.
“Do đó, chúng tôi cũng có thể sử dụng quy tắc toán học này để xác định xem văn bản có tuân thủ một mô hình nhất định hay không, giúp chúng tôi đánh giá liệu nó được tạo ra bằng máy hay được viết bởi con người. Độ chính xác có thể đạt trên 80%”, ông Zong nói về cách phát hiện văn bản do máy tạo ra.
Tuy nhiên, kết quả phát hiện AI có thể khác nhau đáng kể trên các hệ thống khác nhau. Trên mạng xã hội, một số sinh viên nói rằng khả năng phát hiện AI trên các nền tảng khác nhau có thể khác nhau hơn 50%.
“Điều này có thể chỉ ra rằng sự phát triển của các mô hình lớn khác nhau là không đồng đều. Các mô hình lớn thường cần xác định chính xác nội dung do AI tạo ra bằng cách phân tích lượng văn bản khổng lồ. Tuy nhiên, khi làm việc với ngôn ngữ tự nhiên, khả năng suy luận, khái quát hóa và trí tưởng tượng của chúng thường kém hơn con người rất nhiều, có thể dẫn đến sai sót trong phát hiện", vị chuyên gia giải thích.
Mặc dù tin rằng các quy định hiện hành chưa thống nhất và cần cải thiện để quản lý AI tốt hơn trong giới học thuật, nhưng ông Zong vẫn ủng hộ việc giới thiệu các hệ thống phát hiện AI để nâng cao tính liêm chính trong học thuật: “Tôi nghĩ việc nghiêm khắc hơn một chút sẽ đặc biệt có lợi cho các sinh viên hiện tại".