
Trong những năm gần đây, sự phát triển nhanh chóng của các mô hình ngôn ngữ như ChatGPT đã thúc đẩy nhu cầu sử dụng các công cụ “phát hiện viết bởi AI” (AI detectors). Một số cơ sở giáo dục và doanh nghiệp đã cân nhắc triển khai các công cụ này để kiểm soát gian lận hoặc đảm bảo tính minh bạch. Tuy nhiên, bằng chứng học thuật và thực tiễn triển khai cho thấy việc dựa vào các công cụ này để nghi ngờ hay xử phạt là không đáng tin cậy. Có ba nguyên nhân chính.
1. Độ chính xác thấp và thiếu ổn định
Các nghiên cứu độc lập chỉ ra rằng hầu hết các công cụ phát hiện AI đều mắc lỗi phân loại. Văn bản do con người viết thường bị gắn nhãn là do AI tạo ra, đặc biệt nếu sử dụng các cấu trúc câu phổ biến hoặc ngôn ngữ đơn giản. Ngược lại, nhiều văn bản thực sự do AI sinh ra lại vượt qua được các bộ phát hiện.
Ví dụ, một bài luận học thuật với cách diễn đạt trực tiếp như “Kinh tế thị trường vận hành dựa trên cung và cầu” dễ bị gắn nhãn “AI viết” vì đó là cấu trúc thường gặp trong dữ liệu huấn luyện của mô hình. Trong khi đó, một đoạn văn AI tạo ra nhưng được chỉnh sửa nhẹ nhàng có thể dễ dàng vượt qua kiểm tra.
Một nghiên cứu của Cooperman & Brandão (2024) cho thấy tỷ lệ phát hiện chính xác của các công cụ chỉ trên 60%, trong khi tỷ lệ “tố sai” gần 25%. Nếu so sánh với hệ thống tư pháp, việc có một phần tư phán quyết sai sẽ khiến xã hội khó vận hành ổn định.
2. Thuật toán “hộp đen” và thiếu minh bạch
Cơ chế vận hành của các công cụ phát hiện AI phần lớn dựa trên các chỉ số thống kê ngôn ngữ như perplexity (độ khó dự đoán) hoặc burstiness (độ đa dạng câu chữ). Tuy nhiên, các thuật toán này hoạt động như một “hộp đen” – ngay cả nhà phát triển cũng khó giải thích tại sao một văn bản bị gắn nhãn.
Điều này đi ngược lại nguyên tắc cơ bản của bằng chứng học thuật: mọi cáo buộc phải có cơ sở minh chứng rõ ràng và có thể kiểm chứng. Việc dựa trên “linh cảm thống kê” thay vì bằng chứng nguồn gốc cụ thể là không phù hợp.
3. Khác biệt bản chất với phát hiện đạo văn
Phát hiện đạo văn dựa trên so sánh văn bản với nguồn có thật đã công bố. Nếu một đoạn trùng khớp cao với văn bản gốc mà không được trích dẫn, đó là bằng chứng rõ ràng của hành vi đạo văn.
Ngược lại, phát hiện văn bản do AI tạo ra không có “bản gốc” để đối chiếu. Công cụ phải dựa vào phong cách, cấu trúc hoặc độ phổ biến của từ ngữ. Điều này dẫn đến những nghịch lý: một tác giả có phong cách viết giản dị, quen dùng các mẫu câu phổ biến, lại dễ bị gắn nhãn “AI viết”.
Minh chứng thực tế từ các trường đại học
- MIT (Mỹ): Trong hướng dẫn chính thức, MIT khẳng định “các phần mềm phát hiện AI không hề hoàn hảo, tỷ lệ lỗi cao và có thể khiến giáo viên buộc tội sai sinh viên” (Edwards, 2023; Fowler, 2023).
- Đại học Vanderbilt (Mỹ): Năm 2023, trường này vô hiệu hóa tính năng phát hiện AI của Turnitin sau khi nhận thấy hàng trăm bài luận sinh viên có nguy cơ bị đánh dấu sai.
Gần đây, một vụ kiện tại Đại học Yale đã thu hút sự chú ý rộng rãi: một sinh viên bị đình chỉ học vì cáo buộc dùng AI trong bài thi cuối kỳ, dựa trên bằng chứng từ công cụ dò AI. Sinh viên này đã kiện ngược lại nhà trường với cáo buộc quy trình kỷ luật “sai lệch và phân biệt đối xử”, đòi khoản bồi thường lớn.
Hệ quả xã hội và cảnh báo
Sự nhầm lẫn phổ biến giữa phát hiện đạo văn và phát hiện AI viết tạo ra nguy cơ lạm dụng các công cụ này như một hình thức “đấu tố”. Trong nhiều trường hợp, chính những người viết giỏi nhưng theo lối văn phong mạch lạc, dễ đọc, lại dễ trở thành nạn nhân vì văn bản “quá giống AI”.
Ví dụ minh họa:
- Câu “Tôi đang uống một hủ sữa” có xác suất cao, dễ bị gắn nhãn là AI viết.
- Câu “Tôi đang uống một hủ gà” ít phổ biến hơn, có thể “thoát” khỏi nghi ngờ.
- Câu “Tôi muốn uống một hủ mèo ” gần như vô nghĩa, lại càng khó bị gắn nhãn.
Điều này cho thấy công cụ không dựa trên hiểu biết nội dung, mà chỉ là dự đoán thống kê.
Ở thời điểm hiện tại, các công cụ phát hiện văn bản do AI tạo ra chưa đủ chính xác và minh bạch để sử dụng như bằng chứng học thuật hoặc pháp lý. Việc áp dụng thiếu thận trọng có thể dẫn đến rủi ro lớn về uy tín, pháp lý và công bằng cho người học.
Xã hội cần nâng cao hiểu biết căn bản về cách AI hoạt động, thay vì nhầm lẫn giữa phát hiện đạo văn với phát hiện AI viết. Khi chưa có bằng chứng khoa học đáng tin cậy, việc sử dụng công cụ phát hiện AI làm căn cứ xử phạt là không phù hợp và tiềm ẩn nhiều hệ quả nghiêm trọng.

