1. Trích dẫn tài liệu là gì?
Trích dẫn (tài liệu tham khảo) là chỉ rõ những thông tin về tác giả, tác phẩm, nhà xuất bản, năm xuất bản, số trang… mà người viết đề cập tới trong nội dung bài viết [1]. Các nội dung, hình ảnh, số liệu, thậm chí là ý tưởng lấy từ các nguồn đã xuất bản hoặc chưa xuất bản đều cần phải được trích dẫn. Nếu người viết sao chép toàn bộ hay một phần câu chữ, số liệu, ý tưởng… thậm chí sử dụng cấu trúc, cách lý giải của tác giả khác mà không trích dẫn nguồn tài liệu tham khảo đó thì sẽ bị coi là đạo văn.
Tài liệu tham khảo thường được trích dẫn theo hình thức trực tiếp và gián tiếp. Cụ thể, trích dẫn trực tiếp là trích nguyên văn một hoặc nhiều câu, đoạn văn, hình ảnh, bảng biểu… vào bài viết. Với hình thức này, nội dung trích dẫn trong bài viết phải đảm bảo chính xác tuyệt đối từng câu chữ, nội dung, số liệu, hình ảnh… được sử dụng trong bản gốc. Hai là trích dẫn gián tiếp được khuyến khích sử dụng trong nghiên cứu khoa học. Người viết sử dụng ý tưởng, kết quả, để triển khai nghiên cứu và diễn giải lại theo cách của mình nhưng phải đảm bảo trung thành nội dung của bản gốc, tránh làm sai lệch ý tưởng của bản gốc.
2. Tại sao hệ thống đánh dấu trùng lặp các nội dung đã được trích dẫn?
Bất kỳ phần mềm chống đạo văn nào cũng không thể đưa ra quyết định tác giả có đạo văn trong bài viết hay không mà chỉ hỗ trợ kiểm tra, đánh giá mức độ trùng lặp của nội dung bài viết đó dựa trên cơ sở dữ liệu tìm kiếm của phần mềm. Nếu nội dung bài viết tương đồng hoặc trùng lặp với một trong các nguồn của cơ sở dữ liệu tìm kiếm thì phần mềm sẽ đánh dấu nội dung đó để người dùng xem xét.
Cơ sở dữ liệu tìm kiếm bao gồm dữ liệu trên Internet của các trang tin, tạp chí, các kho chia sẻ tài liệu… và dữ liệu nội sinh của các trường đại học, học viện, đơn vị nghiên cứu. Với số lượng nguồn dữ liệu lớn, một số nội dung trong bài viết trùng lặp với nội dung nào đó trong cơ sở dữ liệu tìm kiếm là điều hết sức tự nhiên. Do đó, khi quét toàn bộ nội dung bài viết, phần mềm sẽ đưa ra tất cả điểm trùng lặp nghi vấn để người dùng có thể xác định xem kết quả trùng lặp có chấp nhận được hay không. Bên cạnh đó, máy tính hiện nay chưa đủ thông minh để phân biệt chính xác đâu là trích dẫn hay đâu là đạo văn, nên kể cả tác giả đã sử dụng dấu ngoặc kép và tham chiếu đầy đủ và chính xác trong nội dung bài viết thì vẫn sẽ có trường hợp phần mềm thông báo đó là kết quả trùng lặp.
Do đó, các hệ thống, phần mềm chống đạo văn sẽ chỉ đưa ra tất cả các nội dung trùng lặp mà hệ thống nghi vấn dựa trên phân tích dữ liệu và so sánh tương đồng dựa trên thuật toán. Phần mềm sẽ hỗ trợ công việc tốn công sức và thời gian nhất là đối chiếu từng câu, từng đoạn trong văn bản được kiểm tra với hàng triệu dữ liệu trên internet và đưa ra kết quả trùng lặp. Còn việc quyết định đạo văn hay không thì sẽ thuộc về con người. Khi đó, người dùng sẽ là người xem xét các nội dung mà hệ thống nghi ngờ đánh dấu khi vào kiểm tra và đưa ra quyết định về nội dung nghi vấn trùng lặp đó có phải đạo văn hay không. Vì vậy, kết quả đưa ra của các hệ thống là điểm trùng lặp chứ không phải điểm đạo văn.
3. Các cách xử lý
Nội dung trùng lặp là những nội dung giống hoặc gần giống với những nội dung đã có trên cơ sở dữ liệu tìm kiếm. Do đó, các nội dung trích dẫn và các nguồn trong danh mục tài liệu tham khảo thường là nội dung có nhiều kết quả trùng lặp nhất. Khi này, với các tài liệu có tỉ lệ trùng lặp cao hơn mức cho phép của đơn vị, thì đôi khi sẽ xảy ra những tranh luận về việc phần này đã trích dẫn, phần kia không phải đạo văn,.. gây mất nhiều thời gian và công sức cho các thầy cô, cán bộ phụ trách. Để xử lý các trường hợp này, phía đơn vị đào tạo có thể xử lý theo những hướng sau đây:
+ Cách 1 (phổ biến): Đơn vị đào tạo có thể đưa ra những quy định cụ thể hơn về tỉ lệ trùng lặp được cho phép. Tỉ lệ cho phép này không phải là tỉ lệ sinh viên được phép đạo văn trong tài liệu mà là tỉ lệ đã bao gồm các nội dung trích dẫn từ nguồn khác (kể cả trích dẫn đúng quy định), các trường hợp trùng tiêu đề, footnote,… Như vậy, người viết không được có bất kỳ nội dung đạo văn nào trong tài liệu và phải đảm bảo sao cho việc trích dẫn của mình vẫn đưa ra tỉ lệ trùng lặp dưới mức cho phép. Tỉ lệ này tùy thuộc vào đặc thù trích dẫn của từng chuyên ngành. Ví dụ như chuyên ngành luật sẽ để tỉ lệ này cao vì thường xuyên cần trích dẫn các điều luật, văn bản pháp luật để làm căn cứ; các ngành Công nghệ Thông tin thì có thể thấp hơn vì ít khi cần trích dẫn.
Cách này được hầu hết các trường đại học áp dụng vì nó đưa ra tiêu chí rõ ràng cho sinh viên và giảm thiểu gánh nặng cho bộ phận phụ trách kiểm tra đạo văn. Các thầy cô, cán bộ phụ trách kiểm tra khi đó sẽ chỉ cần kiểm tra điểm số mà không phải đọc lại từng câu xem đâu là trích dẫn, đâu là đạo văn. Khi đó trách nhiệm thuộc về sinh viên, học viên nhiều hơn. Họ phải tự xác định rằng mình không được phép đạo văn và phải kiểm soát việc trích dẫn của mình sao cho đảm bảo tỉ lệ trùng lặp của tài liệu ở mức cho phép mà đơn vị đào tạo đã đưa ra.
Một số ví dụ thực tế về quy định của các trường đại học về tỉ lệ này:
- Trường Đại học Trà Vinh quy định về hành vi đạo văn là trích dẫn 1 hoặc nhiều tác phẩm của người khác để hình thành tác phẩm mới có nội dung chiếm từ 30% nội dung tác phẩm được trích dẫn trở lên, mặc dù có thực hiện đúng quy định về trích dẫn nguồn [2].
- Trường Đại học Luật thành phố Hồ Chí Minh quy định về đạo văn nếu trích dẫn 1 hoặc nhiều tác phẩm của người khác để hình thành tác phẩm của mình (có dung lượng chiếm từ 50% nội dung tác phẩm trở lên), dù có thực hiện đúng quy định về trích dẫn nguồn [1].
- Trường Đại học Khoa học Xã hội và Nhân văn quy định về hành vi đạo văn là trích dẫn 1 phẩm của người khác để hình thành tác phẩm của mình có dung lượng chiếm từ 20% nội dung tác phẩm trở lên, dù có thực hiện đúng quy định về trích dẫn nguồn [3].
+ Cách 2: Người phụ trách kiểm tra trùng lặp thực hiện loại trừ thủ công trên hệ thống, rà soát kết quả trùng lặp mà hệ thống đưa ra và xem xét loại trừ kết quả nếu nội dung là hợp lệ và không phải đạo văn. Với các đơn vị sử dụng hệ thống “Kiểm tra tài liệu”, người dùng có thể thực hiện theo các bước sau:
Bước 1: Người dùng vào xem báo cáo chi tiết cho từ bài báo
Bước 2: Người dùng chọn mục Trùng lặp để kiểm tra mức độ trùng lặp theo mức độ từ trắng (không trùng lặp) => vàng (mức độ trùng lặp thấp) => cam (mức độ trùng lặp trung bình) => đỏ (mức độ trùng lặp cao).
Bước 3: Khi kiểm tra các câu trùng lặp, nếu phát hiện nội dung câu đã trích dẫn tài liệu tham khảo hoặc hệ thống phát hiện sai… dẫn đến cần phải loại bỏ kết quả trùng lặp thì người dùng chọn Loại trừ kết quả (hoặc hình thùng rác như hình).
Bước 4: Người dùng lựa chọn lý do loại trừ kết quả. Trong trường hợp chọn lý do khác, cần mô tả lý do loại trừ kết quả trùng lặp này là gì.
– Sau khi loại trừ trùng lặp, người dùng có thể chỉnh sửa/thay đổi thông tin loại trừ trùng lặp hoặc đánh dấu đây là nội dung trùng lặp.
Trên đây là các cách xử lý thường được sử dụng khi điểm trùng lặp của tài liệu cao hơn mức cho phép do trong nội dung có sử dụng trích dẫn nhiều. Tùy vào nguồn nhân lực và quy định của từng đơn vị đào tạo thì đơn vị lựa chọn hướng xử lý phù hợp với đơn vị của mình.
Tài liệu tham khảo:
[1] Trường Đại học Luật TP. Hồ Chí Minh, 03 03 2015. [Trực tuyến]. Available: http://library.hcmulaw.edu.vn.
[2] Trường đại học Trà Vinh, 25 09 2020. [Trực tuyến]. Available: https://sdh.tvu.edu.vn.
[3] Trường Đại học Khoa học Xã hội và Nhân văn, 19 01 2018. [Trực tuyến]. Available: http://www.vns.edu.vn.