Những tài liệu học thuật như luận án, luận văn, khóa luận tốt nghiệp luôn cần yêu cầu cao về chất lượng nội dung và khắt khe trong việc đạo văn. Hệ thống Kiểm tra tài liệu được phát triển với mục tiêu kiểm tra mức độ sao chép trùng lặp được tải lên. Dưới đây là những đặc điểm nổi bật của phần mềm kiemtratailieu.vn so với các phần mềm kiểm tra đạo văn DoIT, phần mềm Turnitin.
Phần mềm kiểm tra sao chép luận án, luận văn, khóa luận tiếng Việt
Phần mềm kiểm tra sao chép tài liệu (kiemtratailieu.vn) đã được phát triển và liên tục cải tiến trong hơn 5 năm qua. Để kiểm tra trùng lặp nội dung văn bản chúng ta chỉ cần thao tác 3 bước đơn giản:
Bước 1: Đăng ký tài khoản miễn phí dùng thử tại đây
Bước 2: Tải tài liệu luận án, luận văn, văn bản khoa học cần kiểm tra
Lựa chọn tài liệu cần kiểm tra sao chép. Hệ thống hỗ trợ tải lên các định dạng phổ biến như file PDF, DOC, DOCX. Thông thường thời gian hoàn thành kiểm tra sao chép của văn bản 50-70 trang sẽ cần khoảng 2-4 phút.
Bước 3: Truy cập xem kết quả phân tích và tải báo cáo
Kết quả sau khi phần mềm kiemtratailieu.vn kiểm tra có 3 phần chính. Phía bên trái là ảnh thu nhỏ các trang tài liệu. Vùng màu (vàng, cam, đỏ) sẽ biểu thị phần nội dung trùng lặp với nguồn dữ liệu khác. Phần giữa là nội dung văn bản hiển thị chi tiết: đoạn văn sao chép, nguồn sao chép và mức độ trùng lặp. Vùng bên phải là tổng hợp các đoạn sao chép theo thứ tự trang văn bản và điểm % mức độ tương đồng mà hệ thống đã tính toán.
Ngoài ra chúng ta có thể tải file báo cáo tổng quan về mức độ trùng lặp tài liệu.
Nguồn dữ liệu kiểm tra đồ sộ và cập nhật liên tục
Phần mềm kiểm tra sao chép có hiệu quả hay không, phụ thuộc vào 2 yếu tố chính. Một là nguồn dữ liệu phong phú, đầy đủ và được cập nhật. Thứ hai là thuật toán tìm kiếm, kiểm tra trùng lặp nội dung. Nguồn dữ liệu kiểm tra của hệ thống chống đạo văn kiemtratailieu.vn gồm 2 phần:
- Dữ liệu học thuật trên Internet
Hệ thống thu thập dữ liệu học thuật của kiemtratailieu.vn hoạt động tương tự cơ chế của máy tìm kiếm Googlebot và CocCocbot. Hệ thống này sẽ liên tục tìm kiếm các nội dung học thuật, tài liệu sách, tài liệu sáng kiến kinh nghiệm, giáo trình đại học, các tạp chí nghiên cứu từ nhiều website. Một số nguồn dữ liệu có thể kể đến của hệ thống như: các tạp chí springer, google scholar, tạp chí khoa học trên VCGate, các website thư viện của các trường đại học, các trang chia sẻ tài liệu 123doc, tailieu.vn, v.v
- Dữ liệu học thuật từ các đơn vị liên kết
Có nhiều nội dung học thuật không được xuất bản rộng rãi trên Internet, hệ thống kiemtratailieu có bổ sung nguồn tài liệu (luận án, luận văn, báo cao nghiên cứu khoa học) từ các trường đại học, tạp chí nghiên cứu, học viện ở Việt Nam. Đây cũng chính là đặc điểm nổi trội của phần mềm kiểm tra đạo văn so với phần mềm Turnitin và DoIT.
Thuật toán kiểm tra đạo văn thông minh đặc biệt tốt cho nội dung tiếng Việt
Bên cạnh nguồn dữ liệu kiểm tra đạo văn phong phú, thuật toán chính là linh hồn của hệ thống kiemtratailieu. Nội dung tiếng Việt có những đặc điểm rất khác so với ngôn ngữ tiếng Anh khiến cho thuật toán xử lý kiểm tra sao chép sẽ khác nhau. Ví dụ tiếng Việt mỗi từ sẽ được cấu tạo từ nhiều tiếng VD: “đạo hàm”. Nếu áp dụng phương pháp kiểm tra trùng lặp tiếng Anh chỉ tính sao chép từng “tiếng” thì sẽ làm sai điểm đánh giá. Điều này làm cho nhiều luận án hoàn toàn không sao chép nhưng khi quét trên hệ thống nước ngoài (VD Turnitin, iThenticate) có thể bị báo trùng lặp. Ngoài ra tiếng Việt cũng có đặc trưng về từ đồng nghĩa, câu đảo ngữ, v.v. Hệ thống kiemtratailieu.vn có thuật toán đánh giá “công bằng” với từng trường hợp trùng lặp để đánh giá mức độ sao chép.
Ví dụ trường hợp:
Câu gốc: “Phân tích và phát hiện mã độc là một việc quan trọng để phòng chống sự bùng nổ phần mềm độc hại, qua đó góp phần đảm bảo an toàn của Internet.”
Câu hệ thống kiemtratailieu đánh dấu là trùng lặp mức độ cao:
“Để đảm bảo an toàn của Internet thì việc phân tích và phát hiện mã độc là một việc quan trọng để phòng chống sự bùng nổ phần mềm độc hại.”
Câu hệ thống đánh giá là trùng lặp ít (không đạo văn):
“Phân tích và phát hiện mã độc kịp thời và nhanh chóng là cách để môi trường hoạt động trên Internet được an toàn.”
So sánh phần mềm kiểm tra đạo văn kiemtratailieu.vn với phần mềm Turnitin, DoIT
Trên thị trường có nhiều phần mềm kiểm tra sao chép luận án, luận văn, sáng kiến kinh nghiệm có thể kể đến là phần mềm Turnitin, phần kiểm hỗ trợ nâng cao chất lượng văn bản DoIT. Dưới đây là bảng so sánh giữa phần mềm KiemTraTaiLieu.VN với phần mềm Turnitin và phần mềm DoIT
Tiêu chí | Turnitin | DoIT | KiemTraTaiLieu.vn |
Tốc độ kiểm tra | Chưa xác định | Thấp 8-20 phút | Cao 1-5 phút |
Nguồn dữ liệu | Phong phú, đa ngôn ngữ nhưng hạn chế tiếng Việt | Chỉ hỗ trợ tiếng Việt, hạn chế về số lượng và độ đa dạng | Dữ liệu tiếng Việt phong phú, đa dạng + Dữ liệu học thuật tiếng Anh |
Tính chính xác khi đánh giá sao chép tiếng Việt | Thấp, một vài từ trùng nhau vẫn quy là trùng lặp | Cao | Cao |
Chi phí | Không bán lẻ | Không bán lẻ | Rẻ nhất, gói tối thiểu chỉ từ 100.000đ |
Kiểm tra trùng lặp trong nhóm tài liệu | Không | Không | Có hỗ trợ |
Bảo mật dữ liệu | Tài liệu tải lên bị đưa ngay vào kho dữ liệu tìm kiếm của Turnitin | Cam kết bảo mật dữ liệu người dùng | Cam kết bảo mật dữ liệu người dùng |
Trên đây là những đặc điểm nổi bật của kiemtratailieu.vn và đánh giá so sánh chi tiết của hệ thống so với các phần mềm kiểm tra đạo văn khác trên thị trường. Hiện nay hệ thống kiemtratailieu.vn đang miễn phí dùng thử (có giới hạn số lượng) tại đây. Các bạn có nhu cầu nâng cấp tài khoản để sử dụng đầy đủ tính năng có thể xem bảng giá và liên hệ trên fanpage của hệ thống: https://www.facebook.com/kiemtratailieu