Trong
đề tài này, chúng tôi đã nghiên cứu để xây dựng một hệ thống có khả năng phát
hiện và chỉ ra mức độ giống nhau giữa một tài liệu cần phải đánh giá (thẩm
định) so với các tài liệu khác đã được lưu trữ trong kho dữ liệu cho trước.
Việc xây dựng một hệ thống như thế này sẽ giúp phát hiện việc sao chép những
đoạn/câu văn (sao chép nguyên văn) hay sao chép ý tưởng (dựa trên đánh giá mức
độ tương tự) của các tài liệu đã có. Mặt khác, hệ thống này sẽ góp phần răn đe,
ngăn chặn việc sao chép vì nguy cơ bị phát hiện là rất lớn. 1) Phần
mềm phát hiện sao chép trên các tài liệu khoa học/học tập tại ĐHĐN. Phần mềm
này bao gồm hệ thống kho dữ liệu chứa gần 1000 tài liệu là các đồ án tốt nghiệp
đại học, luận văn tốt nghiệp cao học, báo cáo đề tài nghiên cứu khoa học và các
bài báo khoa học; chương trình cho phép cập nhật/xử lý dữ liệu đầu vào; chương
trình cho phép phát hiện sao chép.
2) Sách
chuyên khảo với tiêu đề “Một số phương pháp và mô hình áp dụng trong xử lý ngôn
ngữ tự nhiên”. Sách được xuất bản bởi Nhà xuất bản Thông tin và Truyền thông,
số ISBN: 987-604-80-2414-7, theo Quyết định số 163/QĐ-NXB TTTT ngày 14 tháng 6
năm 2017. Nội dung cuốn sách được tổ chức thành 6 chương với 259 trang (không
kể các nội dung phụ).
3) Nhóm
tác giả cũng đã công bố 5 bài báo khoa học trên tạp chí/kỷ yếu hội nghị khoa
học quốc gia và quốc tế.
4) Trong
quá trình thực hiện đề tài, 1 nghiên cứu sinh và 2 học viên cao học của ĐHĐN đã
tham gia và có những đóng góp quan trọng. Thông qua việc tham gia đề tài, các
nghiên cứu/học viên cao học đã tích luỹ được nhiều kiến thức và kinh nghiệm bổ
ích trong lĩnh vực xử lý ngôn ngữ tự nhiên.
|