Trong đề tài này, chúng tôi nghiên cứu xây dựng kho dữ
liệu sẽ được sử dụng trong hệ thống phát hiện sao chép từ các nguồn tài liệu
của Đại học Đà nẵng. Kho dữ liệu này bao gồm các tài liệu gốc (luận án tiến sĩ,
luận văn tốt nghiệp thạc sĩ, báo cáo đồ án/luận văn tốt nghiệp đại học, các báo
cáo tổng kết đề tài nghiên cứu khoa học và các tài liệu khác), cơ sở dữ liệu
thông tin chung về tài liệu và dữ liệu đã được trích xuất từ các tài liệu lưu
trữ dưới định dạng XML. Chúng tôi đề xuất một cấu trúc lưu trữ và các chương
trình tương ứng để dễ dàng lưu trữ, cập nhật kho dữ liệu và xử lý các dữ liệu
trên kho. Chúng tôi đã tiến hành thử nghiệm và lưu trữ trên kho này với hơn 100
tài liệu mỗi loại cho báo cáo tốt nghiệp của sinh viên ngành công nghệ thông
tin, luận văn tốt nghiệp cao học và báo cáo tổng kết đề tài nghiên cứu.
- Hướng dẫn 2 học viên (1 học viên đã bảo vệ thành công
luận văn Thạc sĩ).
- Hướng dẫn 1 nghiên cứu sinh (đang thực hiện)
- Xây dựng được kho dữ liệu với hơn 300 báo cáo tốt
nghiệp đại học, cao học và báo cáo tổng kết đề tài nghiên cứu khoa học.
- Công
bố 1 bài báo trên Tạp chí Khoa học và Công nghệ, Đại học Đà Nẵng.
|