Thông tin chung

  English

  Đề tài NC khoa học
  Bài báo, báo cáo khoa học
  Hướng dẫn Sau đại học
  Sách và giáo trình
  Các học phần và môn giảng dạy
  Giải thưởng khoa học, Phát minh, sáng chế
  Khen thưởng
  Thông tin khác

  Tài liệu tham khảo

  Hiệu chỉnh

 
Số người truy cập: 106,830,231

 A Narrative Method for Evaluating Documents Similarity based on Unique Strings
Tác giả hoặc Nhóm tác giả: Phan Hieu Ho, Trung Hung Vo, Ngoc Anh Thi Nguyen, Ha Huy Cuong Nguyen
Nơi đăng: International Journal of Recent Technology and Engineering (IJRTE); Số: Vol 8;Từ->đến trang: 473-479;Năm: 2019
Lĩnh vực: Công nghệ thông tin; Loại: Bài báo khoa học; Thể loại: Quốc tế
TÓM TẮT
ABSTRACT
A precision and efficiency model of the similarity computing of texts plays an important key of duplicate documents detection. In this paper, we focus on presenting and evaluating documents similarity based on a new method viaen coding text into unique strings, called Deoxyribo Nucleic Acid (DNA) sequences. Additionally, the proposed method including an algorithm for marking as well as coloring similar paragraphs in the test document compared to other documents available in the data warehouse and developing a system for copy detection are investigated. Experimental results show that this novel approach is highly accurate for areal dataset taken from PAN. The results corroborate the advantages of the novel approach with average of 99%accuracyfor the text similarity detection with a selection threshold of ε=10-12.The results of this study are applied to implement a practical system for evaluating documents similarity at the University of Danang, Vietnam.
© Đại học Đà Nẵng
 
 
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn