Home
Giới thiệu
Tài khoản
Đăng nhập
Quên mật khẩu
Đổi mật khẩu
Đăng ký tạo tài khoản
Liệt kê
Công trình khoa học
Bài báo trong nước
Bài báo quốc tế
Sách và giáo trình
Thống kê
Công trình khoa học
Bài báo khoa học
Sách và giáo trình
Giáo sư
Phó giáo sư
Tiến sĩ
Thạc sĩ
Lĩnh vực nghiên cứu
Tìm kiếm
Cá nhân
Nội dung
Góp ý
Hiệu chỉnh lý lịch
Thông tin chung
English
Đề tài NC khoa học
Bài báo, báo cáo khoa học
Hướng dẫn Sau đại học
Sách và giáo trình
Các học phần và môn giảng dạy
Giải thưởng khoa học, Phát minh, sáng chế
Khen thưởng
Thông tin khác
Tài liệu tham khảo
Hiệu chỉnh
Số người truy cập: 106,842,354
Áp dụng học máy dựa trên lập trình di truyền trong tìm kiếm Web xuyên ngữ
Tác giả hoặc Nhóm tác giả:
Lâm Tùng Giang*; Võ Trung Hùng; Huỳnh Công Pháp
Nơi đăng:
Tạp chí Khoa học Công nghệ ĐHĐN;
S
ố:
Số 1(98).2016;
Từ->đến trang
: 98;
Năm:
2016
Lĩnh vực:
Xã hội nhân văn;
Loại:
Bài báo khoa học;
Thể loại:
Trong nước
TÓM TẮT
Hầu hết các nghiên cứu trong lĩnh vực truy vấn thông tin xuyên ngữ giới hạn xem xét các tài liệu văn bản và chú trọng xử lý vấn đề dịch thuật. Trong bài báo này, chúng tôi đề xuất áp dụng học xếp hạng dựa trên kỹ thuật lập trình di truyền nhằm tăng hiệu quả của hệ thống tìm kiếm web xuyên ngữ.Cụ thể, chúng tôi đề xuất 2 phương pháp xây dựng các hàm xếp hạng mới dưới dạng tổ hợp tuyến tính của các hàm xếp hạng cơ sở. Đồng thời, chúng tôi cũng đề xuất 2 mô hình xếp hạng lân cận, ứng dụng trong truy vấn xuyên ngữ. Trong thí nghiệm với một hệ thống tìm kiếm web xuyên ngữ Việt-Anh, điểm số MAP trung bình sử dụng phương pháp kiểm định 5-thư mục của các mô hình đề xuất là 0,4640 và 0,4585, vượt trội so với điểm MAP 0,3742 của cấu hình cơ sở - sử dụng bản dịch thủ công.
ABSTRACT
Most studies in the field of Cross-Language Information Retrieval consider the documents as plain texts and mainly focus on translation problems. In this article, we follow the learning to rank approach based on Genetic Programming to improve ranking performance of a cross-language web search system. We also introduce 2 proximity models, applied in cross-language information retrieval. We propose linear combinations of weak rankers for re-ranking the retrieved documents. In our experiment with a Vietnamese-English cross-language web search system, the performance measured by the MAP score and reported by a 5-fold cross validation of proposed models is 0.4640 and 0.4585. These results outperform the MAP score of 0.3742 given by the baseline configuration, using the manual translation.
© Đại học Đà Nẵng
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn