Home
Giới thiệu
Tài khoản
Đăng nhập
Quên mật khẩu
Đổi mật khẩu
Đăng ký tạo tài khoản
Liệt kê
Công trình khoa học
Bài báo trong nước
Bài báo quốc tế
Sách và giáo trình
Thống kê
Công trình khoa học
Bài báo khoa học
Sách và giáo trình
Giáo sư
Phó giáo sư
Tiến sĩ
Thạc sĩ
Lĩnh vực nghiên cứu
Tìm kiếm
Cá nhân
Nội dung
Góp ý
Hiệu chỉnh lý lịch
Thông tin chung
English
Đề tài NC khoa học
Bài báo, báo cáo khoa học
Hướng dẫn Sau đại học
Sách và giáo trình
Các học phần và môn giảng dạy
Giải thưởng khoa học, Phát minh, sáng chế
Khen thưởng
Thông tin khác
Tài liệu tham khảo
Hiệu chỉnh
Số người truy cập: 107,636,329
Tăng tốc cho khai thác tập hữu ích cao bằng việc tránh khai thác lại các tập hữu ích cao phổ biến
Tác giả hoặc Nhóm tác giả:
Nông Thị Hoa, Nguyễn Đức Hiển
Nơi đăng:
Kỷ yếu Hội thảo Khoa học Quốc gia về Công nghệ Thông tin và ứng dụng trong các lĩnh vực - Lần thứ 12 - 2023;
S
ố:
978-604-80-8083-9;
Từ->đến trang
: 110-119;
Năm:
2023
Lĩnh vực:
Công nghệ thông tin;
Loại:
Bài báo khoa học;
Thể loại:
Trong nước
TÓM TẮT
Khai thác tập hữu ích cao là tìm ra tập mặt hàng thường được bán cùng nhau và có lãi lớn hơn hoặc bằng một ngưỡng cho trước từ các cơ sở dữ liệu giao dịch về mua hàng. Các tập hữu ích cao thu được gồm các tập hữu ích cao xuất hiện nhiều lần. Tri thức về các tập hữu ích cao phổ biến này đã được biết và quen thuộc. Vì vậy, các thuật toán không cần khai thác lại các tập mục này. Các nghiên cứu trước đây chưa tránh khai thác lại các tập mục hữu ích cao phổ biến nên vẫn tốn thời gian tính toán và bộ nhớ lưu trữ. Trong bài báo này, chúng tôi đưa ra một thuật toán khai tập hữu ích cao mà tránh sinh ra các tập hữu ích cao phổ biến đã biết. Một danh sách nhỏ gọn để lưu trữ các tập mục sinh ra trong quá trình khai thác được trình bày. Thuật toán khai thác tập hữu ích cao gồm các bước sau: Đầu tiên, dùng một phần cơ sở dữ liệu để tìm các mục vừa phổ biến vừa có lãi cao. Tiếp theo, sinh ra các tập mục trong mỗi giao dịch mà mỗi tập mục chứa tối đa một mục vừa phổ biến vừa có lãi cao. Các tập mục được sinh ra được tính lãi và lưu vào một danh sách chung. Sau khi duyệt xong cơ sở dữ liệu, kiểm tra lãi của từng tập mục trong danh sách chung để đưa ra các tập hữu ích cao. Các thực nghiệm được làm trên các tập dữ liệu chuẩn. Thuật toán đề xuất được so sánh với các thuật toán chuẩn. Kết quả thực nghiệm cho thấy thuật toán đề xuất cho kết quả tốt hơn các thuật toán được so sánh khi cân đối thời gian tính toán và bộ nhớ lưu trữ. Đặc biệt, thuật toán mới giảm đáng kể dung lượng bộ nhớ.
ABSTRACT
© Đại học Đà Nẵng
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn