Nghiên cứu các giải pháp mới để giải quyết những khó khăn gặp phải trong việc xử lý tập
dữ liệu huấn luyện để nâng cao tính chính xác của các mô hình học máy trong bài toán dự
đoán lỗi phần mềm. Từ những kết quả nghiên cứu này, chúng tôi hướng đến xây dựng một
nguyên mẫu phần mềm hỗ trợ dự đoán lỗi cho các mã nguồn chương trình được xây dựng
bằng ngôn ngữ Java, nhằm hỗ trợ cho hoạt động phát triển phần mềm của các doanh nghiệp.
Ba vấn đề cơ bản cần phải giải quyết trong bài toán dự đoán lỗi phần mềm đó là: xây dựng
một tập dữ liệu huấn luyện có hiệu quả cao từ tập dữ liệu có sự không cân bằng về số lượng
mẫu của mỗi lớp nhãn; xử lý hiệu quả số lượng đặc trưng tương đối lớn của bài toán dự đoán
lỗi phần mềm; và các khó khăn trong việc xây dựng một mô hình học máy có độ chính xác
cao.
|