NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
Tên luận án: Khai phá tập mục phổ biến mờ dựa trên cấu trúc cây và kỹ thuật xử lý song song.
Ngành: Hệ thống thông tin
Mã số: 9 48 01 04
Họ và tên nghiên cứu sinh: TRẦN THỊ THÚY TRINH
Chức danh, học vị, họ và tên người hướng dẫn:
PGS. TS. Nguyễn Long Giang
TS. Trương Ngọc Châu
Cơ sở đào tạo: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Nội dung: nêu ngắn gọn những đóng góp mới về mặt học thuật, lý luận, những luận điểm mới rút ra được từ kết quả nghiên cứu, khảo sát của luận án
1- Đề xuất phương pháp xác định các tập mờ cho mỗi thuộc tính định lượng trong cơ sở dữ liệu thông qua kỹ thuật phân cụm. Cụ thể hơn, luận án trình bày kỹ thuật phân cụm EMC. Mục tiêu của các thuật toán này là chia dữ liệu thành các cụm có ý nghĩa. Sau đó, các cụm này được sử dụng để phân loại mỗi thuộc tính định lượng như một tập mờ và xác định các hàm thuộc của chúng.
2- Đề xuất phương pháp khai phá tập mục phổ biến mờ trong cơ sở dữ liệu định lượng sửdụng cấu trúc dữ liệu Node-list. Quy trình khai phá tập mục mờ phổ biến dựa trên PP_code hoặc POS_code giúp hạn chế mức tiêu thụ bộ nhớ được yêu cầu.
3- Đề xuất một phương pháp xử lý song song để khai phá các tập mờ phổ biến sử dụng phương pháp tiếp cận automata di động học (Cellular learning automata). Theo CLA, không gian được biểu diễn như một mạng, với mỗi phần tử là một ô. Từng dòng một, dữ liệu giao dịch sẽ được đọc và đồng thời được chuyển đến các ô, chúng xử lý song song với nhau. Thông qua việc sử dụng các ô dữ liệu tự trị này, việc khai phá các tập mục mờ phổ biến được thực hiện. Quá trình này rút ngắn thời gian thực thi của thuật toán.