Luận án: Nghiên cứu biểu diễn và nhận dạng đối tượng động Lưu VIP

Luận án: Nghiên cứu biểu diễn và nhận dạng đối tượng động

Danh mục: , Người đăng: Minh Tính 2 Nhà xuất bản: Tác giả: Ngôn ngữ: Tiếng Việt, Tiếng Anh Định dạng: , Lượt xem: 23 lượt Lượt tải: 0 lượt
Tài liệu, tư liệu này được chúng tôi sưu tầm từ nhiều nguồn và được chia sẻ với mục đích tham khảo, các bạn đọc nghiên cứu và muốn trích lục lại nội dung xin hãy liên hệ Tác giả, bản quyền và nội dung tài liệu thuộc về Tác Giả & Cơ sở Giáo dục, Xin cảm ơn !

Nội dung

ĐÓNG GÓP MỚI CỦA LUẬN ÁN

Tên đề tài: “Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy”

Chuyên ngành: Khoa học máy tính

Mã số: 62.48.01.01

Họ và tên NCS: Nguyễn Năng Hùng Vân

Người hướng dẫn khoa học: PGS.TS. Kanta Tachibana, TS. Phạm Minh Tuấn

Cơ sở đào tạo: Đại học Đà Nẵng

NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN

1. Đóng góp thứ nhất của luận án là đề xuất phương pháp phân cụm dữ liệu bằng cách sử dụng đại số hình học bảo giác kết hợp với mô hình Markov ẩn để huấn luyện và nhận dạng. Cụ thể là:

– Hàm mật độ xác suất của phân phối Gauss biểu diễn dữ liệu bằng cách tối ưu khoảng cách từ điểm đến vectơ trung bình và phân phối dữ liệu thường gom cụm với nhau dạng hình núi, tức là dữ liệu gần tâm được phân bố dày hơn và dữ liệu xa tâm thì phân bố thưa hơn. Nên khi dữ liệu phân bố phức tạp trong không gian như hình cong hay siêu cầu thì hàm mật độ Gauss thường biểu diễn không chính xác. Vì vậy, luận án đề xuất phương pháp kết hợp CGA với hàm mật độ Gauss để biểu diễn các đối tượng chuyển động có phân bố dữ liệu phức tạp trong không gian.

– Phương pháp phân cụm dữ liệu sử dụng thuật toán k-means để phân tách dữ liệu thành k cụm dựa vào bài toán tối ưu khoảng cách Euclidean từ điểm đến trọng tâm của cụm, tức là khoảng cách từ một điểm đến một điểm trong mặt phẳng. Luận án đề xuất phân cụm dữ liệu sử dụng đại số hình học bảo giác đề tối ưu khoảng cách từ điểm đến trọng tâm (vectơ đại diện) của cụm có thể là điểm, mặt phẳng hoặc siêu cầu trong không gian CGA. Vì vậy, trong trường hợp dữ liệu phân bố phức tạp như hình cầu hoặc hình cong thì đề xuất này biểu diễn rất chính xác.

2. Đóng góp thứ hai của luận án là đề xuất phương pháp sử dụng CGA thay thế cho PCA để xác định phương sai trong mô hình phân lớp dữ liệu sử dụng phương pháp hồi quy thành phần chính (PCR). Cụ thể là:

– Phương pháp hồi quy thành phần chính sẽ đi tìm tọa độ của từng lớp sao cho phương sai của dữ liệu khi chiếu lên hệ trục mới là nhỏ nhất, tức là PCR sẽ giải quyết bài toán tối ưu cho từng lớp bằng cách sử dụng thuật toán PCA để tìm phương sai của dữ liệu nhỏ nhất trong từng lớp. Luận án đề xuất phương pháp PCR kết hợp với đại số hình học bảo giác để giải quyết bài toán tối ưu bằng cách xác định từ điểm đến vectơ trong không gian CGA để tìm phương sai (giá trị riêng) nhỏ nhất trong từng lớp dữ liệu.

3. Đóng góp thứ ba của luận án là đề xuất phương pháp giảm chiều dữ liệu bằng cách trích chọn đặc trưng sử dụng đại số hình học bảo giác. Cụ thể là:

– Phương pháp giảm chiều dữ liệu thông thường sử dụng các thuật toán PCA và LDA để đi hệ trục tọa độ mới và xác định phương sai của đối tượng trên hệ trục này. Tuy nhiên, luận án đề xuất phương pháp trích chọn đặc trưng sử dụng đại số hình học bảo giác và xác định phương sai bằng cách tối ưu hàm khoảng cách từ một điểm đến vectơ đại diện trong không gian CGA (vectơ này có thể là điểm, đường, siêu phẳng hoặc siêu cầu). Phương pháp đề xuất này rất phù hợp cho dữ liệu phân bố phức tạp dạng hỗn hợp siêu phẳng hoặc siêu cầu trong không gian.

4. Đóng góp thứ tư của luận án là đề xuất phương pháp tiền xử lý dữ liệu đầu vào cho phương pháp trích chọn đặc trưng của đối tượng nhằm nâng cao hiệu quả trong nhận dạng hành động người. Cụ thể là:

– Khi con người di chuyển thì các khớp sẽ di chuyển theo và dữ liệu các khớp phân bố phức tạp trong không gian. Tuy nhiên, trong một số trường hợp khi con người di chuyển thì có những khớp không dịch chuyển hoặc ít dịch chuyển (dịch chuyển không đáng kể). Vì vậy, nếu lấy dữ liệu tất cả các khớp để trích chọn đặc trưng hoặc huấn luyện thì dữ liệu sẽ rất lớn, nên luận án đề xuất phương pháp tiền xửlý để chọn ra những khớp có dịch chuyển lớn. Phương pháp đề xuất này sẽ xây dựng ma trận khoảng cách giữa các cặp khớp, tiếp đến là lựa chọn các khớp bằng cách xác định phương sai của các cặp khớp nằm trong giá trị của ngưỡng sẽ được chọn.

– Hành động con người sẽ không đồng nhất với nhau như đi bộ, chạy thì hành động này sẽ dịch chuyển tịnh tiến theo một hướng. Đối với những hành động như múa hay nhảy thì chuyển động sẽ diễn ra tại một vị trí cố định. Vì vậy, luận án đề xuất phương pháp tiền xử lý để đồng bộ các hành động này lại với nhau bằng cách dịch tọa độ các khớp để các hành động diễn ra tại một vị trí.

Kết quả nghiên cứu đã mở ra một hướng mới về biểu diễn đối tượng chuyển động trong không gian dựa vào đại số hình học bảo giác và kết hợp đại số hình học bảo giác với các mô hình học máy.

Từ khóa:

Tải tài liệu

1.

Luận án: Nghiên cứu biểu diễn và nhận dạng đối tượng động

.zip

Có thể bạn quan tâm