Luận án: Phương pháp phục vụ xếp hạng trang Web tìm kiếm xuyên ngữ Lưu VIP

Luận án: Phương pháp phục vụ xếp hạng trang Web tìm kiếm xuyên ngữ

Danh mục: , Người đăng: Minh Tính 2 Nhà xuất bản: Tác giả: Ngôn ngữ: Tiếng Việt, Tiếng Anh Định dạng: , Lượt xem: 23 lượt Lượt tải: 0 lượt
Tài liệu, tư liệu này được chúng tôi sưu tầm từ nhiều nguồn và được chia sẻ với mục đích tham khảo, các bạn đọc nghiên cứu và muốn trích lục lại nội dung xin hãy liên hệ Tác giả, bản quyền và nội dung tài liệu thuộc về Tác Giả & Cơ sở Giáo dục, Xin cảm ơn !

Nội dung

ĐÓNG GÓP MỚI CỦA LUẬN ÁN

Tên đề tài: “Một số phương pháp phục vụ xếp hạng trang Web trong tìm kiếm xuyên ngữ”

Chuyên ngành: Khoa học Máy tính

Mã số: 62.48.01.01

Họ và tên NCS: Lâm Tùng Giang

Khóa: 22

Người hướng dẫn khoa học:

1. PGS.TS. Võ Trung Hùng Pháp

2. PGS.TS. Huỳnh Công

Cơ sở đào tạo: Đại học Đà Nẵng

NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN

Tìm kiếm web xuyên ngữ đặt ra nhiệm vụ từ nhu cầu thông tin của người dùng được trình bày ở một ngôn ngữ (ngôn ngữ nguồn) thực hiện việc xác định các trang web phù hợp được viết bằng một ngôn ngữ khác (ngôn ngữ đích). Xếp hạng trong tìm kiếm Web xuyên ngữ liên quan đến việc tạo lập kết quả khi thực hiện một câu truy vấn ở dạng một danh sách các tài liệu theo thứ tự phù hợp với nhu cầu truy vấn, đảm bảo các tài liệu phù hợp nhu cầu truy vấn đứng đầu danh sách kết quả, tạo điều kiện truy cập thuận lợi cho người sử dụng.

Nhằm thực hiện việc xếp hạng trong truy vấn thông tin nói chung và trong bài toán tìm kiếm Web xuyên ngữ nói riêng, cần giải quyết hai nhiệm vụ trọng tâm: Thứ nhất là nhiệm vụ dịch thuật, nhằm biểu diễn câu truy vấn và các tài liệu trong một không gian chung, cụ thể là trong cùng một ngôn ngữ. Thứ hai là nhiệm vụ xếp hạng, thông qua việc triển khai các giải pháp kỹ thuật, các thước đo nhằm đánh giá, so sánh mức độ phù hợp giữa các tài liệu và câu truy vấn.

Một số hạn chế của các giải pháp hiện tại bao gồm chất lượng dịch thuật thấp và sự lệ thuộc vào cặp ngôn ngữ. Với các hệ thống tìm kiếm liên quan tiếng Việt, các vấn đề về xử lý ngôn ngữ cũng như dịch thuật đã khiến hiệu quả xếp hạng kết quả tìm kiếm còn rất hạn chế. Bên cạnh đó, một hệ thống tìm kiếm Web cần có thiết kế riêng biệt so với một hệ thống truy vấn thông tin văn bản truyền thống nhằm khai thác cấu trúc đặc thù của các tài liệu HTML phục vụ quá trình xếp hạng. Từ các hạn chế đã nêu, phát sinh nhu cầu nghiên cứu nâng cao chất lượng dịch thuật cũng như nhu cầu nghiên cứu tăng hiệu quả xếp hạng thông qua việc khai thác đặc thù của các tài liệu HTML.

Với các nội dung nghiên cứu đã thực hiện, luận án đã có một số đóng góp:

1. Đề xuất được các phương pháp khử nhập nhằng mới trong mô-đun dịch câu truy vấn. Trên nền tảng của khái niệm Mutual Information về sự cùng xuất hiện của các thuật ngữ trong văn bản, tác giả đã giới thiệu hàm Summary Mutual Information phục vụ việc chọn bản dịch tốt nhất cho mỗi từ khóa truy vấn và thuật toán SQ chọn bản dịch một cách tuần tự nhằm xác định danh sách các bản dịch tốt nhất được xếp theo thứ tự cho mỗi từ khóa truy vấn;

2. Đề xuất được phương pháp hiệu quả phục vụ tiền xử lý câu truy vấn tại ngôn ngữ nguồn nhằm phân tích câu truy vấn thành các từ khóa chuẩn bị cho việc dịch câu truy vấn; đề xuất các phương pháp phục vụ xây dựng, cải tiến câu truy vấn tại ngôn ngữ đích bằng cách thay đổi trọng số từ khóa câu truy vẫn và mở rộng câu truy vấn;

3. Đề xuất được các mô hình lân cận xuyên ngữ. Các mô hình lân cận xuyên ngữ cho phép định nghĩa các hàm xếp hạng mới cho máy tìm kiếm và được sử dụng kết hợp với các hàm xếp hạng truyền thống trong quá trình xếp hạng lại;

4. Đề xuất được phương pháp học xếp hạng dựa trên lập trình di truyền, xây dựng hàm xếp hạng kết quả tìm kiếm dưới dạng tổ hợp tuyến tính của các hàm xếp hạng cơ sở, phục vụ việc xếp hạng lại kết quả tìm kiếm web;

5. Thiết kế một mô hình tìm kiếm web xuyên ngữ cho cặp ngôn ngữ Việt-Anh, tích hợp các đề xuất kỹ thuật đã nêu. Mô hình phục vụ việc so sánh với các giải pháp kỹ thuật đã có cũng như đánh giá việc kết hợp các kỹ thuật trong các thành phần của hệ thống.

Việc giải quyết bài toán có ý nghĩa thực tế. Kết quả của luận án có thể được sử dụng cho việc xây dựng các ứng dụng tìm kiếm web xuyên ngữ, cho phép người sử dụng truy cập các nguồn tài nguyên thông tin ở các ngôn ngữ khác nhau.

Tóm lại, đề tài “Một số phương pháp xếp hạng trang Web trong tìm kiếm đa ngữ” của luận án rất thiết thực, đóng góp cả về lý thuyết trong lĩnh vực truy ván thông tin cũng như trong thực hành, phục vụ xây dựng các hệ thống tra cứu thông tin đa ngữ.

Từ khóa:

Tải tài liệu

1.

Luận án: Phương pháp phục vụ xếp hạng trang Web tìm kiếm xuyên ngữ

.zip

Có thể bạn quan tâm