KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHÍNH QUY
Ngành: Công nghệ Thông tin
PHÁT HIỆN KẾ THỪA VĂN BẢN TIẾNG VIỆT DỰA TRÊN TỪ VỰNG VÀ TỪ ĐIỂN ĐỒNG NGHĨA
(RECOGNIZING VIETNAMESE TEXTUAL ENTAILMENT BASED ON LEXICAL AND SYNONYM DICTIONARY)
Sinh Viên: Hà Thị Oanh
Cán bộ hướng dẫn: PGS. TS Hà Quang Thụy - ThS Phạm Quang Nhật Minh
Mục lục
MỞ ĐẦU
Chương 1: Giới thiệu chung
1.1. Động lực và mục tiêu nghiên cứu
1.2. Khái niệm kế thừa văn bản
1.3. Bài toán phát hiện kế thừa văn bản
1.4. Mối quan hệ giữa dịch máy và kế thừa văn bản
1.5. Dãy hội nghị RTE
1.6. Bộ dữ liệu trong hội nghị RTE và ứng dụng của phát hiện kế thừa văn bản
1.7. Tóm tắt chương
Chương 2: Một số hướng tiếp cận giải quyết bài toán
2.1. Một số hướng tiếp cận giải quyết bài toán
2.2. Hướng tiếp cận dựa trên từ vựng
2.2.1. Một số công trình nghiên cứu liên quan
2.3. Hướng tiếp cận dựa trên tri thức
2.4. Kết luận
Chương 3: Mô hình phát hiện kế thừa văn bản tiếng Việt
3.1. Cơ sở lý thuyết
3.1.1. Thuật toán độ tương đồng từ vựng
3.1.2. Ngưỡng phán quyết kế thừa
3.1.3. Trọng số của từ
3.2. Độ đo độ tương đồng từ vựng (wordsim)
3.3. Tri thức miền từ điển đồng nghĩa tiếng Việt
3.4. Tinh chỉnh ngưỡng phán quyết kế thừa
3.4.1. Ngưỡng phán quyết
3.5. Phát biểu bài toán
3.6. Tóm tắt chương
Chương 4: Thực nghiệm
4.1. Môi trường thực nghiệm
4.1.1. Cấu hình phần cứng
4.1.2. Công cụ phần mềm
4.2. Dữ liệu thực nghiệm
4.3. Thử nghiệm chương trình
4.4. Đánh giá hệ thống
4.6. Đánh giá
Kết luận và định hướng nghiên cứu tiếp theo
Tài liệu tham khảo
Danh sách các từ viết tắt
Viết tắt Tiếng Anh Tiếng Việt
H Hypothesis Giả thuyết
IE Information Extraction Trích xuất thông tin
IR Information Retrieval Thu thập thông tin
MT Machine Translation Dịch máy
NLP Natural Language Processing Xử lý ngôn ngữ tự nhiên
QA Question Answering Hệ hỏi đáp
RTE Recognizing Textual Entailment Phát hiện kế thừa văn bản
SUM Summarization Tóm tắt
T Text Văn bản
TE Textual Entailment Kế thừa văn bản
CD Comparison Documents Tài liệu so sánh
RC Reading Comprehension Đọc hiểu
PP Paraphrase Acquisition Thu thập diễn giải
Danh sách bảng biểu
Bảng 1: Một số ví dụ kế thừa văn bản trong hội nghị RTE-
Bảng 2: Cấu hình phần cứng
Bảng 3: Danh sách các phần mềm sử dụng
Bảng 4. Chú thích giá trị
Bảng 5: Kết quả thí nghiệm trước và sau tinh chỉnh ngưỡng
Bảng 6: Đánh giá kết quả thực nghiệm trong các kỳ hội nghị RTE [18]
Danh sách hình vẽ
Hình 1: Tam giác dịch máy
Hình 2: Hình chữ nhật RTE
Hình 3: Một số hướng tiếp cận giải quyết bài toán
Hình 4: Mô hình giải quyết bài toán
Hình 5: Dữ liệu thực nghiệm
Hình 6: Kết quả thí nghiệm với trường hợp chưa tinh chỉnh ngưỡng
Hình 7: Kết quả thí nghiệm với trường hợp đã tinh chỉnh ngưỡng
Nhận xét
Đăng nhận xét