LUẬN VĂN THẠC SỸ
ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG HỆ HỖ TRỢ CHẨN ĐOÁN Y KHOA
HV TỐNG ĐỨC PHONG - HDKH TS. NGUYỄN THANH HIÊN
Ngành y tế và giáo dục luôn là vấn đề sống còn của bất kỳ quốc gia nào trên thế giới. Trong những năm gần đây, chính phủ Việt Nam đặc biệt đầu tư cho hai ngành mũi nhọn này thông qua các chính sách, nguồn vốn dành cho trang bị hạ tầng và nghiên cứu khoa học. Trong lĩnh vực nghiên cứu khoa học, càng ngày càng có nhiều công trình khoa học về y tế. Tuy nhiên các nghiên cứu khoa học về ứng dụng công nghệ thông tin để giải quyết các bài toán về y tế là không nhiều. Do đặc điểm về vị trí địa lý của Việt Nam là một nước nhiệt đới nên có rất nhiều loại bệnh liên quan đến sốt siêu vi trong đó sốt xuất huyết là bệnh rất nguy hiểm đồng thời chưa có vaccine chủng ngừa và chưa có thuốc đặc trị, vì vậy đề tài nghiên cứu các qui luật chẩn đoán bệnh sốt xuất huyết tại Việt Nam bằng kỹ thuật khai phá dữ liệu. Dựa vào các triệu chứng lâm sàng và cận lâm sàng có thể phân lớp bệnh của bệnh nhân nhằm giúp các bác sĩ chẩn đoán và điệu trị tốt hơn cho bệnh nhân.
Mục lục
Danh mục chữ viết tắt
Danh mục hình
Danh mục bảng
Danh mục công thức
Chương 1. TỔNG QUAN ĐỀ TÀI
Đặt vấn đề
Cơ sở hình thành đề tài
Một số kết quả nghiên cứu trong và ngoài nước
Kết quả nghiên cứu trên thế giới
Kết quả nghiên cứu trong nước
Mục tiêu luận văn
Đối tượng và phương pháp nghiên cứu
Ý nghĩa của đề tài
Ý nghĩa khoa học
Ý nghĩa thực tiễn
Bố cục luận văn
Chương 2. CƠ SỞ LÝ THUYẾT
Tổng quan về kỹ thuật Khai phá dữ liệu (Data mining)
Khái niệm về khai phá dữ liệu
Các giai đoạn của quá trình khai phá dữ liệu
Tổng quan về hệ hỗ trợ ra quyết định
Bài toán Phân lớp trong Khai phá dữ liệu
Khái niệm về phân lớp
Quá trình phân lớp dữ liệu
Phân lớp dữ liệu bằng cây quyết định
Đánh giá hiệu quả phân lớp
Thuật toán C4.5 xây dựng cây quyết định
Cơ sở dữ liệu Y khoa
Sơ lược bệnh Sốt xuất huyết
Diễn biến lâm sàng bệnh sốt xuất huyết dengue
Chẩn đoán
Chương 3. XÂY DỰNG HỆ HỖ TRỢ CHẨN ĐOÁN Y KHOA
Cơ sở dữ liệu xây dựng mô hình
Kho chứa dữ liệu bệnh án điện tử
Tiền xử lý dữ liệu
Phân tích dữ liệu bệnh án điện tử
Các qui luật chẩn đoán
Bệnh án mẫu
Chẩn đoán
Xây dựng ứng dụng
Giới thiệu chương trình
Cách thức vận hành chương trình
Chương 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ
Thử nghiệm
Thử nghiệm tập dữ liệu với ít thuộc tính:
Thử nghiệm với tập dữ liệu đầy đủ thuộc tính
Đánh giá
Chương 5. TỔNG KẾT
Kết luận
Hạn chế của đề tài
Hướng phát triển
TÀI LIỆU THAM KHẢO
PHỤ LỤC 1
PHỤ LỤC 2
Danh mục chữ viết tắt
KPDL (Data mining): Khai phá dữ liệu
DSS (Decision support system): Hệ hỗ trợ ra quyết định
CNTT: Công nghệ thông tin
IT (Information technology): Công nghệ thông tin
CSDL: Cơ sở dữ liệu
SXH: Sốt xuất huyết
HCT (Hematocrit): Dung tích hồng cầu
PLT (plaquette): Tiểu cầu
WBC (White blood cell): Bạch cầu
BS: Bác sĩ
BMI (Body mass index): Chỉ số khối của cơ thể
WHO (World Health Organization): Tổ chức Y tế Thế giới
BVBNĐ: Bệnh viện bệnh Nhiệt Đới
ĐHYKPNT: Đại học Y khoa Phạm Ngọc Thạch
Danh mục hình
Hình 2.3: Bước phân lớp
Hình 2.4: Mô hình cây quyết định trong phân lớp dữ liệu về thời tiết
Hình 3.1: Mô hình xây dựng giải pháp hỗ trợ chẩn đoán bệnh
Hình 3.2: Tập dữ liệu thu thập được
Hình 3.3: Tập dữ liệu huấn luyện đưa vào hệ thống
Hình 3.4: NS1 được chọn vì có độ đo tốt nhất
Hình 3.5: Màn hình khởi động chương trình
Hình 3.6: Màn hình chọn file dữ liệu
Hình 3.7: Màn hình chọn dữ liệu từ kho dữ liệu
Hình 3.8: Màn hình chọn bảng dữ liệu
Hình 3.9: Màn hình chọn thuộc tính
Hình 3.10: Màn hình tạo cây quyêt định
Hình 3.1: Màn hình tạo cây quyết định
Hình 3.12: Màn hình lấy cây đã lưu dạng xml
Hình 3.13: Màn hình thống kê tập luật của tập dữ liệu
Hình 3.14: Màn hình thống kê 10 luật
Hình 3.15: Mô hình kiểm tra kết quả
Hình 3.16: Màn hình kiểm tra kết quả
Hình 3.17: Kết quả kiểm tra 30% dữ liệu
Hình 3.18: Màn hình lấy file dữ liệu kiểm tra
Hình 3.19: Màn hình lấy dữ liệu từ file kiểm tra
Hình 3.20: Màn hình kết quả kiểm tra từ file Excel
HÌnh 3.21: Màn hình kiểm tra chéo (Cross validation)
Hình 3.22: Màn hình kết quả kiểm tra chéo (Cross validation)
Hình 3.23: Màn hình chẩn đoán bệnh
Hình 3.24: Kết quả chẩn đoán từ cây có sẵn
Hình 4.1: Hình vẽ SXH Dengue có dấu hiệu cảnh báo
Hình 4.2: Hình vẽ SXH Dengue
Hình 4.3: Hình vẽ SXH Dengue nặng
Danh mục bảng
Bảng 2.1: Bảng dữ liệu về thời tiết
Bảng 2.2: Ví dụ về thời tiết trong 3 ngày
Bảng 2.3: Kết quả phân lớp dữ liệu cho bảng 2.
Bảng 2.4: Huấn luyện với thuộc tính phân lớp là buys computer
Bảng 3.1: Bảng phân loại thể trạng cơ thể theo chỉ số BMI
Bảng 3.2: Bảng kiểu dữ liệu của các thuộc tính
Bảng 4.1: Bảng danh sách Bác sĩ đánh giá chương trình
Danh mục công thức
Công thức (2.1): Tính chỉ số thông tin (Information)
Công thức (2.2): Tính chỉ số thông tin mong muốn (Entropy)
Công thức (2.3): Tính độ lợi thông tin (Information Gain)
Công thức (2.4): Thông tin tiềm năng (potential information)
Công thức (2.5): Tính tỉ lệ độ lợi thông tin (Gain ratio)
Công thức (3.1): Tính chỉ số sức khỏe
Tài liệu tiếng Việt
[2] Nguyễn Thanh Thủy, Hệ thống trợ giúp và kiểm tra đơn thuốc chữa bệnh tăng huyết áp ES-TENSION, Tạp chí tin học và điều khiển học, Viện Công nghệ thông tin, 12 (3), (1996), 10-18.
[3]
Đỗ Văn Thành, Một cách tiếp cận ra quyết định trong chẩn đoán lâm sàng,
Tạp chí Tin học và điền khiển học, Viện công nghệ , 16 (1), (2000),
52-58
[4] Nguyễn Đức Cường, “Slide bài giảng môn học BI & DM: Bussiness Intellegent and Data Mining”, 2011-2012
[5] Tạ Văn Bình. Những nguyên lý nền tảng đái tháo đường – tăng glucose máu. NXS Y học, Hà Nội 2007
Tài liệu tiếng Anh
[6]
Buchanan B. G. (1984), Shortliffe E. H, Rule Based Expert Systems: The
MYCIN Experiments of the Stanford Heuristic Programming Project,
Addison-Wesley, pp. 209-232.
[7] Aikins J. S., Kunz J. C., Shortliffc E. H., and Fallat K. J. (1983), “PUFF: An Expert System for Interpretation of Pulmonary Function Data”, Comput Biomed 16, pp. 199-208.
[8] Fred A., Filipe J., Partinen M., Paiva T. (2000), "PSG-Expert: An Expert System for the Diagnosis of Sleep Disorders", IOS Press 78, pp. 127-147.65
[9]
Ngah U. K., Aziz S. A. (2007), "A BI-RADS Based Expert Systems for the
Diagnoses of Breast Diseases", American Journal of. Applied Sciences 4
(11), pp. 867-875.33 [10] Naser S. S. A, Akkila A. N. (2008), “A Proposed Expert System for Skin Diseases Diagnosis”, Journal of Applied Sciences Research 4 (12): Pp. 1682-1693.
[11] J. Han and Micheline Kamber. Data Mining: Concepts and Techniques, 3rd Edition. Morgan Kaufmann Publishers, 2011.
[12] T. Mitchell, Machine Learning and Data Mining, Communications of the ACM, Vol. 42 (1999), No. 11, pp. 30-36. S
[13] Manuel Mora Autonomous, Guisseppi A. Forgionne, JatinderN. D. Gupta. “Decision Making Support Systems: Achievements, Trends and Challenges for the New Decade”, pp. 1-5, (2003)
[14] John Shafer, Rakesh Agrawal, Manish Mehta. “Sprint – A Scalable Classifier for Data mining” in Predeeings of the 22nd International Conference on very large database, India 1996.
[15] J. Ross Quinlan. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993
[16] Ming Li “Data mining. Chepter 10: Predictive Modeling”, Department of Computer Science and Technology Nanjing University, 2011 Tài liệu Internet
Keywords:dai hoc truong dai hoc hong bang 2014,luan van thac sy,ung dung khai pha du lieu xay dung he ho tro chan doan y khoa,tong duc phong,ts nguyen thanh hien
=======
Nhận xét
Đăng nhận xét