Giáo trình Các hệ thống tìm kiếm thông tin văn bản
List PriceFrom 1.000 VNĐ
- Nhà xuất bản
- Đại học Cần Thơ
- Khuôn khổ
- 16x24
- Số trang
- 136
- Năm xuất bản
- 2014
- ISBN
- 978-604-919-213-5
- Tác giả
- Ngô Bá Hùng, Trương Quốc Định, Trương Quốc Bảo
- Giới thiệu
- Đọc thử
Thời gian thuê bắt đầu được tính từ thời điểm Đơn đặt hàng Được duyệt đến hết Số ngày thuê
Chọn số ngày thuê
Những năm cuối thập niên 1990 đầu những năm 2000, các bộ máy tìm kiếm thông tin web (web search engine) đã trở nên gần gũi và là địa chỉ mọi người tìm đến khi cần tìm kiếm một thông tin nào đó nhờ vào sự phát triển không ngừng của các kỹ thuật tìm kiếm thông tin. Từ một lĩnh vực nghiên cứu đầy thách thức, tìm kiếm thông tin đã trở nên “căn bản” với hầu hết mọi người như là một phương tiện truy cập thông tin hữu ích. Để đáp lại những thách thức khác nhau của nhu cầu truy xuất thông tin, lĩnh vực tìm kiếm thông tin ra đời với mong muốn mang lại những tiếp cận tổng quát cho việc truy xuất, tìm kiếm nhiều dạng thông tin khác nhau. Bắt đầu với các xuất bản khoa học và các bản ghi tài liệu ở thư viện nhưng cũng đã rất nhanh chóng dàn trải ra các định dạng khác của thông tin, đặc biệt là các kho dữ liệu thông tin chuyên dùng của nhà báo, luật sư và bác sĩ. Với sự phát triển không ngừng của Internet và các dịch vụ có liên quan dẫn đến sự bùng nổ về khối lượng thông tin chia sẻ trên Internet, khối thông tin khổng lồ này sẽ trở nên vô nghĩa nếu con người không có cách tiếp cận và tìm thấy những xuất bản phù hợp với nhu cầu thông tin của họ. Chỉ mục một khối lượng khổng lồ thông tin hiện đang được chia sẻ trên Web để phục vụ tìm kiếm lại nó đòi hỏi phải có một kỹ thuật đặc thù, một kiến trúc phần cứng phù hợp. Để đáp ứng nhanh một nhu cầu tìm kiếm của người dùng đòi hỏi thuật toán so khớp phải có độ phức tạp vừa phải. Với một nhu cầu lớn về tìm kiếm thông tin phi cấu trúc trên Web, ngày nay, vì thế phần nhiều các nghiên cứu đã hướng đến tối ưu hóa tốc độ tìm kiếm hơn là tối ưu hóa độ chính xác của giải thuật so khớp.
Giáo trình này nhằm cung cấp cho người đọc các kiến thức tổng quan về tìm kiếm thông tin nói chung, trong đó tập trung chủ yếu vào các hệ thống tìm kiếm thông tin văn bản phi cấu trúc.
Phần đầu của giáo trình mang đến cho người đọc các khái niệm cơ bản nhất liên quan đến lĩnh vực tìm kiếm thông tin, và quan trọng hơn cả là các thành phần chính của một bộ máy tìm kiếm thông tin văn bản. Các kiến thức được đề cập trong phần này bao gồm kiến trúc cơ bản của một hệ thống tìm kiếm thông tin, các phép đo đánh giá hiệu năng của một bộ máy tìm kiếm thông tin, các tài liệu văn bản được biểu diễn và chỉ mục như thế nào, các kỹ thuật chỉ mục cho phép tối ưu hóa chi phí lưu trữ, các phương pháp đo độ tương thích giữa truy vấn và tài liệu.
Phần tiếp theo của giáo trình trình bày các kỹ thuật cho phép tăng hiệu năng của một hệ thống tìm kiếm như áp dụng kỹ thuật phân tích giá trị đơn để giảm hạng các vec-tơ chỉ mục tài liệu, kỹ thuật phản hồi tương đồng hay mở rộng câu truy vấn để tăng độ bao phủ của kết quả tìm kiếm, các phương pháp cho phép sửa lỗi chính tả xuất hiện trong câu truy vấn. Giáo trình cũng dành một chương để bàn đến các thách thức của việc xây dựng một bộ máy tìm kiếm thông tin web trong đó đặc biệt chú trọng đến kỹ thuật lập chỉ mục phân tán và cách tính độ tương đồng tài liệu – truy vấn.
Nội dung của giáo trình được giảng dạy cho học viên cao học chuyên ngành Hệ thống thông tin với thời lượng 45 tiết lý thuyết. Bên cạnh đó giáo trình cũng có thể là sách tham khảo cho sinh viên, học viên cao học chuyên ngành Khoa học máy tính, các độc giả bước đầu tìm hiểu về lĩnh vực tìm kiếm thông tin, đặc biệt là tìm kiếm thông tin văn bản.
Do thời gian có hạn, giáo trình không thể tránh khỏi những thiếu sót ngoài ý muốn, nhóm tác giả rất mong nhận được những đóng góp chân thành từ quý độc giả để giáo trình được hoàn thiện hơn.