2010г.
Количество страниц: 528
Введение в информационный поиск — это первый учебник, в котором наряду с классическим поиском рассматриваются веб-поиск, а также классификация и кластеризация текстов. Учебник написан с точки зрения информатики и содержит современное изложение всех аспектов проектирования и реализации систем сбора, индексирования и поиска документов, методов оценки таких систем, а также введение в методы машинного обучения на базе коллекций текстов.
Несмотря на то что учебник задуман как вводный курс по информационному поиску, он будет интересен исследователям и профессионалам. Полный набор слайдов для лекций и упражнений, сопровождающих книгу, доступен в сети веб.
Предисловие авторов книги к русскому изданию
Мы рады предоставленной возможности написать краткое предисловие к русскому изданию книги Introduction to Information Retrieval. Поскольку оригинальное издание вышло в 2008 году, важность поиска по текстовым и другим неструктурированным информационным источникам к текущему моменту еще больше возросла. Этот поиск важен и как техническая задача, и как главная часть социального и делового взаимодействия людей в современном информационном мире. Прошедший период представляет собой захватывающий период широкого распространения блогов, микроблогов и социальных сетей, а также все более широкого применения инструментов, использующих методы машинного обучения и более глубокую интерпретацию текстов.
Об авторах
Кристофер Д. Маннинг (Christofer D. Manning) — профессор компьютерных наук в Станфордском университете (Stanford University).
Прабхакар Рагхаван (Prabhakar Raghavan) — директор департамента Yahoo! Research и профессор-консультант по компьютерным наукам Станфордского университета.
Хайнрих Шютце (Hinrich Schutze) — заведующий кафедрой теоретической вычислительной лингвистики Института обработки текстов на естественных языках (Университет Штутгарта).
Оглавление книги
Введение в информационный поиск. Кристофер Д. Маннинг
Предисловие
Глава 1. Булев поиск
Глава 2. Лексикон и списки словопозиций
Глава 3. Словари и нечеткий поиск
Глава 4. Построение индекса
Глава 5. Сжатие индекса
Глава 6. Ранжирование, взвешивание терминов и модель векторного пространства
Глава 7. Ранжирование в полнофункциональной поисковой системе
Глава 8. Оценка информационного поиска
Глава 9. Обратная связь по релевантности и расширение запроса
Глава 10. XML-поиск
Глава 11. Вероятностная модель информационного поиска
Глава 12. Языковые модели для информационного поиска
Глава 13. Классификация текстов и наивный байесовский подход
Глава 14. Классификация в векторном пространстве
Глава 15. Метод опорных векторов и машинное обучение на документах
Глава 16. Плоская кластеризация
Глава 17. Иерархическая кластеризация
Глава 18. Разложение матриц и латентно-семантическое индексирование
Глава 19. Основы поиска в вебе
Глава 20. Обход и индексирование веба
Глава 21. Анализ ссылок
Библиография