Дмитрий Козлов / Сергей Довгаль, 3 курс, dbms-sem

На этом форуме публикуются и уточняются постановки задач студентам, а также отслеживается ход их выполнения

Модератор: staff

Закрыто
Бычков Иван
Аспирант
Сообщения: 179
Зарегистрирован: 23 сен 2008 01:19 pm

Дмитрий Козлов / Сергей Довгаль, 3 курс, dbms-sem

Сообщение Бычков Иван »

Тема работы

Исследование методов персонифицированной организации информации в электронной библиотеке.

Актуальность
При работе с любой научной тематикой формируется некоторое представление этой тематики в виде списка публикаций, ученых, научных коллективов. Это представление важно и ценно, а потому, его нужно сохранять, обеспечивая возможность повторного использования. Задача поддержки этого процесса может быть возложена на электронную библиотеку, которая должна предоставлять соответствующий инструментарий.

Цель
Проанализировать существующие методы персонифицированной организации информации и создать инструментальные средства для поддержки персонификации в рамках электронной библиотеки научных статей.

План
1. Изучение литературы по основам информационного поиска: Modern Information Retrieval, Mining the Web, Лекции Яндекс.
2. Составление обзора существующих средств персонифицированной организации информации.
3. Разработка требований и проекта инструментального средства поддержки персонификации информации.
4. Создание программной реализации.


Замечание специально для Никиты: я отнесусь с пониманием, если студент не осилит все 4 пункта плана, но до поры до времени уточнить что именно будет нужно реализовывать я не могу.

Ожидаемые результаты
1. Обзор.
2. Набор требований.
3. Проект инструментального средства.
4. Реализация.
Сергей Довгаль
Выпускник
Сообщения: 1
Зарегистрирован: 15 дек 2008 01:09 am

Сообщение Сергей Довгаль »

Отчет о курсовой работе за 5-ый семестр
Довгаль Сергей Сергеевич, группа 322
научный руководитель: Козлов Дмитрий Дмитриевич

1.Постановка задачи
Реализовать основанную на онтологиях систему, предоставляющую персонифицированный поиск по научным статьям.
Для решения этой задачи необходимо сделать следующее:
- Изучить принципы работы поисковых систем, основные понятия, подходы, алгоритмы.
- Ознакомиться с методами персонификации, выбрать наиболее подходящие
- Ознакомиться с онтологиями, существующими системами и их архитектурой.
- Разработать архитектуру системы и реализовать.

2.Обоснование актуальности
Персонификация позволяет значительно улучшить точность поиска за счет понимания намерений пользователя в запросе. Использование онтологий позволяет учитывать семантические отношения, увеличивая полноту поиска и предоставляя новые возможности.

3.Проделанная работа
- Ознакомление с областью курсовой работы. Рассмотрены устройство и функциональность нескольких поисковых систем
- Изучены статьи по персонализации поиска. В качестве наиболее подходящей модели выбрана система, в которой персонификация поиска выражена изменением ранка выдаваемых результатов и модификацией запроса; персональный профиль пользователя хранит иерархию понятий онтологии отражающую интересы; профиль заполняется как вручную, так и автоматически, используя понятия присвоенные документам, к которым пользователь проявил интерес; определение понятий характеризующих документ происходит обученным классификатором.
- Написан обзор по прочитанному

4.Направления дальнейшей работы
- Обозначить модель системы. Найти и разобраться с существуюшими решениями для реализации нижнего уровня на Python (поисковой модуль, обработчик .pdf и .ps файлов), при необходимости реализовать.
- Выбрать какая будет использоваться онтология. Окончательно определить модель системы и реализовать.
- Оценить эффективность полученной системы.

5.Литература
[1]S. Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data, 2002, 345. San Francisco. Morgan-Kaufmann Publishers.
[2]C. Lee Giles , K.D. Bollacker , S.Lawrence: CiteSeer: an automatic citation indexing system. Proceedings of the third ACM conference on Digital libraries, 1989, 23.06.89, 89-98
[3]H. Li, I.G. Councill, L.Bolelli, D. Zhou, Y. Song, A. Sivasubramaniam, C.L. Giles: CiteSeerχ: a scalable autonomous scientific digital library, Proceedings of the 1st international conference on Scalable information systems, 2006, 30.06.06, 18. Hong Kong.
[4]F. Peng, A. McCallum: Accurate Information Extraction from Research Papers using Conditional Random Fields. Proceedings of Human Language Technology Conference / North American Association for Computational Linguistics Annual Meeting, 2004, Boston.
[5]S. Gauch, A. Chandramouli, V. Challam: Contextual Search Using Ontology-Based User Profiles, Conference RIAO2007, 2007, 30.05.07, Pittsburgh PA, U.S.A.
[6]S. Gauch, M. Speretta, A. Chandramouli: A. Micarelli: User Profiles for Personalized Information Access. The Adaptive Web, Lecture Notes in Computer Science, 2007, vol. 4321, 54-89, Springer Berlin / Heidelberg.
[7]A. Micarelli, F. Gasparetti, F. Sciarrone, S. Gauch: Personalized Search on the World Wide Web. The Adaptive Web, Lecture Notes in Computer Science, 2007, vol. 4321, 195-230, Springer Berlin / Heidelberg.
[8]F. Tanudjaja, L. Mui: Persona: A Contextualized and Personalized Web Search. Proceedings of the 35th Annual Hawaii International Conference on System Sciences, 2002, 9, Big Island, Hawaii.
[9]S.E. Middleton, N.R. Shadbolt, D.C. De Roure: Capturing interest through inference and visualization: Ontological user profiling in recommender systems. International Conference on Knowledge Capture, 2003, Sanibel Island, Florida. http://portal.acm.org/citation.cfm?id=945657
[10]B. Sheth: A Learning Approach to Personalized Information Filtering. 1995, 32, ACM Press.
Закрыто