Дмитрий Козлов / Сергей Довгаль, 3 курс, dbms-sem

На этом форуме публикуются и уточняются постановки задач студентам, а также отслеживается ход их выполнения

Модератор: staff

Закрыто
Бычков Иван
Аспирант
Сообщения: 179
Зарегистрирован: 23 сен 2008 01:19 pm

Дмитрий Козлов / Сергей Довгаль, 3 курс, dbms-sem

Сообщение Бычков Иван »

Примечание: работа является продолжением темы прошлогодней дипломницы Ольги Шаминой.

Тема работы

Автоматический поиск научных статей в русскоязычном сегменте сети Интернет.

Цель работы

Целью данной работы является построение средства непрерывного автоматического поиска научный статейв сети Интернет.

Данное средство должно представлять собой автономно функционирующего агента, который в начале своей работы получает на вход набор статей или набор URL, а затем непрерывно и автономно осуществляет поиск научных статей путем обхода веб-страниц и посылки запросов к поисковым системам, загрузки статей и извлечения из них новой информации о статьях, авторах, конференциях и т.п., которая может послужить исходными данными для дальнейшего поиска.

В рамках дипломной работы О. Шаминой были созданы отдельны средства, которые позволяют
- осущестлять поиск заданной научной статьи по библиографической ссылке,
- осуществлять поиск конференций и домашних страниц авторов по заданному названию конференции, имени автора.

Данная работа призвана завершить созданные наработки для того, чтобы интегрировать их в единую систему и провести экспериментальное исследование.

План работы

1. Заставить работать все методы, разработанные Шаминой, по отдельности.
2. Доработать реализацию, чтобы она была интегрированным решением с общим пространством данных, а не набором отдельных инструментов.
3. Провести экспериментальные исследования.
4. Провести практическую апробацию.
5. Написать совместно с н.р. статью.
Закрыто