Создание веб-интерфейса для построения генеалогических деревьев
Введение
Темой данного дипломного проекта является создание веб-сервиса для построения генеалогических деревьев, а именно разработка и реализация серверной компоненты.
Развитие современных информационных технологий и методов теории графов (см. [1]) повлекло за собой существенное продвижение в различных областях знаний, в частности, в области генеалогии (см. [2]). В результате этого началось активное развитие сервисов, пользующихся спросом как у профессионалов, так и у любителей, желающих систематизировать всю известную информацию о своих родственниках и наглядно представить эту информацию в виде генеалогического дерева.
Существует большое количество разного рода средств, предназначенных для построения генеалогических деревьев. Данные средства подразделяются на два основных вида: локальные программы и веб-сервисы. Применение локальных программ затрудняет обмен собранной информацией с другими пользователями (родственниками). В веб-сервисах эта проблема исчезает, но проявляется ряд других недостатков, таких как отсутствие импорта и экспорта данных, отсутствие системы прав доступа к деревьям пользователя, ограничения функциональности в бесплатном режиме и другие.
В этой связи становится необходимым создание бесплатного веб-сервиса для построения генеалогических деревьев с возможностью хранения и отображения различной пользовательской информации.
Целью дипломной работы является разработка и реализация ключевых компонентов системы создаваемого веб-приложения, на которых будет основана работа всего сервиса для построения генеалогических деревьев.
Стоит отметить, что данная цель является локальной относительно цели создания всего веб-приложения, а работа является частью комплексного проекта, выполняемого тремя студентами гр. 9208.
Цель дипломного проекта формирует следующий список взаимосвязанных работ:
-исследование предметной области;
-поиск и рассмотрение существующих аналогов разрабатываемого сервиса, выявление их достоинств и недостатков;
-составление общих и функциональных требований;
-исследование и выбор оптимальных средств разработки для решения поставленной задачи;
-изучение выбранных программных средств;
-разработка и реализация архитектуры системы хранения данных;
-разработка и реализация интерфейса для доступа к хранимым данным;
-разработка и реализация системы разграничения прав доступа для разных групп пользователей;
-разработка и реализация вычисления степеней родства между двумя персонами в генеалогическом дереве;
-отладка и тестирование разработанного сервиса;
-анализ и оценка полученных результатов.
Для проведения работ решено использовать: операционную систему Linux Ubuntu, систему контроля версий Git, язык программирования Python, фреймворк Django, объектно-реляционную СУБД PostgreSQL, документо-ориентированную СУБД CouchDB, скриптовый язык программирования JavaScript, инструмент управления проектами и отслеживания ошибок в программном обеспечении Trac, текстовый редактор Jedit.
1. Постановка задачи
1.1 Общее описание создаваемого сервиса
Создаваемый веб-сервис предназначается для пользователей сети интернет, интересующихся историей своего рода, собирающих сведения о своих предках, и желающих разобраться в родственных связях, а также привлечь к этому своих близких.
Функции, выполняемые сервисом в интересах пользователя:
а) построение и печать родословных деревьев;
б) импорт и экспорт данных;
в) вычисление и отображение степеней родства между двумя персонами в генеалогических деревьях;
г) хранение мультимедийных данных:
1)текст,
2)фотографии;
д) поиск и фильтрация данных;
е) статистика:
1)количество персон,
2)количество мужчин,
)количество женщин,
)число поколений,
)средняя продолжительность жизни,
)число детей.
Все эти функции доступны пользователю сервиса в личном кабинете - разделе, который доступен только для зарегистрированных пользователей. Личный кабинет позволяет авторизированным пользователям быстро и удобно получать доступ к таким функциям, как работа с генеалогическими деревьями, редактирование личной информации, обмен сообщениями с другими пользователями, хранение мультимедиа-файлов и так далее.
1.2 Суть задачи
сервис генеалогическое дерево
Задача дипломного проекта - создать веб-сервис для построения генеалогических деревьев. Поставленная задача разбивается на следующие подзадачи:
-разработка и реализация серверной части сервиса;
-разработка и реализация клиентской части сервиса, которая будет предоставлять пользователям возможность создания и редактирования генеалогических деревьев;
-разработка и реализация возможностей импорта и экспорта данных.
Комплексный проект создания веб-сервиса для построения генеалогических деревьев инициирован группой студентов. Его окончательная формулировка и формулировка конкретных задач проведена совместно с научным руководителем.
Задачей данной дипломной работы является разработка и реализация ключевых компонентов системы создаваемого веб-сервиса, на которых будет основана работа всего сервиса для построения генеалогических деревьев. В эту задачу входят такие обширные подзадачи, как:
а)разработка и реализация базы данных для хранения всей получаемой от пользователей информации и всех данных проекта. Для решения этой подзадачи необходимо:
-исследовать существующие реляционные и нереляционные базы данных, их характеристики и главные достоинства;
-выбрать наиболее оптимальные СУБД для хранения данных проекта;
-разработать и реализовать архитектуру баз данных;
-реализовать возможность взаимодействия между выбранными базами данных.
б)разработка и реализация интерфейса для доступа к хранимым данным. В интерфейсе необходимо предоставить стандартный набор операций над данными:
-запись;
-чтение;
-редактирование;
-удаление.
в)авторизация зарегистрированных в сервисе пользователей;
г)разработка и реализация разграничения прав доступа для разных групп пользователей;
д)вычисление и отображение степеней родства между любыми двумя персонами в одном дереве.
1.3 Аналоги
В качестве аналогов рассмотрены такие существующие в настоящее время веб-сервисы для построения генеалогических деревьев, как:
а)сервис «Genway - больше, чем семья!» (см. [3]);
б)сервис «Moederevo» (см. [4]);
в)сервис «MyHeritage» (см. [5]).
Далее проанализируем достоинства и недостатки перечисленных аналогов.
1.3.1 Сервис «Genway - больше, чем семья!»
Сервис «Genway - больше, чем семья!» содержит графический редактор для построения генеалогических деревьев, обладает приятным дизайном и предоставляет возможность отметить местонахождение человека на карте.
В качестве недостатков сервиса можно отметить следующее:
-сложный интерфейс, неудобное расположение элементов управления;
-возможность строить некорректные деревья;
-отсутствие контроля приватности данных;
-отсутствие импорта и экспорта дерева.
1.3.2 Сервис «Moederevo»
Сервис «Moederevo», помимо графического редактора для построения деревьев и интуитивно понятного интерфейса, предоставляет возможность печати дерева. Но существенными недостатками являются отсутствие контроля приватности данных и отсутствие возможности импорта и экспорта генеалогических деревьев.
1.3.3 Сервис «MyHeritage»
В качестве достоинств сервиса «MyHeritage» отметим следующее:
-графический редактор для составления дерева;
-интуитивно понятный интерфейс;
-возможность печати дерева;
-разнообразие стилей и настроек вида дерева;
-приятный дизайн.
Существенным недостатком данного сервиса является отсутствие возможности импорта и экспорта генеалогических деревьев.
В таблице 1 представлен сравнительный анализ перечисленных выше веб-сервисов для построения генеалогических деревьев.
Таблица 1
Сравнительный анализ веб-сервисов для построения генеалогических деревьев
«Genway - больше, чем семья»«Moederevo»«MyHeritage»Приятный дизайндададаИнтуитивно понятный интерфейснетдадаГрафический редактордададаКонтроль приватности данныхнетнетдаВозможность импорта и экспорта данныхнетнетнетВозможность печати дереванетдада
Подводя итог проведенному анализу существующих в настоящее время веб-сервисов для построения генеалогических деревьев можно сказать, что одним из крупнейших в сети интернет генеалогическим ресурсом является сервис «MyHeritage». Существенным недостатком данного сервиса является ограниченные возможности в бесплатном режиме (ограниченное количество родственников в дереве, ограниченное количество доступного места для хранения мультимедийных данных). Ни один из рассмотренных ресурсов не поддерживает импорт и экспорт данных, то есть не предоставляет пользователю возможности сохранить свои наработки вне сервиса.
Создаваемый сервис разрабатывается с целью устранения найденных недостатков, не забывая про имеющиеся достоинства перечисленных сервисов.
1.4 Выбранные программные средства
Для реализации сервиса основным языком разработки выбран язык Python (см. [6]).
Язык Python - это стабильный и распространённый высокоуровневый язык программирования с акцентом на производительность разработчика и читаемость кода; язык общего назначения с широким спектром возможного применения, выразительным синтаксисом и приемлемой производительностью. Недостаток языка - относительно невысокая скорость выполнения программ - компенсируется уменьшением времени разработки программы. В среднем, программа, написанная на Python, в 2-4 раза компактнее, чем её аналог на C++ или Java.
В качестве каркаса приложения выбран фреймворк Django (см. [7]). Django (Джанго) - свободный фреймворк для веб-приложений на языке Python.
Для хранения данных проекта решено использовать два типа СУБД: реляционную и нереляционную базы данных (см. [8]). Такой выбор основан на необходимости хранения разнородных данных. Реляционная база данных хранит данные, удобно представимые в табличном виде: данные о пользователях, данные о географическом расположении пользователей, о правах доступа, о мультимедийных данных. Для хранения данных о генеалогических деревьях используется документо-ориентированная база данных.
1.4.1 Выбор реляционной базы данных
В качестве реляционных баз данных рассматривались две наиболее популярные реляционные базы данных с открытым исходным кодом: MySQL и PostgreSQL.
Каждая база имеет свои особенности и отличия. Если необходимо быстрое хранилище для простых запросов с минимальной настройкой, лучше выбирать MySQL. Если необходимо надежное хранилище для большого объема данных с возможностью расширения, репликации, полностью соответствующее современным стандартам языка SQL (см. [9]), рекомендуется использовать PostgreSQL.хорошо использовать для простых запросов с отключенными транзакциями, в то время как PostgreSQL может поддерживать более серьезную нагрузку и сложные запросы параллельно с записью в базу данных. Ниша, которую занимает PostgreSQL, более широкая, и потенциал у PostgreSQL выше. Ниша MySQL скромнее, MySQL оправдывает себя как хранилище для некритичных по нагрузке и производительности баз данных.
Основное преимущество PostgreSQL - безопасное и защищённое хранилище данных. В качестве полнофункциональной, свободной реляционной БД (RDBMS), PostgreSQL обладает многими характеристиками, спроектированными для поддержки критически-важных приложений с большим потоком транзакций.
В силу всего вышеперечисленного, в качестве реляционной базы данных решено использовать PostgreSQL (см. [10]).
1.4.2 Выбор нереляционной базы данных
В качестве нереляционной базы данных выбрана база CouchDB (см. [11]).
Основные характеристики этой базы:
-данные сохраняются не в строках и колонках, а в виде JSON-подобных документов, моделью которых является не таблицы, а деревья;
-целостность базы данных обеспечивается исключительно на уровне отдельных записей (но не на уровне связей между ними);
-для построения индексов и выполнения запросов используются функции представления;
-функции-валидаторы, функции-представления, функции-фильтры сохраняются в текстовом виде в самой базе данных;
-каждой базе данных в системе CouchDB соответствует единственное В-дерево; каждое B-дерево хранится в виде отдельного файла на диске;
-поддерживается вертикальная масштабируемость, что означает поддержку как огромных кластеров, так и портативных устройств.
Для манипуляций с данными используется JavaScript - объектно-ориентированный скриптовый язык программирования (см. [12]).
2. Описание базы данных
2.1. Реляционная база данных
Спроектирована реляционная база данных, состоящая из десяти таблиц (см. [13]).
2.1.1 Концептуальная схема базы данных
Концептуальная схема базы данных, отображающая взаимосвязи между таблицами, представлена на рис. 2.1.:
Рис. 2.1. Концептуальная схема базы данных
2.1.2 Описание назначения таблиц
Приведем описание таблиц:
-user - таблица хранит данные о пользователях (табл. 2.1.);
-region - таблица с названиями регионов (пример: Новосибирская область) (табл. 2.2.);
-region_area - таблица с названиями районов региона, пример: Коченевский район (Новосибирская область, Коченевский район) (табл. 2.3.);
-city - таблица с названиями городов/сел/поселков, принадлежащих району региона, пример: с. Прокудское (Новосибирская область, Коченевский район, с. Прокудское) (табл. 2.4.);
-city_area - таблица с названиями районов города, пример: Ленинский (Новосибирск, Ленинский район) (табл. 2.5.);
-media - таблица для хранения информации о мультимедийных данных (табл. 2.6.);
-photo - таблица для связи пользователей и фотографий, на которых они отмечены (табл. 2.7.);
-privilege - таблица для хранения информации о правах пользователей на генеалогические деревья других пользователей (табл. 2.8.);
-album - таблица для хранения информации о альбомах, предназначенных для хранения фотографий (табл. 2.9.);
-media_to_album - таблица для хранения связей между фотографиями и альбомами (табл. 2.10.).
С описанием структур перечисленных выше таблиц можно ознакомиться в Приложении А.
2.2 Нереляционная база данных
2.2.1 Описание структуры документов
Нереляционная база данных будет хранить документы следующего вида:
tree = {: [_0,
...,_N,
],: [_0,
...,_N,
],_id: int,_date: date,_date: date,: string,
},
где для упрощения представления вынесем отдельно описание FAMILY_K и PEOPLE_K:
-FAMILY_K = {"id": int, "hasbent": int, "wife": int, "children": list, "parent_families": list, "child_families": list}
-PEOPLE_K = {"id": int, "lastname": string, "name": string, "patronymic": string, "sex": string, "birthday": date, "deathdate": date, "parent_families": list, "self_families": list}
2.2.2 Описание назначения полей в документе
В документе будет храниться следующая информация о дереве:
-"owner_id": совпадает с id пользователя - создателя дерева;
-"create_date": содержит информацию о дате создания дерева;
-"update_date": содержит информацию о дате последнего изменения дерева;
-"revision": хранит идентификатор текущей ревизии;
-"families": коллекция семей, участвующих в дереве;
-"peoples": коллекция персон, участвующих в дереве.
Описание FAMILY_K:
-"id": хранит id семьи;
-"hasbent": хранит id персоны, которая является мужем семьи;
-"wife": хранит id персоны, которая является женой семьи;
-"children": хранит список, состоящий из id персон, являющихся детьми семьи;
-"parent_families": хранит список, состоящий из id семей, являющихся родительскими по отношению к мужу и жене семьи;
-"child_families": хранит список, состоящий из id семей, которые были образованы детьми семьи.
Описание PEOPLE_K:
-"id": хранит id персоны;
-"lastname": хранит фамилию персоны;
-"name": хранит имя персоны;
-"patronymic": хранит отчество персоны;
-"sex": хранит пол персоны;
-"birthday": хранит дату рождения персоны;
-"deathdate": хранит дату смерти персоны;
-"parent_families": хранит список, состоящий из id семей, являющихся родительскими по отношению к персоне;
-"self_families ": хранит список, состоящий из id семей, которые были образованы персоной.
3. Описание реализации работы с данными
3.1 Структура классов для манипуляции с данными
Для манипуляции с данными используются следующие классы:
а)class User (login, password, firstname, lastname, patronymic, phone, email, sex, birthday, deathday, city_id, city_area_id, address, registration_date, update_data, ip_info) - используется для записи данных в таблицу 'user';
б)class Region (title) - используется для записи данных в таблицу 'region';
в)class RegionArea (title, region_id) - используется для записи данных в таблицу 'region_area';
г)class City (title, region_area_id) - используется для записи данных в таблицу 'city';
д)class CityArea (title, city_id) - используется для записи данных в таблицу 'city_area';
е)class Media (type, title, path, owner_id) - используется для записи данных в таблицу 'media';
ж)class Photo (media_id, user_id, rectangle) - используется для записи данных в таблицу 'photo';
з)class Privilege (document_id, owner_id, user_id, privilege) - используется для записи данных в таблицу 'privilege';
и)class Album (owner_id, avatar_id, title, create_date, update_date) - используется для записи данных в таблицу 'album';
к)class MediaToAlbum (album_id, media_id) - используется для записи данных в таблицу 'media_to_album';
л)class DatabaseConnection(address, user, password) - используется для установки соединения с нереляционной базой данных;
м)DatabaseManager(connection, db_name) - используется для создания запросов к нереляционной базе данных.
3.2. Разграничение прав доступа к данным
Для решения задач проекта необходимо реализовать две системы прав доступа. Первая система прав доступа будет отвечать за разграничение прав доступа к ресурсам сервиса, а вторая - за разграничение доступа к пользовательским данным.
3.2.1 Система прав доступа к ресурсам сервиса
Существуют три роли пользователей:
а)незарегистрированные пользователи;
б)зарегистрированные пользователи;
в)администраторы.
Незарегистрированные пользователи имеют доступ к:
-главной странице,
-странице регистрации,
-страницам пользователей, разрешивших полный доступ к своим данным.
Зарегистрированные пользователи имеют доступ к:
-главной странице,
-странице регистрации,
-страницам пользователей, разрешивших полный доступ к своим данным,
-страницам пользователей, разрешивших доступ к своим данным этому пользователю.
Администраторы имеют доступ как к вышеперечисленным данным, так и к интерфейсу администратора.
3.2.2 Система прав доступа к пользовательским данным
Система прав доступа к пользовательским данным базируется на трех операциях:
а)отсутствие доступа;
б)доступ на чтение;
в)доступ на запись.
Права доступа могут быть назначены пользователю или группе пользователей. При этом права, назначенные пользователю, имеют более высокий приоритет.
3.3 Вычисление степеней родства
Степени родства между персонами в одном генеалогическом дереве должны определяться в двух случаях:
а)определение кровности родства между двумя персонами в одном генеалогическом дереве;
б)определение в дереве всех персон с заданным типом родственной связи для некоторой выбранной персоны.
Задача определения кровного или некровного родства между двумя персонами в дереве была решена поиском пути, в котором все родственники между этими персонами являются кровными друг другу. Если такой путь существует, то родственники являются кровными. Если такой путь отсутствует, родство является некровным.
Определение в одном дереве всех персон с заданным типом родственной связи для некоторой выбранной персоны реализуется по набору существующих названий отношений между родственниками. Для этого разработан набор терминов родственных связей, с которым можно ознакомиться в Приложении Б. Выбрав некоторую персону в генеалогическом дереве и тип родственной связи из данного набора, можно получить всех персон в этом дереве, которые связаны с выбранной персоной выбранным типом родственного отношения. Например, для любой персоны дерева можно получить всех братьев или всех бабушек этой персоны.
Заключение
В результате проделанной работы полностью реализован запланированный объём работы, включающий в себя реализацию системы хранения данных проекта, реализацию системы разграничения прав доступа к ресурсам сервиса и реализацию возможности определения родства между персонами генеалогического дерева.
Разработанный сервис имеет практическую ценность для работы с генеалогическими деревьями в веб-среде.
Для достижения поставленной цели проделаны следующие виды работ:
-исследована предметная область;
-найдены и исследованы существующие аналоги;
-составлены общие и функциональные требования;
-исследованы возможные средства разработки для решения поставленной задачи;
-выбраны и изучены средства разработки: объектно-реляционная СУБД PostgreSQL, документо-ориентированная СУБД CouchDB, язык программирования Python, фреймворк Django, язык программирования JavaScript;
-разработана и реализована архитектура реляционной базы данных;
-разработана и реализована архитектура нереляционной базы данных;
-разработан и реализован интерфейс для доступа к хранимым данным;
-разработана и реализована система разграничения прав доступа для разных групп пользователей;
-разработано и реализовано вычисление степеней родства между двумя персонами в генеалогическом дереве;
-проведена отладка и тестирование разработанного сервиса.
Направлениями будущей деятельности являются разработка методов для определения возможного родства между зарегистрированными пользователями и определения названий родственных связей между любыми двумя выбранными персонами в одном генеалогическом дереве, а также более углубленное исследование вопроса безопасности данного сервиса с разработкой методов обеспечения защищенности системы.
Литература:
. Ф. Харари. Теория графов = Graph Theory / пер. с англ. В. Козырев. - М.: Либроком, 2009. - 302 с.;
2. Кочевых, Сергей Владимирович. Методическое пособие по проведению генеалогических разысканий. Основы генеалогической культуры. - СПб.: 2006. - 80 с.;
3. Genway - больше, чем семья: [Электрон. Ресурс]. - #"justify">4. Moederevo.com: [Электрон. Ресурс]. - #"justify">5. MyHeritage.com: [Электрон. Ресурс]. - #"justify">6. Дэвид М. Бизли. Python. Подробный справочник, 4-е издание. - пер. с англ. А. Киселёв. - СПб.: Символ-Плюс, 2010. - 864 с.;
7. А. Головатый. Django. Подробное руководство = The Definitive Guide to Django / пер. с англ. А. Киселев. - СПб.: Символ-Плюс, 2010. - 560 с.;
8. В.Ю. Пирогов. Информационные системы и базы данных. Организация и проектирование. - СПб.: ХВ-Петербург, 2009. - 528 с.;
9. Кевин Е. Кляйн. SQL. Справочник = In a Nutshell: A Desktop Quick Reference / пер. с англ. А. Слинкин, Е. Демьянов. - СПб.: Символ-Плюс, 2010. - 656 с.;
10. Gregory Smith. PostgreSQL 9.0 High Performance. - Packt Publishing, 2010. - 468 с.;
11. J. Chris Anderson. CouchDB: The Definitive Guide . - O'Reilly Media, 2010. - 250 c.;
12. Дэвид Флэнаган. JavaScript. Подробное руководство = JavaScript: The Definitive Guide / пер. с англ. А. Киселев. - 5-е изд. - СПб.: Символ-Плюс, 2009. - 992 с.;
13. Джен Л. Харрингтон. Проектирование реляционных баз данных = Relational Database Design / пер. с англ. И. Дранишников. - М.: Лори, 2006. - 230 с.
Больше работ по теме:
Предмет: Информационное обеспечение, программирование
Тип работы: Курсовая работа (т)
Новости образования
КОНТАКТНЫЙ EMAIL: [email protected]
Скачать реферат © 2017 | Пользовательское соглашение
ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ