Семантическая сеть

 













Курсовая работа

по дисциплине "Информатика"


Введение


Шесть лет назад Тим Бернерс-Ли (Tim Berners Lee), Джеймс Хендлер (James Hendler) и Ора Лассила (Ora Lassila) представили в журнале Scientific American новую концепцию Семантическую сеть (Semantic Web) - информационную сеть со множеством взаимосвязей, к которой можно легко подключится с любого настольно или карманного компьютера и которая проста в использовании. Они описали будущее, в котором интеллектуальные программы будут через Интернет автоматически заказывать билеты на авиарейсы и бронировать места в отелях, вносить новые записи в истории болезни и давать однозначные ответы на запросы, избавляя от нас необходимости самостоятельно анализировать результаты поиска.

Тим Бернерс-Ли, Джеймс Хендлер и Ора Лассила представили также средства, позволяющие воплотить эту идею в реальность: общий язык представления данных, понятный всем видам программных агентов, онтологии наборы операторов для перевода информации из баз данных с различной структурой в общие термины, и правила, позволяющие программным агентам "осмысливать" информацию, описанную в этих терминах. Формат данных, онтологии и программы "осмысления" должны работать во Всемирной паутине как единое большое приложение, анализирующее все исходные данные, хранящиеся в оперативных базах данных, и всю информацию о текстах, изображениях, видеофрагментах и их взаимосвязях, имеющуюся в Сети. Семантическая сеть будет расти стихийно, но ее развитие будут поддерживать специалисты из Веб-консорциума (World Wide Web Consortium).

Скептики утверждают, что Семантическая сеть слишком сложна для понимания и пользоваться ею будет трудно. Вовсе нет. Необходимые технологии уже в достаточной степени отработаны. Энергичное сообщество первых пользователей согласовало стандарты, делающие работу с Семантической сетью более удобной. Крупные компании работают над масштабными проектами, призванными существенно повысить эффективность использования информационной сети как в научных исследованиях, так и в быту. Другие компании используют Семантическую сеть для развития межкорпоративных взаимодействий и создания незаметных для пользователя систем обработки данных, обеспечивающих функционирование новых потребительских сервисов. Пользовательские приложения - всего лишь часть этой работы, подобно верхушке айсберга.


1. Что такое семантическая сеть


СЕМАНТИЧЕСКАЯ СЕТЬ (Semantic Web) - набор форматов и языков, позволяющих находить во Всемирной паутине и анализировать данные, дающий пользователям возможность понимать все виды сетевой информации.

Семантическая сеть представляет собой не что-то отделенное от Всемирной паутины, а ее дополнение. Она начинает функционировать, когда люди объединенные общим делом, договариваются об общих схемах представления интересующей их информации. С появлением новых групп, разрабатывающих эти таксономии инструментарий семантической сети позволяет им связывать свои схемы и переводить термины, постепенно расширяя круг пользователей, веб-программы которых автоматически понимают друг друга.

Основные положения

·Для семантической сети появляются самые разнообразные приложения от мобильной телефонной службы Vodafone Live! До системы координирования работы поставщиков компании "Боинг".

·Ученые разрабатывают самые передовые приложения, в том числе систему выявляющую генетические причины сердечных заболеваний, а также систему раннего обнаружения эпидемий гриппа.

·Компании и университеты, работающие в рамках Веб-консорциума (World Wide Web Consortium) разрабатывают стандарты, которые должны сделать семантическую сеть более доступной и простой в использовании.

Элементами Семантической сети являются несколько форматов и языков семантический формат интернет программный

Они дополняют различные программные технологии, лежащие в основе Интернета и опубликованные в качестве стандартных в рамках программы Semantic Web Activity Веб-консорциума.

·Формат RDF. Самым главным элементом является формат Resource Description Framework (RDF), для определения информации в информационной сети. Каждому блоку данных и каждой связи между двумя блоками присваивается уникальное имя, так называемый универсальный идентификатор ресурса (Universal Resource Identifier, URI). Общеизвестные веб-адреса (Universal Resource Locators, URL), которыми мы все пользуемся являются частными форматами URI. В RDF-схеме два блока информации и любое указание, описывающее связь между ними, объединяются в тройку. Например сетевая ссылка на известное животное-телегероя - дельфина по имени Флиппер, ссылка на связь "есть" и ссылка на понятие "Дельфин" могут быть объеденены в тройку.


<uri for Flipper> <uri for Is A> <uri for Dolphin>


Идентификаторы URI могут согласовываться органами стандартизации или сообществами либо присваиваться отдельным лицам. Связь "Is A" настолько общеполезна, что Веб-консорциум опубликовал для нее стандартный URI. Для представления понятия "дельфин" любой пользователь может выбрать URI "#"justify">. Языки онтологий


Отдельные люди или группы могут определять термины и данные, которыми они часто пользуются, а также взаимоотношения между ними. Такой набор определений называется онтологией. Онтологии могут быть как сложными (с тысячами терминов), так и простыми. Язык Web Ontology Language (OWL) является одним из стандартов, которые можно использовать для такого определения онтологий, что бы они были взаимно совместимыми и понятными для формата RDF.

Две базы данных могут использовать различные идентификаторы для обозначения одного и того же понятия, такого как почтовый индекс. И программа, желающая сравнить или как-то скомбинировать информацию из этих баз данных, должна знать, что два конкретных термина используются ими для обозначения одного и того же. В идеале, у программы должен быть способ распознавать подобные термины с одинаковым смыслом, с какими бы базами данных ей не пришлось столкнуться в процессе своей работы.

Решение этой проблемы даётся третьим базовым компонентом Семантической Сети - онтологией. Онтология - это документ или файл, формально задающий отношения между терминами. Наиболее типичными видами онтологий в Сети являются таксономия и набор правил вывода.

Таксономия определяет классы объектов и отношения между ними. Например, понятие адрес может быть определено как разновидность понятия местонахождение [location], а код города можно задавать применительно лишь к местонахождениям и так далее. Задание классов, подклассов, а также отношений между индивидами [entities] является чрезвычайно мощным инструментом для использования в Сети. Большое количество отношений между индивидами можно задать путём приписывания классам определённых свойств и позволяя подклассам наследовать эти свойства. Если, скажем, код города есть свойство объектов типа город, а в свою очередь, города, в большинстве своём, имеют собственные веб-сайты, то мы можем говорить, что некий веб-сайт связан с определённым кодом города, хотя в нашей базе и нет прямой связи, ведущей от кода города к веб-сайту.

Правила вывода, задаваемые в онтологиях, дают ещё больше возможностей. В рамках онтологии можно записать такое правило: "Если код города соответствует некоторому коду штата, а в адресе фигурирует код города, то этому адресу тоже соответствует тот же самый код штата". В этих условиях программа может без труда вывести, например, что коль скоро Корнельский Университет находится в г. Итака, который расположен в штате Нью-Йорк, который, в свою очередь, есть часть США, то адрес этого университета следует писать в американском формате. Компьютер не "понимает" в полном смысле этого слова ничего из всей этой информации, но теперь он уже может манипулировать терминами гораздо более эффективно с тем, чтобы стать полезным и осмысленным для пользователя-человека.

Как только доступные всем онтологии появятся в Сети, описанные терминологические (и другие) проблемы обретут своё решение. Смысл каждого термина или XML-кода, использованного на веб-странице, можно будет задать посредством указателя с этой страницы на соответствующую онтологию. Конечно же, тут возникает та же самая проблема, что и упомянутая выше, когда один пользователь ссылается на одну онтологию, в которой определено понятие адреса, включающего в себя понятие zip-кода [синоним термина "почтовый индекс" в англ. яз.], а другой ссылается на другую онтологию, оперирующую уже термином почтовый индекс. Однако такого рода путаницу можно устранить, если онтологии (или же какие-то другие веб-сервисы) позволяют задавать отношение эквивалентности: в одну или же в обе наши онтологии можно поместить информацию о том, что понятие zip-кода эквивалентно понятию почтового индекса.

Эта загвоздка частично будет устранена, если две упомянутые в ней базы данных будут ссылаться на разные определения термина адрес. Программа, используя различные URI-идентификаторы для этих различных понятий адреса, уже не будет их путать, и на самом деле даже обнаружит, что эти два понятия почти не связаны друг с другом. Далее программа может воспользоваться неким сервисом, позволяющим взять список почтовых адресов (термин из одной онтологии) и преобразовать его в список физических адресов (термин второй онтологии), распознав и выбросив из него абонентские ящики и другие, неподходящие для наших целей адреса. Таким образом, структура и семантика, задаваемые в онтологиях, позволяют предпринимателю предоставлять подобные услуги и делать их чрезвычайно прозрачным в использовании.

Онтологии способны улучшить функциональность Сети во многих аспектах. В простейшем случае, их можно использовать для увеличения точности поиска в Сети - поисковая машина будет выдавать только такие сайты, где упоминается в точности искомое понятие, а не произвольные страницы, в тексте которых встретилось данное многозначное ключевое слово. Более продвинутые приложения будут использовать онтологии, чтобы соотнести информацию на странице со связанной с ней структурой знаний и правилами вывода. Пример страницы, размеченной для такого использования, уже есть в сети по адресу #"justify">Именно по этой причине для компьютерного восприятия данная страница снабжена ссылками на онтологическую страницу, задающую информацию о факультете Computer Science. На ней, в частности, говорится, что профессора работают в университете и что они обычно имеют докторскую степень. Далее разметка (не отображающаяся на дисплее стандартным веб-браузером) на странице Хендлера, используя понятия этой же онтологии, сообщает, что Хендлер получил степень Доктора Философии в организации, описанной по URI-адресу #"justify">Кроме того, подобная разметка делает гораздо проще разработку программ, которые будут способны обрабатывать более сложные вопросы, ответы на которые не содержатся на какой-то одной веб-странице. Предположим, Вы хотите найти некую госпожу Кук [Ms. Cook], с которой Вы познакомились на профсоюзной конференции в прошлом году. Вы не помните её имени, однако помните, что она работала в какой-то компании, которая является Вашим клиентом, и что её сын учится в том же университете, который окончили Вы. Умная поисковая система просканирует все страницы людей с фамилией Кук (при этом пропуская страницы о поварах [cooks], приготовлении пищи [cooking], Кукских островах [Cook Islands] и т.п.), выберет среди них те, на которых упоминаемый человек работает в компании, входящей в список Ваших клиентов, а также пробежит по ссылкам на веб-страницы учебных заведений, в которых учатся их дети, чтобы проверить, не тот ли самый это университет.

СОВЕРШЕННЫЕ и ТОЧНЫЕ АВТОМАТИЗИРОВАННЫЕ поисковые системы станут возможны, когда Сеть наполнится семантикой. На рисунке поисковая программа безошибочно отыскивает человека, основываясь на наборе частично припомненных знаниях: её фамилия "Кук", она работает в компании, входящей в список Ваших клиентов, и у неё есть сын, учащийся в том же университете, который окончили Вы (Avondale University). Правильной комбинации нужной информации нет ни на одном отдельно взятом веб-сайте, однако благодаря семантике программа достаточно легко распознала отдельные элементы этой информации на различных веб-страницах, поняла отношения между ними, как то "Майк Кук является сыном Уэнди Кук" и правильно составила из этих частей единое целое. В общем случае, семантика позволит автоматически проводить сложные процессы и трансакции. (Рисунок 1)



3. Машины логического вывода


Онтологии можно считать работающими уровнем выше RDF, а машины логического вывода работают уровнем выше онтологий. Эти программы исследуют различные онтологии и находят новые взаимоотношения и связи между содержащимися в них терминами и данными. Например, машина логического вывода может изучать три представленные ниже RDF-тройки и сделать вывод, что Flipper есть млекопитающее. Распознавание связей межу различными источниками - важный этап на пути к выявлению "смысла" информации.


<uri for Flipper> <uri for Is > <uri for Dolphine>

<uri for Dolphine> <uri for Subclass Of> <uri for Mammal>

<uri for Flipper> <uri for Is A> <uri for Mammal>


Другие технологии

Веб-консорциум разрабатывает машины логического вывода и многие другие технологии. В их числе язык запросов SPARQL, позволяющий приложениям искать конкретную информацию в RDF-данных, и технология GRDDL, дающий возможность пользователям публиковать данные в тех форматах, которыми они пользуются, например, HTML или XML, И определять способы перевода этих данных в RDF.


Заключение


Возможно, Семантическая сеть работает менее открыто, чем Всемирная паутина. Мы не узнаем всех подробностей создания компанией Eli Lilly персонализированных лекарств, а просто будем их покупать. Мы не получим информации о том, как компании Vodafone удалось сделать скачивание рингтонов столь быстрым, мы просто оценим эту легкость. Тем не менее Семантическая сеть довольно скоро откроет нам новые возможности. Например, она позволит пользователю, обратившемуся на сайт eBay, вместо обычного: "Найти выставленные на продажу поддержанные автомобили Toyota Prius", дать расширенное задание: "Найти выставленные на продажу поддержанные автомобили Toyota Prius красного цвета ценой не больше $14 тыс., владельцы которых живут не дальше 100 км от моего дома, и сделать им предложение". По словам сэра Тима Бернерс-Ли, с помощью семантической сети можно "создавать приложения, более значительные, чем все, что есть в обычной сети … Представьте, что две совершенно отдельные вещи - ваши банковские отчеты и ваш календарь - будут говорить на одном языке и делиться информацией друг с другом. Вы сможете наложить одно на другое, а появившиеся группы точек показали бы вам, когда вы потратили ваши деньги. Если вы не помните точно, где сняли деньги, вы сможете наложить ваш фотоальбом на календарь, а тот напомнит вам, что вы использовали свою кредитную карту, когда фотографировали детей в парке. Так что вы не станете обвинять в этом налоги. Это будет цельная сеть всех данных в вашей жизни. … В семантической сети каждой единице данных будут будто бы присвоены "координаты" по долготе и широте на карте, так что любой сможет их совмещать и использовать в различных операциях".

Большие идеи редко реализуются точно по плану, но Семантическая сеть уже начала формироваться, и с ее помощью сетевая информация станет для нас более доступной, чем когда-либо ранее.

Практическая часть


В течение текущего дня в салоне сотой связи проданы мобильные телефоны, код, модель и цена которых указаны в таблице на рис. 16.1. В таблице на рис. 16.2 указан код и количество проданных телефонов различных моделей.

1.В итоговой таблице (рис. 16.3) обеспечить автоматическое заполнение данными столбцов "Модель мобильного телефона", "Цена, руб.", "Продано, шт.", используя исходные данные таблиц на рис. 16.1 и 16.2, а также функции ЕСЛИ(), ПРОСМОТР. Рассчитать сумму, полученную от продаж каждой моделей, итоговую сумму продаж.

2.Сформировать ведомость продаж мобильных телефонов на текущую дату.

.Представить графические данные о продаже мобильных телефонов за текущий день.


Код мобильного телефонаМодель мобильного телефонаЦена, руб.108Fly Z5007899109Fly X34819209LG-C34006540210LGF120010419308Motorola V1803869309Motorola V2204459301Motorola C 1151570304Motorola C 3905149406Nokia 32204299407Nokia 323010490408Nokia 51406349503Pantech G-6707659504Pantech GB-1003789604Siemens A652739605Siemens A752869708Sony Ericsson T290i2569709Sony Ericsson Z800i13993

№ продажиКод мобильного телефонаПродано, шт.1109422092330414406554083650347605887085Рис. 16.2 Список продаж


Код мобильного телефонаМодель мобильного телефонаЦена, руб.Продано, шт.Сумма, руб.109209304406408503605708Рис. 16.3 Табличные данные ведомости продаж


Описание алгоритма решения задачи

1.Запустить табличный процессор MS Excel.

2.Создать книгу с именем "Продажи мобильных телефонов".

.Лист 1 переименовать в лист с названием Модели и цены.

.На рабочем листе Модели и цены MS Excel создать таблицу прайс-листа.

.Заполнить таблицу прайс-листа исходными данными (рис. 16.1).



6.Лист 2 переименовать в лист с названием Список продаж.

7.На рабочем листе Список продаж MS Excel создать таблицу, в которой будет содержаться, какое количество мобильных телефонов каждой модели продано.

.Заполнить таблицу, в которой будет содержаться, какое количество мобильных телефонов каждой модели продано, исходными данными.



9.Лист 3 переименовать в лист с названием Ведомость продаж.

10.На рабочем листе Ведомость продаж MS Excel создать таблицу, в которой будут содержаться, суммы, полученные от продаж каждой из моделей телефонов.

.Заполнить таблицу, в которой будут содержаться, суммы, полученные от продаж каждой из моделей телефонов, исходными данными.


12.Заполнить графу Модель мобильного телефона таблицы "Ведомость продаж", находящейся на листе Ведомость продаж, следующим образом:

Занести в ячейку В2 формулу:

=ПРОСМОТР(A2;'Модели и цены'!A2:A18;'Модели и цены'!B2:B18)

Размножить введенную в ячейку В2 формулу для остальных ячеек (с В3 по В9) данной графы.

Таким образом, будет выполнен цикл, управляющим параметром которого является номер строки.



13.Заполнить графу Цена, руб. таблицы "Ведомость продаж", находящейся на листе Ведомость продаж следующим образом:

Занести в ячейку С2 формулу:

=ПРОСМОТР('Ведомость продаж'!A2;'Модели и цены'!A2:A18;'Модели и цены'!C2:C18)

Размножить введенную в ячейку С2 формулу для остальных ячеек (с С3 по С9) данной графы.



14.Заполнить графу Продано, шт. таблицы "Ведомость продаж", находящейся на листе Ведомость продаж следующим образом:

Занести в ячейку D2 формулу:

=ПРОСМОТР(A2;'Список продаж'!B2:B9;'Список продаж'!C2:C9)

Размножить введенную в ячейку D2 формулу для остальных ячеек (с D3 по D9) данной графы.



15.Заполнить графу Сумма, руб. таблицы "Ведомость продаж", находящейся на листе Ведомость продаж следующим образом:

Занести в ячейку E2 формулу:

=C2*D2

Размножить введенную в ячейку C2 формулу для остальных ячеек (с C3 по C9) данной графы.


16.Заполнить ячейку Е10 таблицы "Ведомость продаж", находящейся на листе Ведомость продаж следующим образом:

=СУММ(E2:E9)



17.На рабочем листе "Ведомость продаж" активизировать любую ячейку списка, выбрать команду Вставка/Диаграмма.

Задаем искомый диапазон и создаем на новом листе диаграмму.

По графам "Модель мобильного телефона" и "Продано, шт."

По графам "Модель мобильного телефона" и "Цена, руб."+ "Сумма, руб."




Список литературы


Статья из журнала

1.Э. Нойманн, С. Стивенс, Л. Фейгенбаум, И. Херман, Т. Хонгзермайер. Семантическая сеть в действии // В мире науки (SCIENTIFIK AMERICAN). - 2008. - №3. - С. 60-67.

Публикации в сети Интернет

1.Директор Google сомневается в Семантической сети. - http://habrahabr.ru/blog/columns/5961.html (20.07.06)

2.Евгений Золин. Обзор статьи: семантическая сеть. - http://ezolin.pisem.net/logic/semantic_web_rus.html (05.05.2008)

.Семантическая паутина. Википедиа Свободная энциклопедиа. - http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BF%D0%B0%D1%83%D1%82%D0%B8%D0%BD%D0%B0

4.Google приходит конец. Вокруг света. - http://www.vokrugsveta.ru/news/3519/ (13.03.08)

.Опубликован язык запросов для "семантического Web". - http://www.osp.ru/news/2008/0116/4698619/ (16.01.08)


Курсовая работа по дисциплине "Информатика" Введение Шесть лет назад Тим Бернерс-Ли (

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ