Подписаться  на наше издание быстро и дешевле чем где-либо Вы можете прямо сейчас! Подписаться! 


Сведения о данных открывают новые, более удобные способы управления информацией.

КОГДА РЕЧЬ заходит об информационных технологиях, некоторые слова приобретают другой смысл. Так произошло с "платформой", "архитектурой", "интеграцией". Иногда кажется, что общение происходит на малознакомом иностранном языке: значение отдельных слов еще как-то понятно, но в целые предложения они не складываются.

Что-то подобное произошло и с понятием "метаданные". Что такое "данные", вроде бы понятно. Приставка "мета" означает "над", более высокий уровень. Итак, что же такое "метаданные"?

Для того чтобы дать ответ на этот вопрос, а заодно отметить полезные свойства метаданных, которые можно использовать на практике, рассмотрим несколько примеров метаданных разного типа. К ним часто относят такие ИТ-конструкции, как программы, документы, сообщения электронной почты, файлы, вэб-ресурсы и вэб-сервисы. Какую роль играют метаданные в каждом из этих случаев?

Метаданные программ


С тех самых пор, как появилось программное обеспечение, программисты начали сопровождать его исходный код метаданными. Этот вид метаданных знаком всем, кому хоть раз приходилось писать какую-нибудь программу: комментарии. Однако прошло немало времени, прежде чем комментирование исходного кода стало стандартом. В 80-х годах легендарный Дональд Кнут, автор классического трехтомного учебника по принципам построения программ, оценив значение комментариев, начал активно пропагандировать технологию, которую он назвал "грамотным программированием". Именно Кнут изобрел TeX — язык разметки текста, насыщенного математическими символами, формулами и другими техническими элементами.

Идеей Кнута было использование TeX в тандеме с языком программирования для создания единого документа, в котором сочетались бы программный код и документация к нему.

TeX — изобретение Дональда Кнута для создания комплексной документации к программным продуктам Мечта Дональда Кнута так и не осуществилась, но идея более тесной интеграции комментариев с исходным кодом получила развитие.

 

Мечта Дональда Кнута так и не осуществилась, но идея более тесной интеграции комментариев с исходным кодом получила развитие. Например, программисты на Java вставляют в исходный код специальные форматированные комментарии, которые затем с помощью инструмента Javadoc преобразуются в формат HTML, — получается готовая документация.


Комментарии — это неформальные метаданные, используемые для описания того, как действует программа. Эти описания предназначены для читателя, но иногда их можно использовать и более формально, определяя с их помощью свойства и взаимосвязи программных компонентов. Например, обращение к модулю, проверяющему номер кредитной карточки, может быть прямым либо через систему вэб-сервисов. Определив способ обращения в комментарии, а не в самом коде, мы отделяем логику конфигурации от бизнес-логики.

 

Однако поскольку при компиляции (сборке готового кода) программ комментарии теряются, такие конфигурационные метаданные могут остаться "за скобками". Не лучше ли встроить их прямо в исполняемый код? Именно такой подход применен в архитектуре .Net и в Java после выхода версии J2SE 1.5. Благодаря технологии, именуемой "отражением" и доступной в обеих этих средах, стало возможным обращаться к файлам классов и сборкам при выполнении программы, находить содержащиеся там метаданные и выполнять действия в соответствии с ними. С помощью метаданных можно, например, объявить, что конкретный компонент применим только при обработке транзакций, или при аутентификации определенного типа.


Эти аннотации к программам не вставляются в сам код. Однако в программы Java и .Net можно (путем отражения) встроить метаданные об их объектах, типах и свойствах. В результате получаем программы, содержащие собственное описание, которые благодаря этому очень гибко взаимодействуют с другим программным обеспечением. Наглядный пример такого взаимодействия — интерактивное завершение операторов в некоторых средах разработки, то, что в терминологии Microsoft (Profile, Products, Articles) называется IntelliSense.


При таком подходе вовсе не требуется, чтобы метаданные встраивались непосредственно в генерируемый код. Это просто удобно с точки зрения управления. Объекты, в которых содержатся метаданные с их описаниями, очень хорошо вписываются в современную информационную среду с ее тягой к децентрализации. В то же время есть причины и для менее тесной связи данных и метаданных. Например, встроенные конфигурационные метаданные в средах Java и .Net удобны для программистов, но гораздо менее удобны для системных администраторов. Поэтому администраторам лучше заменить жестко закодированные параметры их аналогами, объявленными в отдельных конфигурационных файлах XML. Ими гораздо проще управлять.


Два противоположных взгляда на управление метаданными — с позиций программиста и системного администратора — подтверждают то, что на этот вопрос нет однозначно правильного ответа. Даже в одном домене с единым управляемым словарем команд люди, имеющие дело с метаданными, играют разные организационные роли и используют разные инструменты по отношению к ним.

 

Метаданные документов и электронных сообщений


Cведения об авторе, дате создания и изменения, размере, правах доступа — это лишь простейшие метаданные документов и сообщений, поддерживаемые файловой системой. Речь идет и о встроенных свойствах документов Word, и о HTTP-заголовках, которые используются вэб-серверами, и о метаданных из заголовков сообщений электронной почты.


Во всех случаях в метаданные можно вносить дополнительные элементы. Так, в документах Word есть место для пользовательских настроек, в коде вэб-страниц — метатэги с ключевыми словами, аннотациями и прочими данными для поисковых интернет-систем, в электронных сообщениях — поля заголовков, заполняемые пользователем. О том, что такие метаданные, вводимые пользователем, должны, по идее, помогать другим пользователям определять назначение документов и сообщений, говорят уже давно. Однако ввод дополнительной информации требует и дополнительных усилий, а это всегда тормозит прогресс. Кроме того, для того чтобы на основе метаданных можно было строить надежные программные процессы, необходимо, чтобы эти метаданные были ограничены стандартизированными словарями.


Некоторые вэб-ресурсы собирают информацию из метаданных файлов, размещенных в интернете и открытых для всеобщего обозрения, — например, с фотографий. Такой сбор подчас оказывается эффективным даже несмотря на довольно свободную формулировку метаданных.


Если же метаданными помечены документы и сообщения, хранящиеся на локальном компьютере или на закрытом онлайн-ресурсе, то единственный, кто может извлечь из них какую-то пользу, — это их владелец. Но без обратной связи и поощрения от других членов информационного сообщества строгое использование метаданных требует высокой самодисциплины.


Но когда речь заходит о метаданных, внедренных в открытые данные, к которым может обращаться множество людей, все меняется. В этом случае метаданные, созданные одним или несколькими людьми, что называется, "для себя", могут принести пользу многим. Таким образом, с одной стороны, ничто не может принудить владельца электронного документа снабжать единообразными метаданными все закладки и фотографии, размещаемые на общедоступном ресурсе. Однако, с другой стороны, если он будет это делать, то привлечет к себе больше внимания, а это хороший стимул к формированию единого словаря метаданных. Благодаря такому словарю легко устанавливаются связи между документами, созданными разными людьми, но имеющими между собой что-то общее, — тему, ключевые слова, и т.п. Например, на сайтах многих интернет-изданий таким образом можно легко найти статьи, тематика которых близка той, что открыта в данный момент.


Однако чем более ограничен доступ к документам и чем менее людей в них нуждается, тем слабее необходимость в снабжении этих документов метаданными. Поэтому решение о том, стоит ли разрабатывать словарь и правила составления метаданных к документам того или иного проекта, зависит от объема электронной документации, числа задействованных сотрудников и интенсивности взаимодействия между ними.

 

Метаданные Web и файловой системы

 

Изобретатель web, Тим Бернерс-Ли (Tim Berners-Lee), давно предсказывал создание "семантической сети Web", в которой можно было наводить связи между объектами. Для этой цели Консорциум World Wide Web выступил с двумя предложениями: грамматической системы RDF (Resource Description Framework — структура описания ресурсов) для описания и обмена метаданными о различных ресурсах и набора языков для классификации ресурсов OWL (Web Ontology Language — онтологический язык Web).


RDF описывает взаимосвязи между объектами в виде триад "субъект-действие-объект", например: DOCUMENT IS-A SALES_PROGRAM ("документ" — "является" — "программа сбыта") или DOCUMENT HAS-AUTHOR ALEXANDER_IVANOV ("документ" — "имеет автора" — "Александр Иванов"). Если таким образом описано много ресурсов, словари метаданных тщательно контролируются, и если есть система, способная обрабатывать сформированные из таких метаданных запросы, то можно получить эффективное средство поиска по самым разным критериям, которые к тому же вы определяете сами. Правда, в этой области еще остается очень много вопросов, особенно с учетом масштабов и хаотичности Web.

 

Поэтому, возможно, лучше ограничиться управлением персональной информацией. Именно на это делает упор Microsoft в WinFS — файловой системе следующего поколения, которую первоначально планировалось внедрить только в Windows Vista, но которая все же появилась раньше, в Windows XP.


Данные в WinFS хранятся в виде наборов строго типизированных объектов. Среди таких типов — Document ("документ"), Person ("лицо"), Message ("сообщение") и — что самое важное — Relationship ("отношение"). Идея заключается в том, чтобы приложения, управляющие этими объектами, использовали отношения для создания RDF-триад. Приложение может обозначить документ как программу сбыта или то, что автором является Александр Иванов, или что Александр Иванов является участником данного проекта. Все эти отношения открыты. Они доступны для всех остальных приложений в системе WinFS, которые могут запрашивать сообщения других участников данного проекта, имеющие отношение к программе сбыта.


Такое сочетание реляционной базы и файловой системы — одно из ключевых нововведений в WinFS. Что касается типов метаданных, то, по идее, это должно стимулировать разработчиков использовать встроенные типы WinFS и создавать новые для описания новых свойств документов с помощью управляемых метаданных. Третья особенность — это возможность устанавливать взаимосвязи между разными типами WinFS — специализированными объектами .Net, документами и сообщениями, представленными в формате XML и описанными XML-схемами.


Со временем, вероятно, все файловые системы будут эволюционировать в направлении более интенсивного использования метаданных. В этом отношении "первой ласточкой", которая, к сожалению, появилась раньше своего времени, стала BeOS. Правда, сошедшая со сцены Be File System оставила хороший базис: эта ОС поддерживала неограниченное число типов файловых метаданных, эффективно индексировала метаданные и обрабатывала запросы к ним задолго до появления своего первого последователя, Apple Spotlight.


Еще одной файловой системой, поддерживающей типы метаданных, является ReiserFS — файловая система с журналированием, используемая во многих дистрибутивах Linux. В ReiserFS версии 4 основное внимание было уделено быстродействию, надежности и расширяемости, однако долговременной целью этой файловой системы является создание информационной модели, приближенной к ассоциативному человеческому мышлению.


По мере того, как метаданные будут все глубже проникать в программное обеспечение, документы, вэб-сайты и файловые системы, хранящаяся в них информация будет становиться более доступной, связной и, следовательно, более полезной. Поэтому следующим шагом должна стать унификация и объединение этих разделенных пока областей.


Решение этой задачи будет, вероятно, достаточно сложным, но кое-что уже сделано. В частности, это компоненты быстро развивающейся сейчас архитектуры SOA (Service-Oriented Architecture — "сервис-ориентированная архитектура"). Метаданные применяются для описания интерфейсов сервисов и определения политик, которые этими сервисами управляют. Сообщения, которыми обмениваются сервисы, содержат метаданные, взаимодействующие с политиками. Таким образом, метаданные обеспечивают динамическое поведение и определяют условия, в которых выполняются бизнес-транзакции. Документы, содержащиеся в этих сообщениях и представляющие эти транзакции, также описываются посредством метаданных.


Единой схемы передачи метаданных через сетевые сервисы, маршрутизаторы, реестры, шлюзы безопасности, базы данных и приложения пока не существует. Кроме того, с учетом многообразия самих метаданных и способов их применения сложно сказать, нуждаются ли они вообще в едином стандарте. Но что действительно нужно, так это баланс между строгими словарями метаданных и достаточной гибкостью для их эволюции в каждой из рассмотренных областей. И такой общий язык для данных и метаданных уже есть — это XML.

2006.05.15
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".