Метаданные описание пространственных данных … Введение … Общие сведения … Организационные аспекты … - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
Руководство пользователя общие правила 5 461.96kb.
Организационные и содержательные аспекты ведения занятий по программе... 1 72.46kb.
Лекция №14 Распределенные базы данных Краткое описание: Распределенные... 1 115.61kb.
Академический геопортал «Геомета» как платформа для интеграции пространственных... 1 57.69kb.
Организационные и методические аспекты внедрения бережливого производства... 1 81.66kb.
Общие сведения о стране Географическое положение Норвегии историческая... 1 214.05kb.
Общие сведения о химическом оружии и отравляющих веществах 1 Общие... 1 207.42kb.
Объединенные арабские эмираты (справочная информация) 12-03-2009... 1 64.05kb.
Вопросы по курсу «Базы данных» 1 27.16kb.
Методические рекомендации по публикации открытых данных государственными... 1 238.41kb.
В системы управления базами данных 1 52.4kb.
Стандарты Категория: бронирование. Стендарты-коммутатор 1 115.15kb.
Направления изучения представлений о справедливости 1 202.17kb.

Метаданные описание пространственных данных … Введение … Общие сведения … Организационные - страница №1/1

Глава 3
Метаданные – описание пространственных данных



Введение



Общие сведения



Организационные аспекты



Уровни метаданных



Связи между пространственными данными и метаданными



Стандарты метаданных

Зачем нужны стандарты?


В идеале, структуры метаданных и их определения должны определяться соответствующим стандартом. Одним из важных преимуществ стандартов является то, что они разрабатываются в результате обсуждений и консультаций с разными группами экспертов. Это обеспечивают базу для разработки национальных и отраслевых нормативных документов. По мере того, как стандарты принимаются все более широким сообществом, разрабатываются и программы, призванные помочь производству в их внедрении. Последовательность и логичность формы и содержания метаданных должны гарантировать простой и надежный анализ пригодности данных из различных источников для решения стоящих перед пользователем задач. Это означает, что при сравнении, к примеру, метаданных о недвижимости и ущербе от бедствий должны иметься сведения о датах, когда такая информация была собрана или обновлена; или, например, - метаданные различных карт содержат также указание их масштабов. Без введения стандартов надежный поиск и анализ нужной информации будет сложно выполнять без изучения различных стилей составления метаданных.

Предсказуемость результатов поиска также обеспечивается через соблюдение стандартов. Проблема, однако, состоит в том, что несколько стандартов уже либо приняты, либо находятся на стадии разработки. Детализированные стандарты метаданных, обеспечивающие исчерпывающее определение всех аспектов различных типов геопространственных данных, создаются в настоящее время рядом организаций. Идет также и разработка концепций моделей стандартов, которые будут обсуждаться для использования в международном масштабе.


Стандарты геопространственных метаданных


Широкая дискуссия среди специалистов по всему миру относительно метаданных и их характеристик должна привести к более совершенным методам описания наборов данных. Созданы рабочие группы, проводятся специальные семинары и конференции, уже издан ряд документов, сформированных по результатам обсуждений. Новые стандарты были также выпущены рядом организаций, они призваны гарантировать единообразие и последовательность метаданных в пределах сферы конкретных приложений.

Уже действуют или находятся на стадии разработки три основных стандарта метаданных, которые имеют международный уровень и широкий спектр применения. В них подробно прописаны все уровни метаданных, описанных выше в данной книге.

1. Content Standard for Digital Geospatial Metadata (Стандарт содержания метаданных цифровой геопространственной информации) - США 1994, 1998. Стандарт был принят в 1994 году и в 1998 году обновлен Федеральным комитетом США по географическим данным (FGDC: http://www.fgdc.gov/). Это стандарт метаданных для геопространственной информации был разработан и одобрен как национальный, он предназначен для обеспечения развития национальной инфраструктуры пространственных данных. Он принят и применяется в Канаде и Великобритании через национальную инфраструктуру географических данных (NGDF, в настоящее время AGI), а также используется в поисковых системах ЮАР, в сетях обмена данными в Латинской Америке и в Азии.

2. CEN Pre-standard, принятый в 1998 году Европейским комитетом по стандартизации CEN (http://forum.afnor.fr/afnor/WORK/ AFNOR/GPN2/Z13C/indexen.htm). В 1992 году при этом комитете был создан технический подкомитет TC 287, ответственный за разработку геоинформационных стандартов. Группа европейских проектов стандартов уже принята, включая ENV 12657 (Euro-Norme Voluntaire): «Географическая информация: Описание данных – Метаданные». Подкомитет TC 287 возобновил свою работу в 2003 году для разработки европейских вариантов стандартов ISO TC 211. Ряд национальных и региональных инициатив был также посвящен созданию стандартов метаданных. К их числу относятся проект для Австралии и Новой Зеландией под эгидой межправительственного совета ANZLIC и два уже завершенных проекта (LaClef и ESMI), которые финансировались европейским сообществом, и результаты которых уже используются в проекте INSPIRE. Во всех этих проектах применялись аналогичные подходы к определению необходимого состава метаданных, призванных обеспечить, как минимум, повысить уровень информирования о наличии и доступности ресурсов геопространственных данных.

3. Стандарты ISO 19115 (принят как международный) и ISO 19139 (проект). Стандарты ISO для метаданных были обнародованы и одобрены в 2003 г. (http://www.isotc211.org) 1. Эти стандарты создавались на основе мнений и предложений от национальных агентств и опыта использования ими различных стандартов метаданных и программ для создания метаданных. Как выяснилось, большинство уже существующих стандартов имеют много общего между собой, а подробное обсуждение их на международном уровне должно гарантировать, что в стандартах ISO будет учтено большинство различных уже действующих стандартов. ISO 19115 содержит описание логической модели организации геопространственных метаданных, но не предусматривает строгого соблюдения, поскольку не содержит никаких обязательных тестов на соответствие ему форматов метаданных, включенных в этот стандарт. Технические требования проекта ISO 19139 призваны стандартизировать метаданные, отвечающие требованиям ISO 19115, а также использующие кодировку XML и логическую модель UML по стандарту ISO 19115. В Северной Америке ведутся работы по созданию Североамериканской структуры метаданных, основанных на ISO 19139, для Канады, США и Мексики. При этом предусмотрено тестирование файлов метаданных, созданных с помощью XML, на соответствие этим стандартам.

Метаданные также являются важной частью технических требований, разрабатываемых консорциумом OpenGIS. Этот консорциум (OGC: http://www.OpenGIS.org) представляет собой международное объединение предприятий и организаций, имеющее задачей координацию усилий в направлении создания открытых технических требований к компьютерным системам в области обработки геопространственных данных. Для проекта «OpenGIS Abstract Specification» этого консорциума частично принят стандарт ISO 19115 в качестве абстрактной модели управления метаданными. Консорциум OGC тесно сотрудничает с комитетом FGDC и рабочей группой ISO/TC 211 в плане разработки формализованных глобальных стандартов для метаданных геопространственной информации. На совещании, прошедшем в марте 1999 года в Вене, группа ISO TC/211 объявила об успешном завершении совместных работ с консорциумом OpenGIS. Были также намечены направления будущего сотрудничества.

Каждая из инициатив в области стандартизации предлагает свои методы создания и использования метаданных для поиска нужной информации, в том числе и с помощью каталогов. Они призваны обеспечить достаточную для исполнения запроса информацию, то есть давать возможность установить, насколько найденные данные отвечают требованиям задачи, которую пользователь должен решать, и содержат ли они ссылки на другие, более детальные информационные ресурсы, поскольку часто встречаются ситуации, когда после обнаружения нужного информационного ресурса выясняется, что необходимы более подробные метаданные. Вполне возможно, что может потребоваться и разработка метаданных на дополнительных уровнях - одни из них будут предназначены для внешнего, а другие - для внутреннего использования с соответствующими степенями детальности. Для исключения дублирования операций общедоступные элементы обычно помечают специальным флажком. Описанные руководящие принципы были разработаны с учетом важности максимально информативных метаданных, необходимых для общей организации данных, - поэтому практически все организации заинтересованы в принятии стандартов ISO для метаданных.

Общие стандарты метаданных


Существует ряд других стандартов для более широкой сферы метаданных, которые не обязательно связаны с геопространственной информацией. Мы кратко рассмотрим их только в информационных целях. Приведенные ниже сведения могут оказаться полезными для связи с ресурсами, которые не являются геоинформационными, или для интегрирования их в геопространственные структуры.

Так называемое Дублинское ядро (Dublin Core) представляет собой набор элементов метаданных, который призван облегчить поиск электронных ресурсов. Изначально задуманный как средство для авторского описания ресурсов в глобальной сети, этот стандарт привлек внимание сообщества работников музеев, библиотек, правительственных агентств и коммерческих организаций.

В серии семинаров, проведенных дублинской группой, приняли участие многие специалисты библиотечного дела, администраторы сетевых и цифровых библиотек, а также ряд специалистов других отраслей. Одним из основных достоинств этой инициативы можно считать достижение междисциплинарного и международного консенсуса по поводу основного набора необходимых элементов. Это продемонстрировало постоянно растущее понимание важности полноценного описания ресурсов. Основные метаданные, предложенные дублинской группой, предназначены для поддержки поиска информации в ресурсах общего назначения. Элементы таких метаданных представляют собой «основные» элементы, которые вероятнее всего будут полезны для выполнения поиска. К сожалению, формальное применение дублинской модели метаданных не всегда поддерживает применение таких важных квалификационных признаков как, например, зона охвата. Элемент метаданных может содержать текстовую информацию о дате или периоде времени, описание географического объекта или периода времени, либо координаты, но без каких-либо средств для определения того, какой тип содержания присутствует в текстовом элементе. Кроме того, в дублинской модели неквалифицированные элементы не дают возможности адекватного описания основных геопространственных ресурсов для их поиска, хотя они могут вполне успешно использоваться в сетевых и библиотечных ресурсах без геопространственного контекста. Квалификационные признаки в дублинской модели могут быть получены на основе более детальных моделей метаданных (типа ISO 19115) и служить для поддержки поиска в глобальной сети книг и других публикаций, потенциально представляющих интерес для геопространственного анализа при наличии хотя бы минимально документированной вспомогательной информации.

Стандарт обмена пространственными данными (SDTS) и стандарт обмена векторными данными формата VPF (DIGEST) были разработаны для кодирования наборов цифровых пространственных данных, призванного обеспечить обмен пространственными данными между различными программными системами. Оба эти стандарта поддерживают включение элементов метаданных в обменный поток, но, к сожалению, только недавно их разработчики задумались о необходимости поддержки при стандартизированном кодировании соответствующих стандартов метаданных геопространственной информации для экспорта или архивирования.

Хотя имеется ряд стандартов метаданных общего назначения, для документирования геопространственных данных представляется необходимым использовать всесторонний стандарт метаданных для геопространственной информации. Создать упрощенные метаданные на основе богатого набора метаданных не очень сложно, но невозможно сделать обратное???. В конечном итоге, интегрирование содержания данных и обменных стандартов будет объединяться с такими же операциями над метаданными, что даст возможность получить полноценное решение для кодирования, архивирования и документирования пространственных данных.

Аспекты реализации

Кто должен создавать метаданные?


Администраторы данных, как правило, являются технически очень грамотными специалистами в своей области и в области компьютерных технологий. Создание метаданных можно вполне уподобить разработке и ведению библиотечных каталогов, но разработчик метаданных должен иметь более высокий уровень научной подготовки для адекватной оценки информации, содержащейся в данных, чтобы должным образом документировать их. Не следует думать, что любой администратор охотно возьмется за такую работу. Они могут ссылаться на то, что требования слишком жесткие, и вообще непонятно, какие выгоды могут принести его усилия. В подобных случаях, необходимо обеспечить хороший контакт и взаимопонимание между разработчиком метаданных и поставщиком данных.

Конкретная форма ведения метаданных зависит от ряда факторов:



  • Объем данных

  • Размеры компании

  • Особенности организации работы с данными в компании.

Если объемы метаданных в компании небольшие, то вполне разумно хранить их в отдельных документах, используя для этого наиболее подходящие программы (текстовые процессоры, электронные таблицы или простые системы ведения баз данных). Обычно создаются папки с отдельными документами в бумажном или цифровом виде. Однако многие организации рассматривают использование более современных систем, поскольку уже осознали важность метаданных для управления информацией и расширения своего бизнеса.

В большинстве таких организаций работы начинаются с капитальной ревизии архивов своих данных для оценки их важности, сферы и характера применения, выявления дублированных наборов и степени их актуализации. По мере роста объема данных и внедрения распределенного доступа к ним, предприятия начинают искать более совершенные методы управления метаданными для своих фондов. С этой целью могут применяться готовые или самостоятельно разработанные программные средства, которые могут включаться в геоинформационные системы для автоматического извлечения из самих данных необходимых для создания метаданных сведений.

Но как все же быть с теми, кто жалуется на слишком большие трудности создания метаданных? Решение этой проблемы в большинстве случаев сводится к перестройке производственных процессов, а не к разработке новых инструментальных средств или переподготовке персонала. Распространено мнение, что создатели данных должны сами генерировать метаданные. Спору нет, они действительно предоставлять определенную документацию, но вовсе не обязаны создавать строго структурированные метаданные по какому-либо стандарту. Специалистам, которые создают всего пару-тройку наборов данных в год, просто нет смысла тратить время на изучение стандартов метаданных. Вместо этого, они вполне могут составить более-менее простую форму для представления администратору данных или менеджеру каталога, которые знакомы с назначением данных и разбираются в стандартах метаданных. Если двадцать-тридцать исследователей будут ежегодно передавать свои данные администратору, то ему стоит потратить свое время на более глубокое изучение стандартов метаданных. При хорошем взаимопонимании сторон такая стратегия способна успешно дополнить существующий комплекс программных средств и обучения персонала.

Обычно, самый первый задокументированный набор данных является и самым неудачным. Одной из причин для утверждений типа «все это слишком нудно и трудоемко» является то, что при документировании наборов данных часто выясняется, что слишком мало известно о предыстории их обработки.

«Нет на это времени» - тоже обычная жалоба в подобных ситуациях. В этом случае менеджеры, занимающиеся оценкой важности наборов ГИС-данных, для защиты корпоративных инвестиций в эти данные должны более четко спланировать работу, предусмотрев достаточное время на их документирование. Один-два дня едва ли покажутся неразумной тратой времени на оформление данных, сбор которых мог занимать месяцы или даже годы и стоить тысячи долларов.

Конечно, вопросы, связанные с трудоемкостью и нехваткой времени, имеют под собой определенную основу, особенно для тех компаний, которые располагают сотнями наборов данных в своих архивах, которые надо бы задокументировать, но для этого придется отвлекать людей от выполнения текущих проектов. В подобных ситуациях представляется более предпочтительным выделить время на создание минимальных метаданных для большого количества наборов данных, чем иметь гораздо меньшее число наборов с полноценными метаданными. Какой же состав минимальных метаданных можно порекомендовать в таких случаях, и какие средства применить для быстрого их создания?

Иногда некоторые сведения (комментарии) собираются в ходе обработки данных. Позднее их можно использовать для составления описания хронологии и процессов обработки данных. Это позволяет не тратить много времени на документирование по завершении проекта, поскольку основные, пусть и минимальные, сведения будут уже подготовлены. Многие современные программы обработки аэрокосмических снимков и ГИС-информации дают возможность создавать и оформлять количественные метаданные с большей точностью и скоростью, чем вручную. Применение таких утилит позволяет достигать значительной экономии времени и усилий по единственному справочнику подготовка метаданных обрабатывает при заключении проекта.

Не изобретайте свой собственный стандарт. Гораздо лучше опираться на уже принятые стандарты везде, где это возможно, не выходя за их рамки. Даже небольшие отклонения от стандартов могут слишком дорого обойтись в дальнейшем, поскольку будет невозможно использовать инструментальные средства для работы с метаданными, а сами они не смогут передаваться в другие системы или анализироваться вашим же программным обеспечением.

Не путайте представление метаданных с самими метаданными. Всегда есть соблазн свалить в одну кучу форму и содержание (например, под лозунгом «Что я вижу в моей базе данных – это и есть то, что будет на выходе»). В современных ГИС-приложениях четко различаются содержание баз метаданных (столбцы или поля) и их представление (отформатированные по стандарту данные). Это позволяет пользователям определить, как можно более гибко представить конкретную информацию.

Наиболее распространены три вида метаданных, признанных и поддерживаемых в современных системах, которые отличаются: (1) формой реализации - в рамках базы данных или программной системы, (2) форматом экспорта или кодирования - для обмена метаданными между компьютерами) и (3) формой представления – для операторов. На основе грамотного использования связей между этими видами метаданных можно создавать системы, отвечающие требованиям выполняемого проекта, поддерживающие стандартное кодирование для целей обмена данными и обеспечивающие просмотр метаданных с различных точек зрения.

Язык XML предлагает два средства решения этой проблемы. Во-первых, он обеспечивает мощные инструменты маркирования данных по строгим структурным правилам, реализуемые через специальный файл, который служит для проверки корректности структуры документа. Во вторых, производный от XML язык XSL дает возможность использовать XML-документы вместе с таблицами стилей для создания стандартизированного представления содержания данных, позволяя пользователю менять порядок информационных полей и теги, а также маскировать ненужные поля. Возможность совместного использования XML и таблиц стилей позволяет работать со структурированными обменными форматами и создавать более гибкие формы представления данных. Это дает возможность использовать различные способы работы с метаданными, созданными на базе единого структурного кодирования.

Язык XML является международно-принятым методом кодирования. Он поддерживается большинством программных систем, как бесплатных, так и коммерчески доступных. К сожалению, большинство поставщиков данных до сих пор не имеют достаточных навыков его использования. Обмен опытом работы в данной области способен помочь внедрению этой новой технологии в интересах всего ГИС-сообщества.



Проанализируйте степень неоднородности данных. Следует ли документировать большинство ваших наборов данных в произвольном порядке? Расположите ваши данные по приоритетам. Начните работу с тех наборов данных, которые уже используются или будут использоваться в ближайшем будущем, а также с наборов данных, служащих основой для других наборов, и с тех, которые для вашей компании представляют наибольшую ценность с точки зрения их стоимости и средств, вложенных в их создание.

Помните о том, что грамотная документация сохраняет ценность данных для вашей компании. Следует подумать о том, какая информация должна быть известна о ваших наборах данных, если вдруг один из ведущих ГИС-специалистов компании решит резко изменить свой образ жизни и уедет жить на дикий тропический остров.

Как создаются метаданные


Прежде всего, нужно иметь четкое понимание данных, которые будут документироваться, и разбираться в стандартах, которые будут использоваться для создания метаданных, а также выбрать метод кодирования информации. Обычно для каждой записи метаданных создается отдельный текстовой файл, то есть один файл метаданных для набора данных. Чаще всего для ввода информации применяется определенная программа, которая обеспечивает соответствие новых метаданных стандартам. Порядок действий, как правило, таков:

  • Выбор наборов данных для их документирования.

  • Сбор всех сведений об этих наборах.

  • Создание цифрового файла метаданных, используя по возможности стандартные форматы.

  • Проверка и корректировка синтаксической структуры файла.

  • Просмотр содержания метаданных для определения того, насколько полно и корректно информация описывает данные.

Отклонения от стандартов и условия взаимосовместимости


Различные стандарты метаданных являются на самом деле стандартами содержания. Они не диктуют порядок размещения метаданных в компьютерном файле. Так как эти стандарты достаточно комплексны, то практически любые метаданные могут считаться концептуально соответствующими стандарту. Файл с метаданными должен только содержать соответствующую информацию, и вовсе не обязательно, что эта информация должна легко интерпретироваться или читаться человеком и даже компьютером. Так обстоит дело даже со стандартом ISO 19115!

Конечно, столь широкое толкование часто приводит к проблемам. Для того чтобы конкретные метаданные были действительно полезны, должна быть обеспечена возможность сопоставления их с другими метаданными, не только в визуальном плане, но и с помощью программ, которые позволяют индексировать документы в Интернете, выполнять их поиск и загрузку. В этом контексте следует упомянуть несколько стандартов кодирования, которые определяют содержание метаданных для осуществления обмена данными между компьютерами. Метаданные должны быть доступными для анализа компьютерными средствами и отвечать требованиям совместимости, то есть быть доступными для интерпретации с помощью программ, которые, например, применяются в таких системах как FGDC Clearinghouse на базе OpenGIS Catalogue Services. К счастью, Технические требования ISO 19139 описывают нормативный подход в форме аннотируемого XML-документа (XSD) и содержат указания относительно того, как метаданные должны быть структурированы в XML-документе для проверки их корректности и выполнения обменных операций.


Синтаксичность


Под этим мы понимаем возможность разбиения информации на ее элементы и распознавания этих компонент. Метаданные, отвечающие этому требованию, позволяют отличать сведения, связанные с каждым компонентом, от информации, имеющейся в других элементах. Более того, значения элементов не только отделены друг от друга, но и четко связаны с названиями соответствующих элементов, а названия элементов связаны между собой, поскольку они соответствуют стандарту.

На практике это означает, что, как правило, метаданные иерархически упорядочены, их элементы отвечают стандартам, а их названия должны использовать стандартизированные имена для обеспечения однозначной идентификации сведений, содержащихся в значениях компонента.


Взаимосовместимость


Для успешного использования программ создания и обработки метаданных, они должны быть доступны для считывания этими программами. В целом это означает, что они должны быть анализируемы, и допускать идентификацию их элементов тем способом, который предусмотрен в конкретной программе.

В настоящее время общепринятым считается подход, при котором метаданные должны в среде XML конвертироваться в формат DTD (Document Type Declaration) или, точнее говоря, - в структурированный XML-документ. Поддержка операций анализа метаданных и их представления в XML широко используется в Интернете и учитывается в проектах технических требований ISO/TC 211 и OpenGIS.


Программное обеспечение для создания метаданных и контроля их корректности


Следует сразу сказать, что никакие программные средства не могут исчерпывающе проверить точность метаданных. Кроме того, не могут они определить, корректно ли прописаны в метаданных элементы, которые по стандарту должны маркироваться как «условные» или «обязательные, если это применимо». По этой причине необходимо, чтобы метаданные мог просматривать и оператор. Этот просмотр в значительной степени облегчается в тех случаях, когда известно, что метаданные имеют корректную синтаксическую структуру.

Само программное обеспечение нельзя упрекнуть в том, что оно не отвечает стандартам. А вот к метаданным требование соответствия стандартам вполне применимо. И если уж программа заявлена как отвечающая стандарту, то она не должна выдавать результаты, которые не стандарту не соответствуют. Такая программа должна была бы быть способна работать со всеми возможными наборами данных. Тем не менее, программные средства могут оказать помощь при вводе метаданных, а также при проверке результатов на соответствие и точность на отдельных этапах, но в лучшем случае можно ожидать только совместимости программных модулей.


Аспекты реализации

Словари, указатели и тезаурусы


При поиске информации может оказаться так, что не удается подобрать ключевые слова для поиска нужных сведений. Эту проблему можно решить с помощью тезауруса. В контексте метаданных и других электронных документов, тезаурус представляет собой инструмент для выполнения запросов в электронных информационных ресурсах. Это позволяет индексировать данные и обеспечивать логичный доступ к ним, а также просматривать иерархию понятий и идей, способствовать поиску через индексы или ключевые слова, который должен привести к отысканию нужной информации.

Тезаурусы позволяют расширить рамки поиска с помощью синонимов, Например, если задано ключевое слово «фермерство», то будет найден и термин «сельское хозяйство». Могут быть показаны и иерархии понятий. Термин «Великобритания» будет, помимо прочего, связан с Англией, Уэльсом и Шотландией, которые были индексированы согласно этим трем терминам. Непротиворечивый поиск метаданных вполне возможен, если все те, кто готовил их, использовали один и тот же тезаурус.


Необходимость сотрудничества с пользователями на этапах определения и реализации


Для непрофессионального пользователя отыскание нужных данных может представлять собой весьма сложную задачу. Даже наличие разделов «Справка» или «Обучение» в некоторых программах работы с метаданными не всегда помогает. По этой причине требуется хорошо продумать дружественный многоязычный интерфейс, чтобы пользователям было интуитивно понятно, что можно запросить, и каким образом это можно сделать. Если на то, чтобы понять, как использовать сервис метаданных, требуется слишком много времени, пользователи будут просто разочарованы и оставят свои попытки! Словарь, многоязычный тезаурус или каталоги ключевых слов должны предоставляться в их распоряжение, чтобы гарантировать применение одной и той же терминологии. Одной из наиболее важных задач состоит в разработке таких сервисных систем, которые не будут зависеть от применяемых технологий. Проекты желать выполнять в сотрудничестве с будущими пользователями (правда, надо еще определить их круг).

Что нужно пользователям?


Поскольку все чаще разрабатываются комплексные модели метаданных, то резонно считать, что каталогизированные метаданные способны на большее, чем от них ожидает конечный пользователь. Судя по всему, современные тенденции направлены на разработку комплексного подхода к базам данных, ориентированного скорее на производителя данных. Пользователи же больше заинтересованы в примерах того, какие выгоды можно извлечь из наборов данных, чем в слишком детальном описании их структуры и содержания. Это может быть реализовано с помощью хорошо продуманных форм представления метаданных.

Важно также отделить содержание пространственных метаданных от способов их представления. С помощью языка XML можно представить в самых разных формах документы большой детальности, используя различные таблицы стилей для одного и того же источника содержания. Требуются дальнейшие исследования по методологии представления данных с целью облегчить понимающих метаданных всеми пользователями.


Метаданные для приложений


Наблюдается также тенденция к адаптации структур и содержания метаданных к определенным сферам их применения, например, для электронных продаж данных или для ведения корпоративных баз. Метаданные, которые созданы для удовлетворения реальных потребностей, в отличие от тех, которые создаются для весьма общих целей, будут, скорее всего, лучше составлены и надежнее поддерживаться.

Консорциум OpenGIS и ISO/TC 211 разработали структуры метаданных и поля для описания программных интерфейсов, анонсированные как «сервис» для внешнего использования. В ISO 19119 описана структура для сервиса метаданных, призванная способствовать разработке развитых программных средств, которые используют так называемые службы каталогов, выявлению доступных услуг, которые, в конечном счете, можно было бы связать друг с другом для формирования новых комплексных систем. Консорциум WWW и группы XML Oasis выработали требования для служб и механизмов поиска ресурсов и доступа к ним, которые используют обычные поля наборов метаданных. Можно отметить два результата их усилий: ebXML с моделью регистрации информации (ebRIM) и UDDI (универсальное описание, поиск и интегрирование веб-услуг. Взаимодействие между ebXML и метаданными ISO обеспечивается с помощью интерфейсов обслуживания каталогов OGC версии 2.0.


Механизм идентификации географических информационных продуктов


На данный момент нет никакого готового механизма, обеспечивающего присвоение идентификаторов различным геоинформационным продуктам. Вообще, это серьезная проблема для тех, кто занимается разработкой систем обслуживания метаданных и решений для электронных продаж данных.

Для того чтобы создать систему электронных продаж геоинформационных продуктов необходимо решить, как организовать их индексацию и кто должен этим заниматься. Такая система может быть аналогична тем, которые применяются для других продуктов, например, книг. Представляется очень полезным, если бы инициативы по созданию глобальной инфраструктуры пространственных данных смогли привести к разработке основных направлений решения технических и политических проблем, связанных с определением системы идентификаторов для ГИС-данных, которая была бы способна работать глобально для цифровой и нецифровой геопространственной информации.


Стимулы для создания метаданных


Федеральный комитет США по географическим данным (FGDC - http://www.fgdc.gov) разработал внушительный список факторов, стимулирующих процессы создания и сопровождения метаданных, включая финансовые, научно-исследовательские и образовательные аспекты, стандарты и инструментальные средства в рамках концепции Центра обмена информацией (Clearinghouse). Эти факторы и стали ключом к успеху американской инициативы по метаданным. Важно, чтобы национальные и региональные органы власти осознали, оценили и обеспечили предпосылки для стимулирования разработчиков метаданных и администраторов баз данных. В Соединенных Штатах, во Франции, Канаде, Австралии, Испании и ряде других стран разрабатываются и бесплатно распространяются программы создания метаданных. Ожидается, что широкое внедрение стандартов метаданных ISO 19115/19139 будет способствовать развитию международного архива бесплатных и коммерческих программ, основанных на общих стандартах.

Законодательные аспекты содержания метаданных для общественного сектора


В тех странах, где законодательство является основным фактором, определяющим создание новых или адаптации уже существующих видов общественных услуг, может потребоваться принятие новых законов для организации сбора и распространения основанных на стандартах метаданных силами государственных и частных предприятий, занятых сбором геопространственных данных для общественного сектора.

Рекомендации


  • Авторы рекомендуют не разрабатывать собственные стандарты метаданных. Лучше принять или адаптировать к национальным условиям техническую спецификацию ISO 19139, основанные на абстрактной спецификации ISO 19115.

Разработка стандартов и их внедрение – это весьма дорогостоящее мероприятие. Оптимальным представляется принятие национальных стандартов, базирующихся на стандарте ISO 19115 для содержания метаданных и Технических требований ISO 19139, когда они будут окончательно утверждены. Это обеспечит максимальную совместимость данных в глобальном масштабе.

  • Советуем установить приоритеты для документирования ваших данных.

Начните с создания метаданных для тех наборов данных, которые уже используются или будут использоваться в ближайшем будущем, для наборов на которых служат основой для других, а также для наборов данных, которые для компании представляют наибольшую ценность с точки зрения их стоимости и усилий, затраченных на их создание. Уровни структуры данных и специальные слои уникального содержания должны быть соответствующим образом документированы как для внутреннего пользования, так и для поставки клиентам. Конечно, необходимо документировать все имеющиеся в компании данные, но расстановка приоритетов позволит лучше оценить объем предстоящих работ по созданию метаданных.

  • Собирать метаданные лучше постепенно.

Для детальных метаданных по требованиям FGDC и ISO может быть собрано огромное количество информации. Хотя далеко не все поля в метаданных заполняются, процесс документирования обеспечивает возможность хранить определенные свойства в соответствующих им позициях стандартной структуры. Это существенно облегчает их хранение в поиск в каталогах (см. главу 4). Если некоторые типы метаданных создаются в ходе процесса сбора данных как часть выполняемых работ, то многочисленные комментарии, пусть и короткие, могут по завершении работ составить весьма солидный объем информации. Получить такой объем после того, как сбор информации завершится очень трудно, если не создавать метаданные в ходе работ.

  • Рекомендуется создание системы идентификации координированных пространственных данных для использования на глобальном уровне

Техническая рабочая группа GSDI должна разработать основные направления решения технических и политических проблем, связанных с созданием системы идентификации геопространственных продуктов, которая будет работать на глобальном уровне для цифровой и нецифровой геопространственной информации. Присвоение уникальных индексов метаданным вполне аналогично практике библиотечного дела, когда метаданные имеют свой индекс, который доступен из различных мест, откуда делается запрос.

  • Мы предлагаем провести исследования для разработки общей системы тематической классификации геопространственных данных, которые будут выполняться Технической Рабочей группой GSDI.

Хотя ISO TC 211 разрабатывает общие технические требования и методологии, а OpenGIS формирует программные интерфейсы, пока ни одна глобально признанная организация не занимается координацией работ по созданию общей системы классификации геопространственных данных. Отсутствие такой системы значительно осложняет поиск нужной информации из-за того, что существует целый ряд различающихся между собой тематических тезаурусов.

Библиография и Интернет-ссылки


Chenez, Christian and Gael Kermarrec, "On-going Metadata Initiatives in Europe", 1999, 5th EC-GIS Workshop, Stresa, ITALY: http://www.eurogi.org/geoinfo/publications/5thgeo.html

Metadata Home Page, US Federal Geographic Data Committee: http://www.fgdc.gov/metadata/metadata.html

Metadata Home Page Australia and New Zealand Land Information Council: http://www.anzlic.org.au/infrastructure_metadata.html

Metadata (MetaGenie) Home Page UK Association for Geographic Information (AGI): http://www.askgiraffe.org.uk/datalocator/metadatatool.html



Reference Data and Metadata, INSPIRE Initiative, European Commission: http://inspire.jrc.it/about/reference.cfm

1 В 1994 году в ISO была создана техническая группа 211 (ISO/TC 211) для работы в области геоинформационных технологий и геоматики. Он призван вырабатывать окончательные варианты стандартов для этой области. Была создана рабочая экспертная группа, было разработано несколько проектов, в том числе проект международного стандарта, который был впоследствии утвержден для применения. В настоящее время имеется несколько общих тем для совместных разработок консорциума OpenGIS и группы ISO/TC 211, которые будут рассматриваться как варианты Технических требований OGC для утверждения в качестве международных стандартов.





Женщина, которая раздевается публично, напоминает мне режиссера, который в самом начале фильма сообщает разгадку. Алфред Хичкок
ещё >>