Методические рекомендации 3.0
Версия от 18:32, 1 июня 2015; Azavodchikov (обсуждение | вклад)
Методические рекомендации 3.0 | |
---|---|
Полное наименование | Методические рекомендации по публикации открытых данных государственными органами и органами местного самоуправления, а также технические требования к публикации открытых данных |
Краткое наименование | Методические рекомендации 3.0 (версия документа «Методические рекомендации») |
Уровень документа | Федеральный |
Принявший орган | Правительственная комиссия по координации деятельности открытого правительства |
Дата принятия | 2014/05/29 |
Реквизиты | |
Утвердивший документ | Протокол Правкомиссии по ОП от 29.05.2014 № 4 |
Тип документа | Методические рекомендации |
Область регулирования | Регулирование открытости |
Ссылка на документ | Основная ссылка Резервная ссылка |
Органы и организации, упомянутые в документе: | |
1 | Термины и определения |
¶ | Абстрактная модель - модель, отражающая общие характеристики моделируемого явления. Данный тип модели представляет информацию о качественных характеристиках моделируемого объекта или явления. |
¶ | Востребованный набор открытых данных - опубликованный набор открытых данных, пользующийся популярностью у пользователей. |
¶ | Сводный реестр наборов открытых данных - реестр, ведущийся уполномоченным органом государственной власти Российской Федерации, содержащий сведения обо всех реестрах наборов открытых данных государственных органов и органов местного самоуправления Российской Федерации, а также сведения об иных востребованных реестрах и наборах открытых данных. |
¶ | Интерфейс прикладного программирования (API) - набор готовых классов, функций, структур и констант, предоставляемых приложением (библиотекой, сервисом) для использования во внешних программных продуктах. |
¶ | Машиночитаемые данные - данные, представленные в описанном формате, позволяющем информационным системам без участия человека идентифицировать, обрабатывать, преобразовывать такие данные и их составные части (элементы), а также обеспечивать доступ к ним. |
¶ | Метаданные (метаинформация) - структурированная информация, описывающая, разъясняющая, а также позволяющая находить или иным способом упрощать извлечение, использование или управление информационными ресурсами. |
¶ | Набор открытых данных (набор данных) - совокупность однородных элементов машиночитаемых данных и описывающей их метаинформации. |
¶ | Обладатель информации - лицо, самостоятельно создавшее информацию, либо получившее на основании закона или договора право разрешать или ограничивать доступ к информации, определяемой по каким-либо признакам. |
¶ | Онтология - средство связывания атрибутов наборов открытых данных между собой, представляет собой терминологический словарь синонимов/соотношений. |
¶ | Опубликование (публикация) - размещение информации в сети «Интернет» для обеспечения доступа к ней неопределенного круга лиц. |
¶ | Открытые данные - информация, размещенная в сети «Интернет» в виде систематизированных данных, организованных в формате, обеспечивающем ее автоматическую обработку без предварительного изменения человеком, в целях неоднократного, свободного и бесплатного использования. |
¶ | Открытые государственные данные - открытые данные, опубликованные государственными органами, их территориальными органами, органами местного самоуправления или организациями, подведомственными государственным органам, органам местного самоуправления. |
¶ | Ответственный представитель за публикацию открытых данных (ответственный за публикацию, публикатор) - должностное лицо, уполномоченное представлять государственный орган или орган местного самоуправления по вопросам публикации открытых данных. |
¶ | Паспорт открытых данных - совокупность сведений о наборе открытых данных, необходимых для установления факта принадлежности набора открытых данных к той или иной тематической рубрике, его потенциальной пригодности для решения задач потребителя, а также установления адреса размещения, способа загрузки и последующей автоматической обработки набора открытых данных. |
¶ | Потребитель открытых государственных данных (конечный потребитель) - субъект российской или международной юрисдикции, имеющий намерение и полное право использовать Открытые государственные данные в соответствии с Открытой Лицензией. |
¶ | Портал открытых данных Российской Федерации - комплексная государственная информационная система, которая реализует функцию предоставления неограниченному кругу лиц доступа к реестру наборов открытых данных органов государственной власти Российской Федерации, органов местного самоуправления и организаций, действующих на территории Российской Федерации, а также иные функции, обеспечивающие реализацию политики Российской Федерации в области публикации открытых данных. |
¶ | Портал открытых данных государственного (муниципального) органа - информационная система, которая реализует функцию предоставления неограниченному кругу лиц доступа к реестру наборов открытых данных соответствующего органа государственной власти Российской Федерации или органа местного самоуправления, действующего на территории Российской Федерации, а также иные функции, обеспечивающие реализацию политики Российской Федерации в области публикации открытых данных. |
¶ | Раздел открытых данных на официальном сайте - раздел сайта официального органа государственной власти или органа местного самоуправления по вопросам публикации открытых данных. |
¶ | Реестр наборов открытых данных - систематизированный перечень наборов открытых данных, позволяющий в автоматическом режиме осуществлять навигацию по наборам открытых данных и получать ключевые параметры этих наборов, включая гиперссылки, необходимые для доступа к наборам открытых данных. |
¶ | Реестр наборов открытых данных государственного органа или органа местного самоуправления - реестр наборов открытых данных, включающий сведения о наборах открытых данных соответствующего государственного органа или органа местного самоуправления. |
¶ | Связанные данные (Linked Data) - метод публикации структурированных данных, предусматривающий стандартизированное именование и связывание данных в целях обеспечения автоматической идентификации, обработки и преобразования информационными системами, соответствующий принципам связывания данных. |
¶ | Совет по открытым данным - рабочая группа при Правительственной комиссии по координации деятельности открытого правительства, созданная по решению Правительственной комиссии по координации деятельности открытого правительства от 28 февраля 2013 г. (протокол № 1). |
¶ | Специфические типы данных - данные, публикуемые в виде открытых данных, содержащие особенности в части использования узкоспециализированных справочников, онтологий и классификаторов, которые необходимо публиковать в виде открытых данных и/или указывать ссылки их публикации. |
¶ | Система управления содержимым (CMS) - информационная система, используемая для обеспечения и организации совместного процесса создания, редактирования и управления содержимым сайта (например, Joomla, WordPress, Drupal). |
¶ | CSV - (Comma-Separated Values — значения, разделенные запятыми) — текстовый формат, предназначенный для представления табличных данных. Каждая строка файла — это одна строка таблицы. Значения отдельных колонок отделяются друг от друга установленным в системе разделительным символом (delimiter). |
¶ | HTML+Microdata - Микроданные (англ. microdata) — совокупность методов семантической разметки данных с использованием элементов языка HTML. Обеспечивает возможность автоматического считывания включенной в HTML-документ атрибутивной информации при сохранении стандартной функциональности (визуального просмотра документа с использованием браузера). |
¶ | HTML+RDFa - (RDF in attributes) — запись внутри атрибутов произвольного HTML- документа. Пользователь-человек может воспринимать размеченную страницу как обычную веб-страницу (через браузер); в то же время программы-обработчики способны извлечь из такой страницы структурированную информацию, следуя определенным соглашениям. |
¶ | JSON - (JavaScript Object Notation) — текстовый формат обмена данными, основанный на JavaScript и обычно используемый именно с этим языком. Как и многие другие текстовые форматы, JSON легко читается людьми. |
¶ | RDF — (Resource Description Framework)8 - модель, разработанная Консорциумом Всемирной паутины (W3C) для представления данных, в особенности — метаданных. RDF представляет сведения о ресурсах в пригодном для машинной обработки виде. |
¶ | XML - (eXtensible Markup Language — расширяемый язык разметки) — язык разметки, рекомендованный Консорциумом Всемирной паутины (W3C). Спецификация XML описывает XML-документы и частично описывает поведение XML-процессоров (программ, читающих XML-документы и обеспечивающих доступ к их содержимому). |
2 | Целевая аудитория |
3 | Определение наборов открытых данных и приоритетности их публикации |
4 | Условия использования открытых данных |
4.1 | Требования к условиям использования открытых данных |
4.2 | Ограничения на использование государственной информации |
4.3 | Рекомендации по использованию открытой лицензии |
5 | Технологическая инфраструктура |
¶ | Государственная информация, подлежащая опубликованию в виде набора открытых данных или гиперссылок на соответствующие наборы данных, должна размещаться на официальных сайтах государственных органов или органов местного самоуправления, являющихся обладателями информации. Вместе с тем, существует следующий перечень возможных способов публикации наборов открытых государственных данных: |
¶ | - Обязательные способы публикации открытых данных; |
¶ | - Альтернативные (дополнительные) способы публикации открытых данных. |
5.1 | Обязательные способы публикации |
¶ | Обязательные способы публикации открытых данных предполагают использование одного из трех способов публикации: |
¶ | - через раздел открытых данных на официальном сайте государственного (муниципального) органа в сети «Интернет»; |
¶ | - через портал открытых данных государственного (муниципального) органа в сети «Интернет»; |
¶ | - через портал открытых данных Российской Федерации в сети «Интернет». |
5.1.1 | Публикация открытых данных через раздел открытых данных на официальном сайте государственного (муниципального) органа |
¶ | Данный метод является одним из наиболее простых с точки зрения Публикатора - предоставление наборов открытых данных в виде файлов для загрузки с веб-страниц. Для реализации этого выдвигается следующий список рекомендаций государственным органам и органам местного самоуправления: |
¶ | а) на официальном сайте должна быть создана специализированная страница для публикации открытых данных в машиночитаемых форматах (далее - страница открытых данных); |
¶ | б) на главной странице официального сайта должна располагаться визуально различимая гиперссылка на страницу наборов открытых данных с надписью «Открытые данные»; |
¶ | в) страница открытых данных должна содержать реестр16 наборов открытых данных, соответствующий требованиям настоящих Методических рекомендаций; |
¶ | г) для каждого опубликованного набора открытых данных на официальном сайте государственного органа или органа местного самоуправления должна быть предусмотрена прямая ссылка на набор открытых данных; |
¶ | д) в целях доступности страниц открытых данных для поисковых роботов должна быть размещена ссылка на реестр наборов открытых данных - разрешение в robots.txt, указание в sitemap.xml. |
5.1.2 | Публикация открытых данных через портал открытых данных государственного (муниципального) органа |
¶ | Данный способ представляет собой вариант развития раздела в самостоятельный портал открытых данных с необходимостью размещения расширенного реестра наборов открытых данных с классификацией размещенных данных, а также с их визуализацией. Использование портала ограничивает требования по машинному представлению реестра и паспортов наборов открытых данных в пользу свободных требований к использованию адресов паспортов наборов открытых данных и машиночитаемому представлению реестра и паспортов. В случае реализации собственного портала необходимо придерживаться следующих рекомендаций: |
¶ | а) портал открытых данных должен содержать реестр наборов открытых данных, состоящий из ссылок на отдельные страницы наборов открытых данных; |
¶ | б) портал открытых данных должен обеспечивать централизованный учет наборов открытых данных, форматов, способов хранения и использования имеющихся наборов открытых данных, единого хранилища открытых данных; |
¶ | в) портал открытых данных должен обеспечивать классификацию и поиск, предназначенный для систематизированной классификации всех собранных на портале отрытых данных. На портале должна быть реализована функция навигации по наборам открытых данных. Классификацию наборов данных на портале рекомендуется осуществлять по следующему списку параметров и их характеристик: |
¶ | - организационная структура - классификация данных по подразделениям, публикующим открытые данные на портале (департаменты, территориальные органы, подведомственные организации и другие, в зависимости от структуры государственного органа и органа местного самоуправления); |
¶ | - форматы данных - классификация по способу/форматам представляемых данных (CSV, XML, JSON, API, RDF); |
¶ | - предметная область: |
¶ | 1. по ключевым словам - классификация по перечню ключевых слов; |
¶ | 2. по тематическим разделам (список наборов высокой значимости (список разделов) представлен в Приложении 2). |
¶ | - качество данных - классификация по определенным меткам определения шкалы качества данных (например, в соответствии с пятизвездной моделью представления данных или собственной шкалой качества данных); |
¶ | - периодичность обновления и актуальность данных - оперативные данные (высокая периодичность актуализации данных - чаще, чем 1 раз в неделю), долговременные данные (реже 1 раза в неделю); |
¶ | - популярность среди потребителей данных - классификация по инструменту голосования и посещения наборов открытых данных, а также по активности обсуждения наборов открытых данных; |
¶ | - пользовательская лояльность - классификация по удовлетворенности совершенствования наборов данных на основе обратной связи с потребителями наборов открытых данных; |
¶ | г) портал должен обеспечивать информационное представление и публичный доступ к аналитической и статистической информации по открытым государственным данным гражданам, государственным и другим организациям путем предоставления информации (счетчики посещения наборов открытых данных, счетчики загрузки файлов открытых данных); |
¶ | д) портал должен содержать коммуникативную площадку или использовать коммуникативную площадку для обмена мнениями между заинтересованными потребителями открытых данных различных тематик с целью использования механизмов общественного контроля качества открытых данных в части обеспечения достоверности, полноты и актуальности открытых данных, в том числе посредством механизмов обратной связи; |
¶ | е) портал должен содержать инструменты визуализации (пример инструментов визуализации представлен в Приложении 3) размещенных наборов открытых данных на портале: |
¶ | - табличная визуализация (с возможностью построения различного рода графиков); |
¶ | - картографическая визуализация (для данных, содержащих геометки). |
¶ | ж) в целях доступности страниц открытых данных для поисковых роботов должна быть размещена ссылка на реестр наборов открытых данных - разрешение в robots.txt, указание в sitemap.xml; |
[[Методические рекомендации 3.0#5.1.2_з) рекомендуется предоставлять возможности API (спецификации в Приложении 10). Рекомендуемыми инструментами реализации собственных порталов открытых данных могут быть свободно используемые платформы данных с открытым исходным кодом - CKAN18 (Comprehensive Knowledge Archive Network) или DKAN19 (Drupal Knowledge Archive Network).|¶]] | |
5.1.3 | Публикация открытых данных через портал открытых данных Российской Федерации |
¶ | Данный способ представляет собой развитие раздела открытых данных государственного органа на платформе портала открытых данных Российской Федерации с необходимостью размещения наборов открытых данных своей организации, используя инструменты публикации и визуализации наборов открытых данных указанного портала. Использование портала не предъявляет дополнительных требований по машинному представлению реестра и паспортов наборов открытых данных, за исключением текущих правил машиночитаемости и файлового представления опубликованных наборов открытых данных, определенных настоящими Методическими рекомендациями. |
¶ | Публикация открытых данных осуществляется средствами личного кабинета портала открытых данных Российской Федерации. |
5.2 | Альтернативные (дополнительные) способы публикации открытых данных |
5.2.1 | Публикация через сайт третьей стороны |
¶ | Данный метод является предпочтительным в том случае, когда одной из целей является получение обратной связи от наибольшего числа потребителей целевой аудитории. Более того, сторонний сайт может содержать средства визуализации и иные аналитические инструменты (Приложение 3). |
5.2.2 | Публикация через ftp-сервер |
¶ | Данный метод удобен в использовании в том случае, когда целевая аудитория владеет необходимыми компетенциями для взаимодействия с наборами открытых данных описываемым методом. Также данный метод является актуальным в том случае, когда информация набора обновляется с высокой периодичностью, либо когда для таких наборов открытых данных необходимы значительные ресурсы для их перемещения и/или хранения. |
5.2.3 | Публикация через файлообменный протокол BitTorrent |
¶ | Данный метод является одним из наиболее подходящих альтернативных способов в том случае, когда размеры наборов открытых данных значительны. Более того, сама идеология торрент-систем подразумевает увеличение предложения пропорционально уровню спроса на скачиваемые наборы, поскольку система торрентов путем диверсификации минимизирует риски перегруженности сервера (что не исключается в случае ftp-сервера). |
6 | Порядок публикации наборов открытых данных |
7 | Требования к публикации реестра наборов открытых данных |
7.1 | Общие требования к публикации реестра наборов открытых данных |
7.2 | Требования к публикации реестра наборов открытых данных через раздел открытых данных на официальном сайте государственного (муниципального) органа в сети «Интернет» |
7.3 | Требования к публикации через портал открытых данных государственного (муниципального) органа |
7.4 | Требования к публикации через портал открытых данных Российской Федерации |
8 | Требования к публикации набора открытых данных |
8.1 | Общие требования к публикации набора открытых данных |
8.1.1 | Публикация метаинформации набора открытых данных |
8.1.1.1 | Публикация паспорта набора открытых данных |
8.1.1.2 | Публикация структуры набора открытых данных |
8.1.1.3 | Публикация другой информации, описывающей набор открытых данных |
8.1.2 | Машиночитаемое представление открытых данных |
8.1.3 | Человекочитаемое представление открытых данных |
8.1.4 | Требования к архивированию открытых данных |
8.1.5 | Частота обновления набора данных |
8.2 | Требования к публикации набора открытых данных через раздел открытых данных на официальном сайте государственного (муниципального) органа в сети «Интернет» |
8.3 | Требования к публикации набора открытых данных через портал открытых данных государственного (муниципального) органа в сети «Интернет» |
8.4 | Требования к публикации набора открытых данных через портал открытых данных Российской Федерации |
8.5 | Дополнительные требования к наборам открытых данных со специфическими технологическими особенностями в части хранения, описания и представления |
9 | Приложение 1. Концептуальное представление связей между метаданными, данными и онтологиями |
10 | Приложение 2. Классификация типов открытых данных |
11 | Приложение 3. Рекомендуемые инструменты визуализации |
12 | Приложение 4. Требования к семантическому представлению реестра и паспорта набора открытых данных |
13 | Приложение 5. Исходный пример материала для публикации в виде открытых данных |
14 | Приложение 6. Визуальное представление паспорта набора открытых данных |
15 | Приложение 7. Требование к представлению реестра наборов открытых данных |
16 | Приложение 8. Требование к представлению паспорта набора открытых данных |
17 | Приложение 9. Требование к представлению открытых данных |
18 | Приложение 10. Методические рекомендации по инструменту доступа к открытым данным (API) |