Пятизвездочная модель зрелости открытых данных
Пятизвездочная модель зрелости открытых данных (модель зрелости инфраструктуры открытых данных, модель Тима Бернерса Ли или модель TBL) была предложена Тимом Бернерсом Ли для оценивания степени соответствия инфраструктуры публикации и/или опубликованного набора данных требованиям, предъявляемым к ним в концепции семантического веба данных (Интернета данных).
Концепция семантического веба данных в качестве идеального варианта хранения данных и доступа к ним рассматривает вариант, когда каждый элемент данных, вне зависимости от места его хранения, может быть вовлечен в обработку в произвольном узле сети Интернет. Для этого элементу данных присваивается уникальное имя, состоящее из имени узла сети, имени информационного ресурса на этом узле и имени элемента данных. При этом элемент данных сопровождается метаданными – служебными данными, необходимыми для последующей автоматической, автоматизированной или ручной обработки и/или интерпретации описываемых данных.
Такая модель хранения и организации данных позволяет, не дублируя данные, не порождая проблем, связанных с существованием множества не всегда актуальных копий меняющихся информационных ресурсов, вовлекать такие данные в обработку из произвольного узла сети Интернет, так, как если бы это была локальная переменная или элемент данных.
★ Первый уровень | Сведения доступны в сети Интернет в произвольных форматах, в сопровождении декларации правового статуса открытых данных (открытой лицензии или лицензии открытых данных) |
★★ Второй уровень | Данные доступны в Интернет в машиночитаемых форматах, обеспечивающих возможность их использования без существенных трудозатрат (например, электронная таблица MS Excel вместо графической копии документа) |
★★★ Третий уровень | Аналогично 2★, но уже в некоммерческом формате (например, *.CSV вместо *.XLSX, *.ODT вместо *.DOCX, ODP вместо PPTX и т.п.) в сопровождении лицензии открытых данных или текста ее замещающего |
★★★★ Четвертый уровень | Аналогично 3★, но уже на основе использования стандартов W3C (RDF и SPARQL) с использованием уникальных идентификаторов данных, используя которые, пользователи могли бы ссылаться на данные через сеть Интернет |
★★★★★Пятый уровень | Аналогично 4★, но уже с указанием связей с контекстом и возможностью контекстного включения данных, снабженных идентификаторами, в данные, предоставляемые другими поставщиками Интернет-контента |
В настоящее время высшим уровнем зрелости открытых данных / инфраструктуры открытых данных сегодня принято считать пятый уровень. Соответствие открытых данных / инфраструктуры открытых данных требованиям, предъявляемым к пятому уровню зрелости, рассматривается как ступень к формированию глобальной информационной среды, обеспечивающей эффективное извлечение значимой для принятия решений семантически связной информации.