- Дипломы
- Курсовые
- Рефераты
- Отчеты по практике
- Диссертации
Разработка модуля для подготовки данных к публикации в открытом формате
Внимание: Акция! Курсовая работа, Реферат или Отчет по практике за 10 рублей!
Только в текущем месяце у Вас есть шанс получить курсовую работу, реферат или отчет по практике за 10 рублей по вашим требованиям и методичке!
Все, что необходимо - это закрепить заявку (внести аванс) за консультацию по написанию предстоящей дипломной работе, ВКР или магистерской диссертации.
Нет ничего страшного, если дипломная работа, магистерская диссертация или диплом ВКР будет защищаться не в этом году.
Вы можете оформить заявку в рамках акции уже сегодня и как только получите задание на дипломную работу, сообщить нам об этом. Оплаченная сумма будет заморожена на необходимый вам период.
В бланке заказа в поле "Дополнительная информация" следует указать "Курсовая, реферат или отчет за 10 рублей"
Не упустите шанс сэкономить несколько тысяч рублей!
Подробности у специалистов нашей компании.
Только в текущем месяце у Вас есть шанс получить курсовую работу, реферат или отчет по практике за 10 рублей по вашим требованиям и методичке!
Все, что необходимо - это закрепить заявку (внести аванс) за консультацию по написанию предстоящей дипломной работе, ВКР или магистерской диссертации.
Нет ничего страшного, если дипломная работа, магистерская диссертация или диплом ВКР будет защищаться не в этом году.
Вы можете оформить заявку в рамках акции уже сегодня и как только получите задание на дипломную работу, сообщить нам об этом. Оплаченная сумма будет заморожена на необходимый вам период.
В бланке заказа в поле "Дополнительная информация" следует указать "Курсовая, реферат или отчет за 10 рублей"
Не упустите шанс сэкономить несколько тысяч рублей!
Подробности у специалистов нашей компании.
Код работы: | K010404 |
Тема: | Разработка модуля для подготовки данных к публикации в открытом формате |
Содержание
Содержание ВВЕДЕНИЕ 9 1. ПУБЛИКАЦИЯ ОТКРЫТЫХ ДАННЫХ О ПРИРОДНЫХ РЕСУРСАХ И ОКРУЖАЮЩЕЙ СРЕДЕ РЕСПУБЛИКИ БАШКОРТОСТАН 11 1.1 Технология открытых данных 11 1.2 Наборы данных о природных ресурсах и окружающей среде Республики Башкортостан 30 1.3 Требования к программному обеспечению для подготовки данных к публикации 37 2. ПРОЕКТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ПОДГОТОВКИ ОТКРЫТЫХ ДАННЫХ 41 2.1 Этапы подготовки и публикации набора данных 41 2.2 Разработка информационной модели 49 3. РАЗРАБОТКА ПРОГРАММНОГО МОДУЛЯ ДЛЯ ПОДГОТОВКИ ОТКРЫТЫХ ДАННЫХ 52 3.1 Программная среда подготовки наборов открытых данных 52 3.2 Алгоритмическое обеспечение программного модуля 53 3.3 Перечень средств, используемых при разработке модуля 54 3.4 Разбор примера использования инструмента 55 ЗАКЛЮЧЕНИЕ 62 СПИСОК ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ 63 Приложение А Функциональная модель системы 66 Приложение Б Информаионная модель системы 71 Приложение В Блок-схема алгоритма работы системы 73 Приложение Г Листинг исходного кода 77 ВВЕДЕНИЕ «В настоящее время в Российской Федерации реализуется программа, которая предусматривае6т публикацию разнообразных сведений в формате открытых данных. Проблема заключается в том, что, зачастую, данные хранятся в непригодном для публикации формате и объемы этих данных очень велики для неавтоматизированной конвертации. Существуют программные средства, с помощью которых возможно произвести преобразование данных в открытый формат, но эти средства не лишены следующих недостатков: 1) Невозможность конвертации в ряд форматов открытых данных; 2) При выполнении конвертации возможны потери и искажения данных; Следовательно, необходимо создать или модернизировать существующий инструмент, избавленный от описанных недостатков, при этом доступный в освоении для рядового пользователя. У каждого из описанных выше подходов (создание нового или модернизация существующего) есть свои достоинства и недостатки: Создание нового приложения: 1) Производительность такого приложения будет выше, чем у существующих аналогов; 2) Расширение функционала и возможность работы с несколькими форматами исходных данных; 3) Внедрение нового продукта в организациях более затратно по времени, чем обучение персонала работе с модификацией существующего приложения; 4) Процесс разработки нового приложения более трудоемок и затратен, как по времени, так и по ресурсам, чем модификация существующего приложения; Модификация существующего приложения: 1) Если расширение функционала и исправление недостатков в существующем приложении менее трудозатратен и не требует долгого времени, то модификация представляется более целесообразной, чем создание абсолютно нового программного продукта; 2) Если модернизировать программу, получившую широкое распространение в организациях, то введение в эксплуатацию полученного инструмента будет протекать в более сжатые сроки за счет упрощенного обучения работы с ним; 3) Невозможность воплотить необходимый функционал в полном объеме; 4) Более низкая итоговая производительность, чем у специально разрабатываемого для данной цели приложения; После анализа различных подходов к решению данной проблемы, подход, заключающийся в модернизации существующего приложения, был признан более рациональным. Для выполнения необходимых операций было решено разработать надстройку для существующего продукта MicrosoftExcel, в силу его широкого применения в различных организациях, которая исправляет следующие недостатки этого продукта: 1) Минимизация потерь и ошибок при конвертации данных; 2) Добавление возможности работы с большим количеством форматов; 3) Дополнительный функционал, заключающийся в создании файла структуры и файла паспорта сконвертированных данных; 1. ПУБЛИКАЦИЯОТКРЫТЫХ ДАННЫХО ПРИРОДНЫХ РЕСУРСАХИ ОКРУЖАЮЩЕЙ СРЕДЕРЕСПУБЛИКИ БАШКОРТОСТАН 1.1 Технология открытых данных 1.1.1 Основные концепции открытых данных Любой государственный орган, орган местного самоуправление и подведомственные им организации в процессе своей деятельности разрабатывают и публикуют документы, оперируют и владеют общественно значимой информацией. Подобные документы и информация подлежат размещению в интернете. Для облегчения процесса создания полезных для граждан и бизнеса информационных сервисов на основе общественно-значимых материалов, обозначенные материалы должны публиковаться в особом, так называемом машиночитаемом, формате. Данный формат призван обеспечивать автоматическую обработку опубликованных данных. Размещённые в таком формате материалы как раз и считаются открытымиданными: независимо от того, простая ли это совокупность сведений, официальный документ или информационная база, данные становятся пригодными для действительно свободного использования в любых соответствующих закону целях любыми лицами, что способствует расширению спроса на эту информацию с целью достижения социального и экономического эффекта от её применения. Основные принципы открытых данных[6]: * первичность; * полнота; * актуальность; * пригодность к машинной обработке; * отсутствие дискриминации по доступу; * отсутствие проприетарных форматов; * лицензионная чистота; Под первичными данными понимаются данные, представленные в первоначальном виде и не подвергшиеся агрегированию – обработке, группировке. Полнота данных предполагает, что все необходимые для рационального или оптимального решения конкретной задачи данные собраны и предоставлены. Актуальность данных — это степень соответствия данных текущему моменту времени, так как устаревшая информация может приводить к ошибочным решениям. Термин «пригодность к машинной обработке» означает, что открытые данные должны быть представлены в виде, пригодном для считывания, обработки и выдачи результата компьютерной программой. Отсутствие дискриминации по доступу предполагает, что каждый человек, независимо от национальности, гражданства, пола, возраста и религиозных убеждений, имеет свободный доступ к открытым данным. Отсутствие проприетарных форматов означает использование только свободных или открытых форматов файла, которые являются свободными от лицензионных ограничений при использовании. Под лицензионной чистотой подразумевается использование свободных лицензий, таких как CreativeCommons, OpenDataCommons, суть которых заключается в следующем: пользователь может использовать (в том числе повторно) открытые данные свободно, бесплатно, бессрочно, безвозмездно и без территориальных ограничений, в том числе имеет право копировать, публиковать, распространять открытые данные, видоизменять открытые данные и объединять их с другой информацией, использовать открытые данные в коммерческих целях, использовать для создания программ для ЭВМ и приложений. Таким образом, открытые данные – это информация (в том числе документированная), созданная в пределах своих полномочий государственными органами, либо поступившая в указанные органы и организации, а также информационно-аналитическими организациями, участвующими в публикации собственных открытых данных на территории Российской Федерации, которая подлежит размещению в сети интернет в формате, обеспечивающим ее автоматическую обработку в целях повторного использования без предварительного изменения человеком (машиночитаемый формат), и может свободно использоваться в любых соответствующих закону целях любыми лицами независимо от формы ее размещения (простая совокупность сведений, база данных и т.д.). 1.1.2 Законодательное и нормативное обеспечение открытых государственных данных Существует ряд нормативных и законодательных актов, регламентирующих процесс публикации открытых данных, и далее будут рассмотрены наиболее важные их них. Работа с открытыми государственными данными началась со вступлением в силу Указа Президента РФ «Об основных направлениях совершенствования системы государственного управления»[2], в котором в пунктах 2.б и 2.г указано: б) до 1 сентября 2012 г. обеспечить повышение информационной открытости саморегулируемых организаций, в том числе определить состав информации, подлежащей обязательному опубликованию, и установить ответственность за неисполнение предусмотренных требований; г) до 15 июля 2013 г. обеспечить доступ в сети Интернет к открытым данным, содержащимся в информационных системах органов государственной власти Российской Федерации; Во исполнение этого Указа Постановлением Правительства РФ №583 от 10 июля 2013г. «Об обеспечении доступа к общедоступной информации о деятельности государственных органов и органов местного самоуправления в информационно-телекоммуникационной сети «Интернет»[3] в форме открытых данных» были утверждены правила отнесения информации к общедоступной информации, правила определения периодичности публикации открытых данных, а также правила обязательного размещения органами государственной власти открытых данных и сопроводительных документов, которые гласят: Настоящие Правила устанавливают порядок обязательного размещения органами государственной власти субъектов Российской Федерации и органами местного самоуправления общедоступной информации о деятельности органов государственной власти субъектов Российской Федерации и органов местного самоуправления, созданной указанными органами или поступившей к ним при осуществлении полномочий по предметам ведения Российской Федерации и полномочий Российской Федерации по предметам совместного ведения Российской Федерации и субъектов Российской Федерации, переданных для осуществления органам государственной власти субъектов Российской Федерации или органам местного самоуправления, в информационно- телекоммуникационной сети «Интернет» в форме открытых данных. Согласно вышеперечисленным правилам, к открытым данным не может относиться информация, являющаяся государственной тайной или имеющая ограниченный доступ, а также, если она защищена законодательством РФ об информации, информационных технологиях и о защите информации или законодательством РФ о персональных данных. Позднее Правительством РФ был утвержден перечень общедоступной информации, размещаемой в форме открытых данных: 1) Наименования органов записи актов гражданского состояния; 2) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих полномочия в области содействия занятости населения и переданное полномочие по осуществлению социальных выплат гражданам, признанным в установленном порядке безработными; 3) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих полномочия в области государственной экспертизы проектной документации, государственной экспертизы результатов инженерных изысканий и в области контроля за соблюдением органами местного самоуправления законодательства о градостроительной деятельности; 4) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих полномочия в области экологической экспертизы; 5) План проведения государственной экологической экспертизы на объектах, подлежащих государственному экологическому контролю, осуществляемому органами исполнительной власти субъектов Российской Федерации; 6) Информация о результатах проведения государственной экологической экспертизы на объектах, подлежащих государственному экологическому контролю, осуществляемому органами исполнительной власти субъектов Российской Федерации; 7) Государственный лесной реестр (в отношении лесов, расположенных в границах территории субъектов Российской Федерации); 8) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих полномочия в области охраны и использования объектов животного мира; 9) Государственный охотхозяйственный реестр; 10) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих переданные полномочия Российской Федерации в области образования; 11) Реестр лицензий на образовательную деятельность, выданных органами исполнительной власти субъектов Российской Федерации, осуществляющими переданные полномочия Российской Федерации в области образования; 12) Реестр аккредитованных образовательных учреждений, расположенных на территории субъектов Российской Федерации; 13) Наименования органов исполнительной власти субъектов Российской Федерации, осуществляющих переданные полномочия Российской Федерации в области охраны здоровья граждан; 14) Реестр лицензий на медицинскую деятельность, выданных органами исполнительной власти субъектов Российской Федерации, осуществляющими переданные полномочия Российской Федерации в области охраны здоровья граждан; 15) Реестр лицензий на фармацевтическую деятельность, выданных органами исполнительной власти субъектов Российской Федерации, осуществляющими переданные полномочия Российской Федерации в области охраны здоровья граждан; 16) Реестр лицензий на деятельность по обороту наркотических средств, психотропных веществ и их прекурсоров, культивированию наркосодержащих растений, выданных органами исполнительной власти субъектов Российской Федерации, осуществляющими переданные полномочия Российской Федерации в области охраны здоровья граждан; 17) Иная общедоступная информация о деятельности органов государственной власти субъектов Российской Федерации и органов местного самоуправления, созданная указанными органами или поступившая к ним при осуществлении полномочий по предметам ведения Российской Федерации и полномочий Российской Федерации по предметам совместного ведения Российской Федерации и субъектов Российской Федерации, переданных для осуществления органам государственной власти субъектов Российской Федерации или органам местного самоуправления, подлежащая размещению в сети "Интернет" в форме открытых данных в соответствии с федеральными законами, актами Президента Российской Федерации, Правительства Российской Федерации, решениями Правительственной комиссии по координации деятельности открытого правительства и приказами федеральных органов исполнительной власти (в отношении информации, размещаемой органами государственной власти субъектов Российской Федерации и органами местного самоуправления в рамках полномочий, контроль и надзор за осуществлением которых обеспечивается соответствующими федеральными органами исполнительной власти); Как можно заметить, государство серьезно подошло к вопросу публикации открытых государственных данных. В рамках этого проекта были утверждены правила отнесения информации к открытым данным, а также правила обязательного размещения открытых данных. Впоследствии был определен перечень общедоступной информации, размещаемой в форме открытых данных. Были разработаны методические рекомендации по публикации открытых данных, содержащие в себе не только общую информацию об открытых данных, но и описание всего процесса публикации данных, а также процесса подготовки данных к публикации. Также был разработан портал открытых данных РФ, представляющий собой не только удобное место хранения открытых данных, но и новостной портал, и форум по данной тематике. 1.1.3 Портал открытых данных Российской Федерации По итогам 39-го саммита G8 (17-18 июня 2013 года, Великобритания) была принята Хартия открытых данных, которая предусматривает, что государства будут следовать ряду базовых принципов при раскрытии информации. В рамках реализации данного документа был разработан и принят ряд нормативных правовых актов, основным из которых является План реализации Хартии по открытым данным в Российской Федерации. План предусматривает разработку и ввод в промышленную эксплуатацию Портала открытых данных Российской Федерации[5], первая версия которого появилась в 2014 году. В 2015 году была запущена вторая версия Портала открытых данных, в которой на основе собранных предложений, замечаний, а также рекомендаций экспертов была доработана интерфейсная часть и внесены изменения в функциональную часть(Рис. 1). Рисунок 1 – главная страница Портала Портал представляет собой место, где сосредотачиваются наиболее актуальные сведения об открытых государственных данных, размещаются документированные наборы данных, ссылки и метаданные опубликованных наборов данных, информация о созданных на основе открытых данных программных продуктах и информационных услугах. Здесь же публикуются нормативные правовые акты, определяющие правовые основы деятельности по раскрытию данных, методические и публицистические ресурсы. Также реализованы коммуникационные интерфейсы для взаимодействия с государственными органами, выступающими в качестве владельцев социально-значимых данных. На сегодняшний день основными возможностямиПортала открытых данных являются: * возможность отбора и поиска наборов открытых данных по заданным критериям и ключевым словам * возможность ознакомления с паспортами и содержимым наборов открытых данных без предварительной загрузки * возможность оперативной визуализации данных с использованием инструментов построения диаграмм, графиков и отображения картографических данных * возможность автоматической загрузки актуальных наборов открытых данных с сайтов государственных органов * возможность участия в государственно-гражданском диалоге по определению предметных приоритетов раскрытия данных * возможность размещения наборов данных и ссылок на наборы данных, размещенные на сайтах государственных органов и организаций (в том числе – коммерческих) * возможность паспортизации наборов данных и преобразования исходных данных в открытые форматы С главной страницы Портала можно посмотреть новости, касающиеся открытых данных, узнать, какие новые наборы данных были добавлены, просмотреть нормативно-правовые акты, касающиеся этой тематики, обсудить на форуме какой-либо вопрос относительно публикации ОД, добавить новый набор данных, если имеются права на публикацию, или приступить к поиску. Поиск по наборам данных позволяет искать открытые данные не только по наименованию, но и осуществлять фильтрацию данных по формату данных, теме, ключевому слову, типу организации и наименованию самой организации; а также осуществлять группировку результатов по дате изменения, просмотрам и загрузкам. Существует функция, позволяющая произвести территориальную привязку наборов данных путем добавления геометок к публикуемым файлам. Место привязки после этого будет отображено на интерактивной карте, как показано на рисунке №2. Рисунок 2 – интерактивная карта открытых данных Можно заметить, что была проделана большая работа по созданию централизованного сервиса размещения открытых государственных данных. Был разработан интерфейс, ориентированный на пользователя. Нельзя обделить вниманием и функциональную часть, которая позволяет не только производить поиск и загрузку данных, но и отображать интерактивную карту, вести статистику по работе Портала, такую как, динамику публикаций, посещений. 1.1.4 Публикация открытых данных Определение наборов открытых данных и приоритетности их публикации Опубликованию в форме открытых данных подлежат сведения, содержащие информацию о деятельности государственных органов и органов местного самоуправления, размещаемую в сети «Интернет» в соответствии с Федеральным законом от 09 февраля 2009 г. № 8-ФЗ «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления»[1], а также сведения, содержащие информацию, собираемую, хранимую, обрабатываемую или публикуемую государственными органами или органами местного самоуправления в рамках реализации своих полномочий. Опубликование информации в форме открытых данных необходимо осуществлять поэтапно, учитывая при этом следующие факторы: а) востребованность соответствующих наборов открытых данных потенциальными потребителями информации, оцениваемую в соответствии с методикой мониторинга и оценки востребованности открытых данных б) степень готовности, характеризующуюся наличием необходимых данных в электронном виде, а также готовностью организационных, технических, технологических и иных средств, необходимых для опубликования наборов открытых данных в) затраты на публикацию (финансовые, временные, трудовые), необходимые для опубликования наборов открытых данных и поддержания их в актуальном состоянии Сведения, обладающие высокой востребованностью и степенью готовности, требующие при этом минимальных затрат, должны публиковаться в форме открытых данных государственными органами и органами местного самоуправления в первоочередном порядке. Для повышения степени готовности сведений к опубликованию в форме открытых данных государственным органам и органам местного самоуправления рекомендуется при проведении работ по проектированию, созданию или развитию автоматизированных систем устанавливать соответствующие требования к таким работам, предусматривающие использование машиночитаемых данных при сборе, обработке, хранении и публикации сведений. При формировании как реестра наборов открытых данных, так и самих наборов открытых данных, следует учитывать: а) публикации подлежат первичные данные, не подвергнутые предварительной обработке; б) для каждого набора данных должно быть определено должностное лицо, ответственное по вопросам публикации открытых данных; в) для каждого набора данных должна быть установлена периодичность обновления с учетом потребностей потребителей открытых данных; Сформированный реестр открытых данных утверждается государственным органом или органом местного самоуправления и подлежит публикации на официальном сайте органа в сети «Интернет». Описание форматов открытых данных (CSV, XML, JSON) Согласно методическим рекомендациям, открытые данные должны быть представлены в одном из машиночитаемых форматов, таких как CSV, XML, JSON. CSV[8] – текстовый формат, предназначенный для представления табличных данных. Каждая строка файла – это одна строка таблицы. Значения отдельных колонок разграничиваются разделительным символом — запятой или точкой с запятой. В данном формате отсутствуют типы данных, т.е. каждое значение является строкой. Пример строки в формате CSV: «Уфимское территориальное управление;Шамсиев Рустем Равилевич;г. Уфа, ул. Ленина, 86;ufa.mpe@bashkortostan.ru;8(347)218-04-34;г. Уфа, МР Уфимский район;». Стоит добавить, что в формате CSV можно публиковать только те данные, которые имеют плоскую табличную форму, при этом в содержании записи не допускается использование символа перевода строки. XML[10] – это расширяемый язык разметки документов, позволяющий структурировать информацию разного типа, используя для этого произвольный набор инструкций. В данном формате отсутствуют типы данных, однако их можно прописать в качестве атрибутов в тегах. Пример строки в формате XML: « |
Для получения полной версии работы нажмите на кнопку "Узнать цену"
Узнать цену | Каталог работ |
Похожие работы: