Вернуться ко всем статьям

Некоторые аспекты автоматизации анализа минерально-сырьевой базы страны на федеральном уровне

# Статья из библиотеки

Минерально-сырьевая база России – одна из крупнейших в мире. Эффективное управление ею – сложнейшая многоаспектная проблема, для решения которой требуется не только высокий профессионализм и ответственность, но и глубокое знание текущего состояния объекта управления, что само по себе порождает мощные информационные потоки.

Существенный вклад в информационное обеспечение органов управления вносит Информационно-аналитический центр "Минерал" (далее – «Центр»), выпуская на регулярной основе ряд объемных справочно-аналитических изданий по минерально-сырьевой базе России и мира: "Государственный доклад о состоянии и использовании минерально-сырьевых ресурсов Российской Федерации", "Доклад о выполнении геологоразведочных работ в Российской Федерации", справочники "Минеральные ресурсы мира" и другие. Помимо этого, по запросам федеральных органов власти Центр готовит оперативные информационные материалы по частным вопросам состояния и развития минерально-сырьевой базы страны и мира. Удовлетворение запросов "сверху", как правило, требует обработки больших объемов исходных данных; компактного представления информации на выходе; точного и быстрого исполнения.

Очевидно, что решение этих задач невозможно без автоматизации всех этапов процесса подготовки информационной продукции. С использованием специально разработанной корпоративной информационной системы (ИС) "Минерал". Центр в состоянии выполнить большинство заданий в заданные сроки и с требуемым качеством. Десять лет эксплуатации ИС "Минерал" позволили накопить значительный опыт решения подобных задач, найти удачные подходы и технологические решения, а также сформировать представление об основных проблемах автоматизации процесса обработки геологической информации и способах их решения.

Центр "Минерал" обеспечивает регулярную (в соответствие с годовым календарным планом), оперативную (несколько дней) и сверхоперативную (несколько часов) подготовку справочной и аналитической информации по минерально-сырьевому комплексу России и мира. Главным заказчиком информации являются федеральные органы государственной власти, обеспечивающие стратегическое управление фондом недр на федеральном уровне – выработку и проведение государственной политики в области использования и воспроизводства запасов полезных ископаемых. Для принятия решений такого масштаба необходимо хорошо налаженное оперативное снабжение актуальной, обобщенной и вместе с тем достаточно полной фактографической и аналитической информацией по всем видам полезных ископаемых в масштабе всей страны.

При этом в ряде случаев бывает необходимо перейти от общей картины к конкретным вопросам и конкретным геологическим объектам. Хотя в силу своей вторичности информация на федеральном уровне никогда не может (да и не должна) быть излишне детальной, необходимо обеспечить достаточную точность данных для анализа основные параметры отдельных объектов управления (месторождений, лицензионных участков, компаний и т.п.).

Геолого-экономическая информация многолика и на пути от полевого дневника до конечного потребителя претерпевает множество метаморфоз, приобретая все более общий характер. Выделяются следующие ключевые уровни преобразования и представления информации:

  1. первичная геологическая информация (полевые дневники, буровые журналы, лабораторные ведомости, цифровые записи физических полей и др.);
  2. геологические отчеты с приложениями, в которых первичная информация бережно собрана и обобщена;
  3. структурированные информационные массивы регионального уровня;
  4. сводные отраслевые информационные массивы федерального уровня;
  5. специальные выборки расчетных данных для конкретных аналитических задач федерального уровня;
  6. собственно аналитические материалы федерального уровня.

По отношению к нашим задачам информация уровней (1)-(3), как правило, является избыточно детализированной, слишком объемной, недостаточно хорошо структурированной и физически недоступной для оперативной обработки запросов. Наиболее подходящей для подготовки аналитических материалов федерального уровня является информация четвертого уровня. Это, в первую очередь, такие информационные массивы, как:

  • государственный кадастр месторождений и проявлений полезных ископаемых;
  • государственный баланс запасов полезных ископаемых;
  • государственный реестр лицензий на пользование недрами;
  • государственный реестр работ по геологическому изучению недр.

Эти информационные массивы принадлежат государству, имеют официальный статус, ведутся централизованно и на регулярной основе. Данные в них лучше структурированы, содержат необходимый минимум параметров, описывающих каждый объект. Все они поддерживаются достаточно длительное время и хорошо знакомы всем специалистам. Кроме того, в отрасли существуют и альтернативные, более новые и, возможно, более технологичные источники информации, такие, как "Информационная система регулирования использования минерально-сырьевых ресурсов". Однако, по ряду причин их невозможно использовать в повседневной работе.

Традиционный алгоритм подготовки аналитических материалов по запросу можно представить следующим образом:

  1. получение и анализ требований
  2. сбор необходимой информации из вышеперечисленных источников
  3. объединение, сбивка и реструктуризация собранной информации
  4. проведение необходимых расчетов
  5. анализ полученных в итоге данных, написание текста, подготовка карт и иллюстраций, редактура и окончательное оформление документа.

Специалисты отдела информационных технологий центра "Минерал", так или иначе, задействованы во всех звеньях технологической цепочки. При этом, наиболее сложным для автоматизации пунктом является пункт (3). В силу изменчивости требований в сочетании с большим объемом обрабатываемой информации, качество всей работы напрямую зависит от того, насколько тщательно продумана обобщенная структура данных и насколько гибкими и мощными являются разработанные программные средства автоматизации.

Наш опыт свидетельствует о том, что непродуктивно строить частные модели данных, ориентированные на решение сиюминутных задач. Такие модели неустойчивы к изменениям требований и их повторное использование проблематично. Более рациональным решением является создание универсальной обобщенной модели, ориентированной на отражение реалий предметной области. Такая модель будет значительно более устойчива и позволит в будущем использовать однажды разработанные программные средства при необходимости обновления или расширения данных.

Примером неплохой модели такого плана может служить прошедшая испытание временем модель данных информационной системы "Минерал", поэтому в настоящее время мы стремимся интегрировать данные из разных информационных массивов непосредственно в нашей информационной системе, строя дальнейшие расчеты на этом относительно устойчивом основании. Используемый нами подход позволяет хранить в рамках единой логической и физической структуры даже противоречащие друг другу данные, с обязательным указанием источника, из которого они получены. Окончательный выбор того, данные какого источника предпочесть в том или ином случае, остается за специалистом – аналитиком.

Можно говорить о трех группах проблем, возникающих при объединении и сбивке данных из отраслевых информационных массивов.

Во-первых, это проблемы, связанные с информационной и организационной базой массивов. Многие важные инструкции, которыми руководствуются организации, осуществляющие учет, введены в действие еще во времена Мингео СССР. Естественно, когда отчетные формы составлены в устаревших терминах, это порождает вольность их заполнения и принципиально неустранимые неточности в данных. Кроме того, данные большинства массивов содержат ошибки и опечатки, а также значительно (иногда на полгода) отстают от региональных данных.

Вторая группа проблем связана с технологической отсталостью отдельных массивов, использованием морально устаревшего программного обеспечения, недостаточной прозрачностью и гибкостью моделей данных. Недостаточная формализация также является следствием использования устаревших инструкций. Иногда базовые понятия информационных массивов определены недостаточно строго, что неизбежно отражается на качестве информации.

Наконец, целый ряд проблем возникает при попытке объединения данных из разных информационных массивов вследствие их изолированности друг от друга. Модели данных разных массивов составлены в разной терминологии, с разной степенью нормализации, и даже одинаковые, по сути, классификаторы порой имеют разное содержимое. Кроме того, многие второстепенные, но, тем не менее, необходимые, данные одновременно присутствуют в разных массивах одновременно. Поскольку ведутся они разными людьми и для разных целей, а ни автоматического, ни ручного контроля целостности ссылок на данные из других массивов не ведется, неизбежны существенные противоречия.

Все это вместе взятое создает значительные сложности при использовании данных из вышеприведенных источников, сильно замедляет анализ и снижает его качество.

Для решения перечисленных проблем было найдено несколько решений. Главное из них – заблаговременное интегрирование получаемых ограниченных выборок данных в ИС "Минерал". Из-за проблем, о которых шла речь выше, это довольно трудоемкий процесс, требующий участия не только специалистов по информационным технологиям, но и всех геологов-сырьевиков для ручной выверки и согласования проблемных данных. Но результат оправдывает затраты труда и времени: имея современную, мощную и гибкую технологическую платформу, ИС "Минерал" позволяет многократно и эффективно использовать однажды подготовленные данные для решения множества различных задач.

В ряде случаев, когда информационные потребности превосходят возможности сводных отраслевых информационных массивов федерального уровня, проводится сбор информации более низкого уровня непосредственно от ее держателей – территориальных органов Роснедра, региональных организаций и компаний. Специально для этого в Центре создана автоматизированная система (АС) "Минерал-доклад", позволяющая регулярно или по оперативному запросу собирать необходимую региональную информацию через Интернет. Архитектура АС "Минерал-доклад" представлена на рисунке.

Архитектура автоматизированной системы Минерал-Доклад *** Размер изображения уменьшен. Нажмите, чтобы увидеть полноразмерное изображение с полным качеством

АС «Минерал-доклад» имеет следующие характеристики.

Мощность. Опираясь на современную технологическую платформу .NET 2.0 и развитую модель данных ИС "Минерал" система "Минерал-доклад" позволяет одновременно 300 удаленным пользователям через Интернет вводить и получать информацию по всем основным аспектам недропользования в России в реальном времени.

Гибкость. В этой системе впервые применен разработанный в Центре механизм изоляции физического и логического представления информации в хранилище от представления в интерфейсе пользователя. На практике это означает, что представители организаций, предоставляющих информацию, а также заказчики могут работать с системой в привычной системе понятий и терминов, не привязываясь к нашей терминологии и нашим моделям данных. Более того, одни и те же данные одновременно могут иметь различное представление для разных пользователей. Система позволяет оперативно подключать новые хранилища данных, менять их конфигурацию и настраивать интерфейс пользователя без изменения программных модулей, а значит, без ущерба для стабильности работы системы.

Масштабируемость. Архитектура системы позволяет при необходимости практически неограниченно наращивать мощность системы, как в плане производительности, так и в плане расширения функциональности. В настоящее время АС "Минерал-доклад" ориентирована в первую очередь на подготовку ежегодного "Доклада о результатах геологоразведочных работ в Российской Федерации", однако уже сейчас существуют возможности ее применения для решения новых задач.

Надежность и защищенность. Использование разделения доступа к информации и шифрованных каналов делает передаваемые данные надежно защищенными от несанкционированного доступа (в рамках российского законодательства). Средства резервирования позволяют восстановить работоспособность системы и все данные в течение нескольких дней даже в случае полного физического уничтожении оборудования.

Задача ведения массивов геологической и геолого-экономической информации федерального уровня будет актуальной всегда, поэтому в заключение хотелось бы конспективно наметить некоторые шаги, которые позволят сделать их более адекватными информационным потребностям отрасли.

Проблемы, о которых шла речь выше, имеют, в том числе, серьезную объективную причину, состоящую в необходимости поддерживать две точки зрения на фонд недр, назовем их условно "геологическая" и "промышленная". С "геологической" точки зрения фонд недр представляет собой совокупность геологических (природных) объектов разных рангов, возникших естественным путем и характеризующихся набором множества взаимосвязанных геологических параметров. Разные специалисты могут иметь различные точки зрения на их классификацию, по-разному их рисовать на карте и оценивать параметры. Но в любом случае человек имеет возможность лишь познавать природные объекты, но не изменять их параметры и границы. С "промышленной" точки зрения фонд недр предстает в виде множества "нарезанных" человеком конкретных участков (лицензионных площадей, подсчетных блоков), характеризующихся достаточно ограниченным набором параметров, значения которые могут меняться очень динамично.

На пути развития информационных массивов федерального уровня необходимо решить следующие задачи:

  1. Разработать хорошо формализованную, единую модель данных и классификаторов масштаба отрасли в целом, непротиворечиво увязывающую "геологическую" и "промышленную" точки зрения на недра.
  2. Радикально пересмотреть организацию и инструктивно-методическое обеспечение ведения баз данных. В частности, процесс ввода должен являться частью официальной процедуры регистрации лицензии, утверждения запасов, заполнения формы статистической отчетности. Например, недропользователь юридически не должен считаться владельцем лицензии до момента ее включения в федеральную базу данных. Только так может быть обеспечена стопроцентная актуальность данных.
  3. Перейти на современную технологическую платформу, в том числе обеспечить возможность оперативного удаленного ввода данных в центральную систему по защищенному каналу связи. В противном случае предыдущий пункт станет лишь бюрократическим барьером на пути освоения недр.
  4. Обеспечить максимально допустимую в рамках законодательства открытость и физическую доступность, как данных, так и документации для государственных структур, бизнеса и заинтересованной общественности.

Десятилетний опыт работы центра "Минерал" ФГУНПП "Аэрогеология", а также опыт создания, поддержки и ведения одноименной информационной системы позволяют утверждать, что сформулированные задачи вполне могут быть решены в обозримые сроки. Конечно, разработка и поддержка высокотехнологичных информационных систем стоит дорого, но это рациональные затраты. Во-первых, потому что на создание различных суррогатных систем в последние годы было потрачено много больше, а во-вторых, потому что без подобной системы учета информационное обеспечение российского недропользования будет и дальше находится на уровне прошлого века.

Кирилл Флоренский,

руководитель отдела информационных технологий центра "Минерал"

Опубликовано: Минеральные Ресурсы России, 2006

Яндекс.Метрика