Если попытаться предельно просто обозначить ключевые отличительные особенности технологий репликации распределённых баз данных, то лучше всего сделать
это на конкретных примерах из реальной жизни.
|
Пример №1 из житейской области |
Допустим, Вы своевременно оплатили штраф за нарушение правил дорожного движения. При этом информация об оплате сразу фиксируется в соответствующей ведомственной базе данных. Вопрос на засыпку: сколь долго Вам ещё будут приходить уведомления о том, что штраф не оплачен и пора бы его оплатить?
|
|
Правильный ответ – до нескольких недель
|
Пример №2 из профессиональной области |
Федеральная информационная система «СМЭВ» (Система межведомственного электронного взаимодействия), позволяющая федеральным, региональным и местным органам власти, кредитным организациям (банкам), внебюджетным фондам и прочим участникам «СМЭВ» обмениваться в электронном виде данными, необходимыми для оказания государственных услуг гражданам и организациям, введена в эксплуатацию в 2010г. Титаническими усилиями Минцифры в настоящее время получила широкое распространение.
В соответствии с установленным регламентом срок ответа на запрос в рамках СМЭВ не может превышать пять рабочих дней(!), если иные сроки не предусмотрены для конкретного вида запросов. В результате, при сбое взаимодействия со «СМЭВ» техническая поддержка ситуационного центра электронного правительства отклоняет запрос потребителя информации о проблеме без информирования поставщика информации, если не прошло пять рабочих дней с момента направления запроса. В итоге поставщик информации поздно узнаёт о возникшей проблеме, время ответа на запрос начинает исчисляться сутками. Причём обработка одного электронного запроса на протяжении нескольких суток считается штатной ситуацией, не требующей каких-либо действий от службы технической поддержки. При этом речь идёт всего-навсего о запросе к базе данных поставщика информации с последующим форматированием и возвратом потребителю полученного результата.
Справедливости ради следует отметить, что такая ситуация не является типичной. В частности, опыт работы с различными видами сведений федерального уровня свидетельствует, что большинство запросов обычно выполняется «всего лишь» менее часа, изредка превышая несколько часов. Случаи ожидания результатов выполнения запросов несколько суток также встречаются, но редко. Однако законы Мерфи до сих пор никто не отменял.
|
|
Что с технической точки зрения происходит при выполнении подобных запросов? Один из компьютеров одного из субъектов (потребителей информации) распределённой информационной системы обращается к другому компьютеру поставщика информации этой системы. Тот, в свою очередь, выполняет запрос к некой базе данных и возвращает результат запроса. Откуда же тогда набегают эти часы, а то и сутки?
Помимо отмеченного, технологии информационного обмена, аналогичные тем, которые используются в упомянутой системе «СМЭВ», имеют ещё один существенный недостаток. Время, в которое мы живём, характеризуется крайне высокой динамичностью в самых различных областях жизни. Невозможно избежать этого и в информационных системах. Состав и структура данных информационных потоков в силу ряда объективных причин меняются достаточно часто. Если при этом технология информационного обмена требует при каждом изменении состава и формата данных информационных потоков не только изменить протоколы информационного взаимодействия, но и перепрограммировать все приложения, взаимодействующие в рамках распределённой информационной системы, это тупик. Любое подобное изменение в сколько-нибудь серьёзной распределённой системе влечёт за собой необходимость перепрограммирования и замены (обновления) приложений в огромном количестве взаимодействующих субъектов. Представьте себе, что эти субъекты территориально распределены достаточно широко, например, расположены на разных континентах. *** Data transform ***
У авторов есть подозрение, которое граничит с уверенностью, что что-то здесь не так. Многолетний опыт работы в области проектирования распределённых информационных систем и технологий информационного обмена убеждает нас в том, что такие запросы должны выполняться и возвращать результат, как правило, в течение секунд.
В чём же дело?
|
Может быть, пора переосмыслить
|
основы технологии информационного обмена
|
в подобных распределённых информационных системах?
|
|
Позволим себе задуматься о следующем. Входящие в состав информационных систем приложения баз данных, хранят обрабатываемую ими информацию в базах данных. При приёме и передаче информации в рамках распределённой системы именно базы данных, а не приложения являются источниками и приёмниками информации. Отсюда логично напрашивается простой, но далеко идущий вывод.
|
|
На наш взгляд, приложения баз данных вообще не должны знать о том, какое именно подмножество информации должно курсировать между базами данных в рамках распределённой системы. И уж ни в коем случае код этих приложений не должен зависеть от протоколов информационного обмена. Это вообще не их задача. «Мухи отдельно, котлеты отдельно» – крайне полезный фразеологизм в подобной задаче. Пусть приложения обрабатывают информацию, а её распространением занимаются иные специальные технологии и средства. |
|
* * * |
В качестве достойной альтернативы различным используемым в настоящее время технологиям информационного взаимодействия в распределённых информационных системах предлагаем обратить внимание на технологию репликации баз данных, в частности, реализованную в семействе систем репликации распределённых гетерогенных баз данных «ruSBSS™».
Технологии репликации баз данных представляют собой один из наиболее эффективных концептуально-технологических подходов к решению задач информационного обмена в распределённых информационных системах. Заметим, подходов не просто умозрительных, а на протяжении почти двадцати лет используемых нами и нашими заказчиками в межконтинентально распределённых информационных системах, характеризующихся большим количеством взаимодействующих субъектов и высоким трафиком информационного обмена.
Семейство систем репликации распределённых гетерогенных баз данных «ruSBSS™» позволяет реализовать эффективный и надёжный двунаправленный информационный обмен между базами данных распределённых систем. При этом в рамках одной распределённой системы могут взаимодействовать базы данных, работающие под управлением различных СУБД:
|
|
|
| |