“高度安定稼働”を掲げて30年
JR旅客会社各社のみどりの窓口や駅の券売機、インターネット、旅行会社を通じた指定席の販売は、すべて旅客販売総合システム「MARS(マルス)」によって処理されている。最繁忙期には1日1,000万コール以上を処理する日本最大規模のシステムを、開発・運用するのが鉄道情報システム株式会社(以下、JRシステム)だ。そして2004年の採用以来20年間にわたりDB(データベース)としてMARSを支えてきたのが、日立製作所(以下、日立)が開発し今年で30周年を迎える高信頼なDBの「HiRDB」である。最新の「MARS 505」の開発担当主幹を務めたJRシステム 那須輝久氏と、HiRDBの開発者である原憲宏、MARSのSEを務める江口晶子が、MARSとHiRDBについて語り合った。
那須氏:MARSは1960年以来、60年以上稼働してきました。最新の「MARS 505」は、2018年から開発を始め2020年から稼働しています。MARSはJR旅客会社各社における指定席販売の中心を担っているので、“高度安定稼働”を重視して開発・運用しています。私自身は1世代前の「MARS 501」の追加機能開発からMARSに関わり始め、505では開発担当主幹を務めました。
初めてMARSにHiRDBを導入したのは2004年のことです。列車データの作成管理システムに採用したことが始まりでした。その後適用範囲は拡大し、現在は複数のシステムで利用されています。
原:長くご利用いただき、ありがとうございます。HiRDBはメインフレームの安定性と信頼性を、サポートを含めオープン環境で実現するというコンセプトで開発されました。とはいえ、障害がまったく発生しないわけではありません。そのため、障害が発生しても継続して運用し続けられることはもちろん、原因を迅速に特定できるよう、調査のためのログ取得機能などメインフレーム並みの機能を搭載しています。
那須氏:当社がHiRDBを使い続けている理由も、まさにそこにあります。一部海外のDBも使っているのですが、トラブル対応のスピードが全く違います。海外製の場合は本国に問い合わせて回答をもらうのですが、HiRDBであれば、日立が速やかに調査し、問題点を特定してくれます。MARSは社会インフラなので、何かあったときにその原因が特定できないと安心してお客さまにサービスを提供できません。
江口:私たちSEもトラブルが発生した際、いかに短時間で回復するかに注力して取り組んでいます。そこは当社の強みなので、このスピードを維持するために日々努力しています。
原:自社で開発しているため、当然HiRDBの中身は熟知しています。そのため、迅速かつ確実な対応が可能です。我々開発チームだけでなく、SEやサポート部門、品質保証部門を含め、全員が社会インフラを支えているという使命感と高い意識をもって臨んでいます。
那須氏:他にはあまりない構成のシステムなので難しい要望もありましたが、互いに議論を重ねることで、実現にこぎつけられました。実現の方法から提案してもらえて、助かっています。
那須氏:「MARS 505」では、旅行会社向けのネット販売機能、訪日外国人向けにJR旅客会社各社が共同で提供する「ジャパン・レール・パス」のネット販売機能などを追加しました。購入ルートの拡大に伴い大幅なアクセス数増加を想定していましたが、システムが稼働を始めた頃に新型コロナウイルスの感染が拡大。5類移行後に、ようやく人々の移動が戻り、訪日外国人も増えた今、アクセス数が急増しています。
インフラ面の強化としては、障害時にもシステムを止めないフォールトトレラントのデュアルシステム構成でDBを構築しました。2つのDBがそれぞれデータを処理するので、片方に問題が起きても、もう片方が処理を続けることができます。
江口:このご要望をいただいてから、業務設計、システム設計と製品事業部とで毎週のように打ち合わせを行って、どうすれば実現できるかを検討しました。検討の結果、データベース製品単体では実現が難しかったため、高信頼・高性能分散トランザクションマネージャ「uCosminexus OpenTP1」と組み合わせ、さらに業務プログラムでの作り込みで実装しました。ただし、機能が実現できても運用できなければ意味がありません。運用についても考慮した構成としています。
那須氏:尽力いただいたおかげで、問題なく稼働できています。そのほかに、データ閲覧用のDBも用意してもらいましたね。DBに保管されたデータを見たいと思っても、オンライン処理中は見ることができません。そこで、本番DBと同期した閲覧用のDBを作成してもらったのです。トラブルが起きてお客さまから問い合わせがあった際にも、すぐに回答できるようになりました。
原:先ほどのフォールトトレラントのデュアルシステムや閲覧用DBの作成を始め、本番DBに障害が発生しても稼働し続けるための工夫を多数施しています。当社では、時代に合わせて、HiRDBを含むソリューションをブラッシュアップし続けてきました。
那須氏:確かにHiRDB自体は堅ろうで、ほとんどダウンしません。システムトラブルの大半は、ヒューマンエラーです。ただ、機能を複雑にした結果オペレーションが複雑になり、ヒューマンエラーが起きやすくなったという面はあるので、そこが次の課題です。
那須氏:今後に向けて考えていることは3点あります。
1点目はシステム構成の改善です。フォールトトレラントのデュアルシステム構成には安心感がありますが、運用に手間がかかる上、当然ながらハードウェアが2倍必要で費用も倍かかります。そこで1系統のActive-Standby構成に変え、障害が発生した場合でもお客さまに影響を与えることなく高速で切り替えられないかと構想しています。
2点目が、オペレーションの複雑さの解消です。DBは手順にのっとって起動・終了する必要がありますが、例えばボタンを押すだけで起動・終了させられれば、ヒューマンエラーが発生するリスクを大きく低減できます。
3点目が、DBの再編成処理に対する改善です。処理件数が非常に多いので、頻繁に再編成処理が必要になります。しかし、時間がかかるので1日では再編成を完了させられません。現在は、スケジュールを組んで処理しており、日によって違うオペレーション方法をとっています。そうすると、必然的にミスが起きやすくなってしまう。そこで、再編成処理をなくしたい、できるだけ回数を減らしたいと考えています。
原:いずれも高いレベルのご要望ですが、現在実現に向けて検討を行っています。HiRDB単体では実現が難しい側面もあり、例えば運用に関しては当社の統合システム運用管理「JP1」とHiRDBを組み合わせることで自動運転を実現できると考えています。
江口:運用に際しては、製品を熟知したエンジニアと直接話をすることができるのも、当社の強みだと言えるのではないでしょうか。これからも製品の詳細を把握し、製品事業部と一丸となってお客さまが抱える課題の解決策を考えてまいります。
原:HiRDBは大規模トランザクションに耐えうる性能と高い信頼性、可用性を担保するというメインフレームのDNAを継承し成長してきました。その過程で、JRシステム様のようにトランザクションのことを細部まで理解してシステムを構築しているすばらしいお客さまからさまざまなご要望を得たことで、技術力を鍛えてこられたのだと思います。お客さまとのつながりを大切にさせていただいてきたからこそ、HiRDBは多くのお客さまから30年間採用され続けてきたのです。
HiRDBはデータと業務をシームレスにつなげ、優れたサービスを提供するための「要」として、これからも進化を続けます。今後もプラットフォームの多様化に追随し、変わらずシステムの高度安定稼働に貢献できるよう努めてまいります。
* 記載の会社名、製品名は、それぞれの会社の商標もしくは登録商標です。