ITインフラを安定稼働させるために運用業務は欠かせません。運用を疎かにすると、システム障害が頻発する、場当たり的に拡張をして現状を把握しきれなくなる、といった問題が発生するからです。
しかし「そもそも運用とは何をすれば良いのか」「効率的な運用の仕方がわからない」とお悩みのIT担当者もいるでしょう。自社のリソースも限られているため、運用の負担を軽減したい方も多いかと思います。
そこで本記事では以下の内容について紹介します。
- ITインフラ運用の主な業務
- 運用が重要である理由
- 効率的に運用するためにやるべきこと
- 運用の主な依頼先
本記事を最後まで読めば、自社のITインフラを安定的に運用する方法と運用を外注すべきかどうかの判断ができます。ITインフラ運用でお困りの企業のシステム担当者、経営者の方はぜひ参考にしてください。
ITインフラ運用とは?
ITインフラの運用とは、継続的なサービス提供のために、サーバーやアプリケーションなどが正常に動作しているかチェックする業務です。主な運用対象は以下のとおりです。
- ハードウェア:サーバー、ネットワークストレージなど
- ソフトウェア:OS、ミドルウェア、アプリケーションなど
ハードウェアとはシステムを構成する電子部品全般を指し、ソフトウェアはハードウェア上で動くプログラムを意味します。人体にたとえると、ハードウェアは腕や足でソフトウェアは脳と言えるでしょう。
ITインフラは構築したらそれで終わりではありません。劣化したハードウェアや時代にそぐわないソフトウェアを使い続けると、生産性の低下だけでなくシステム障害やセキュリティ事故などの発生も想定されます。安定したサービス提供と持続的な企業活動をするうえで、ITインフラ運用は欠かせません。
システム運用との違い
ITインフラ運用とよく似た用語でシステム運用という言葉もあります。
システム運用とは、ITインフラ上で動くコンピューターシステムやソフトウェアを運用する業務です。プログラムの改修やバージョンアップ、セキュリティパッチの適用などの業務が該当します。
一方ITインフラ運用は、サーバーやネットワークなどITインフラに関わるもの全般を運用することです。機器の劣化チェックやトラフィック監視などさらに幅が広くなります。このように、システム運用はITインフラ運用と比べて運用対象が狭い点が特徴です。
ただし、両者の業務を厳密に分けることは難しく、現場レベルでは同じ意味で使われることも少なくありません。
保守との違い
保守も運用と混同しやすい用語ですが、それぞれ以下のような意味で使われます。
- 保守:障害発生時の復旧作業、システム改修、ハードウェアの修理・交換など
- 運用:監視、管理、機器のメンテナンスなど
おおきな違いは、システムそのものを変えるかどうかです。運用はシステムが正常に稼働できるよう、データのバックアップ、サイバー攻撃の監視、メモリ容量の確認などを行いますが、システム自体を変えるわけではありません。
一方、保守では障害や不具合が発生したときに原因を特定し、プログラムの改修やマシンの修理を行います。つまり、システム品質の維持・向上のためにシステムそのものに手が加えられるのです。
しかし、多くの運用現場では保守を兼任しているエンジニアも多いため、両方の知見をもった人材が重宝されます。
ITインフラ運用が重要な理由
ITインフラが重要な理由は、サービスの安定提供や企業活動の生産性に直結するからです。
ITインフラは構築して終わりではなく、むしろ運用からが本番と言えます。たとえば、サービスが拡大すればサーバー増築や新たなアプリが必要になるでしょう。ハードウェアが老朽化すればシステムダウンする恐れもあるため、パフォーマンスの管理は不可欠です。
また、ソフトウェアを更新しないまま使い続けるとセキュリティリスクも高まります。下のグラフは、東京商工リサーチが調査したウイルス感染・不正アクセスによる事故の発生件数の推移で、2012年~2023年の間で約10.3倍に増加しました。
多くのサイバー攻撃は、長年放置されたシステムの脆弱性を狙って行われます。これらを想定せずに運用すると、トラブルが起こるたびにその場しのぎの対策を迫られ、最終的に重大事故につながる恐れがあります。
ITインフラ運用の主な仕事内容
ここでは、ITインフラ運用の主な仕事内容を紹介します。一口に運用と言っても多岐に渡るので、代表的な業務をピックアップします。
システム監視
システム監視とは、サーバーやネットワークが正常に動作しているか監視することです。定期的にチェックすることで、不具合やサイバー攻撃などに素早く対応できるでしょう。
監視業務は主に以下の3つに分類されます。
業務内容 | 概要 | 主な監視対象・確認項目 |
性能監視 | システムのパフォーマンスが安定しているか監視 | CPU メモリー ディスク トラフィック |
死活監視 | サーバーが止まっていないか監視 | PINGの応答時間 |
ログ監視 | システムの稼働履歴を監視 | 不正アクセスの有無 情報漏えいの有無 |
監視が疎かだと、Webサービスの停止に気づけなかったりサイバー攻撃への対応が後手に回ったりします。そうなると損失を被るだけでなく、自社の管理体制も問われるでしょう。最悪の場合、顧客への賠償責任も発生しかねません。
システム監視は、24時間必要なうえに付加価値も低いため敬遠されやすいですが、ITインフラの安定運用に欠かせない業務です。
定期メンテナンス
ITインフラを安定稼働させるためには定期メンテナンスも重要で、主な業務は以下の2つです。
- セキュリティパッチの適用
- アップデート
なお、定期メンテナンスでは改修業務も行われるため、保守として扱うケースもあります。
セキュリティパッチの適用
セキュリティパッチとは、OSやアプリの脆弱性を解消するために開発元が配布するプログラムのことです。開発当初は問題なかったソフトウェアでも、リリース後に欠陥が見つかることは珍しくありません。
また、サイバー攻撃の高度化で脆弱性が露呈することもあります。このような事態に一早く対応するために、セキュリティパッチでソフトウェアを修正しなければいけません。
アップデート
アップデートとは、OSやアプリを最新のバージョンに維持することで、具体的には新機能の追加やバグの修正などを行います。
アップデートを疎かにすると「最新のソフトウェアが使用できない」「システムの拡張・統合が進まない」といったトラブルに直面しかねません。そうなるとITインフラ全体の生産性が低下するため、アップデートは細めに行う必要があります。
ITインフラを運用するときのポイント5つ
ITインフラを運用するときのポイントを5つ紹介します。
- 運用の重要度を設定する
- スケールアップ・スケールアウトも視野に入れる
- 障害対応フローを策定する
- 数値で運用の安定性を評価する
- 監視ツールを活用する
どれもITインフラの安定稼働に不可欠な要素なので、ここでしっかり押さえておきましょう。
1. 運用の重要度を設定する
すべてのITインフラを同じ品質で運用するのは現実的ではありません。システムの種類や事象ごとに運用の重要度を区分けし、障害発生時の優先順位をつけましょう。
病院のシステムを例に挙げると、電子カルテや臨床検査システムなどが止まれば、夜間・休日でも即時に対応しなければなりません。運用担当者にデバイスを持たせ、アラートに気づけるように体制を整える必要があります。
一方、経理システムで「メモリの使用率が高くなった」「あと数日でディスク容量がいっぱいになる」といった事象が発生した場合、次回出勤時に対応すれば良いだけです。冗長性が確保されているのであれば、すぐユーザーに影響が出るとは限りません。このように、障害の影響度とシステムの構成から逆算すれば、適切に運用リソースを配分できます。
2. スケールアップ・スケールアウトも視野に入れる
ITインフラは構築時のスペックで運用するケースは稀です。拡張を踏まえてスケールアップ・スケールアウトの余地も残しましょう。
スケールアップとは、サーバー・アプリケーション単体の性能を上げること。スケールアウトは、サーバーを増築してシステムの冗長性を確保することを指します。
運用リソースの生産性を上げるコツは、スケールアップとスケールアウトを組み合わせることです。たとえばオンプレミス(自社にサーバーを設置するタイプ)だと、サーバー置き場に物理的制約があるため、スケールアップに限界があります。
その場合、性能要件に見合うサーバーでスケールアップし、その他のサーバーはスケールアウトするという手段が取れます。スケールアップとスケールアウトのバランスを取りながら、適切なパフォーマンスを維持しましょう。
3. 障害対応フローを策定する
残念ながら、ITインフラの障害を100%防ぐことはできません。いざ障害が発生したときにダウンタイムを縮小できるよう、上図のように対応フローを策定しましょう。具体的には下のように事象を場合分けして、対応方法を決めます。
- Webサービスのレスポンスが遅い→チューニングかネットワーク帯域の確認
- システムそのものがフリーズ→現象を記録して外注先の窓口に連絡
- CPU使用率が急上昇→データベースへの同時接続数を確認
また障害対応時には情報を共有することが大切です。あらかじめ用意したフローに加え、チャットツールやホワイトボードも駆使して密な連携を取りましょう。
なお人為的ミスが原因の場合、ミスをした本人を責めるのはNGです。ミスとは本人の能力より外的要因に左右されることも多く、タイミングが違えば他の人も同じ過ちを犯す可能性があります。「誰がミスしたのか」ではなく「なぜミスが起こってしまったのか」に焦点を当てましょう。
4. 数値で運用の安定性を評価する
ふだんの運用だと目に見えたトラブルはあまり出てきませんが、知らず知らずのうちにシステムのパフォーマンスが低下している恐れがあります。
また、運用の安定性の評価は担当者の主観に委ねられることも多いため、正常かどうか判断を誤ることもあります。運用の品質を定量評価できるよう、下記の指標を活用しましょう。
指標 | 概要 | 計算式 |
MTBF(平均故障間隔) | 平均して何時間ごとに 故障が発生するか | 故障時間の合計/故障回数 |
MTTR(平均修理時間) | 故障発生時に平均して何時間で復旧できるか | 合計修理時間/故障回数 |
稼働率 | システムの安定性 | MTBF/(MTBF+MTTR) |
稼働率が高いほど安定している証拠です。また、外注するときに稼働率をSLA(サービス品質保証)に盛り込むと、契約内容が要件を満たしているか判断できます。
5. 監視ツールを活用する
運用のメインである監視は24時間必要な業務ですが、人の目で行うのはコストもかかるうえに、ミスが発生するリスクも高まります。加えて運用は付加価値が低いので、上図のような監視ツールを使ってリソースを有効活用しましょう。
監視ツールを導入することで、システムの可視化や異常検知を行えるようになります。CPU使用率や通信量、データベースへの接続数といったデータを収集できるため、障害の予兆を掴みやすくなるでしょう。
また、近年はAIを応用したツールも誕生しており、ツール自ら異常パターンを学習してアラートを発報することもできます。
ITインフラ運用の主な依頼先3つ
ITインフラを運用するときの主な依頼先を3つ紹介します。
- 社内システム部門
- システム運用会社
- フリーランスエンジニア
ぞれぞれの依頼先に特徴があるので、自社の運用課題を踏まえて選びましょう。
1. 社内システム部門
メリット | デメリット |
価値観・企業文化を理解している 運用ノウハウが蓄積される コミュニケーションがスムーズ | 採用・育成コストがかかる 設備投資が必要 |
社内システム部門に運用を委託するのはメジャーな手段で、内製化とも言います。
自社の人材なら企業文化や価値観を理解しているので、ベースのコミュニケーションがスムーズに進みます。業務を通じて知見・ノウハウも貯まるため、長期的な運用技術の向上を見込めるでしょう。また、システムトラブルや機器の修理などが発生しても、自社のエンジニアならすぐ対応できます。
ただし、エンジニアによって技術力に差があることに注意が必要です。当然ながら新卒とベテランでは知識・経験に差があるため、誰が運用を担うかで障害の復旧速度や稼働率が変わります。そして、自社で運用する場合は監視ツールやデバイスなど設備投資も必要です。これらの投資に見合うか考慮したうえで、内製化すべきか判断することが大切です。
2. システム運用会社
メリット | デメリット |
運用リソースを削減できる 運用の品質が上がる | 自社に運用ノウハウが蓄積されない 外注費が負担になる |
システム運用会社へ委託するのもオーソドックスな方法です。
運用に必要な人材や育成コストが不要なため、リソースを新規営業や商品開発といった付加価値の高い業務に費やすことができます。また、運用会社は専門的な技術・人材を駆使してシステムを運用しています。最新のテクノロジーや異常時対応にも精通しているため、質の高い運用を期待できるでしょう。
デメリットは、運用コストが高くなることです。そもそも、運用コストの相場は開発費の約5~15%で毎月発生します。そこに外注のマージンが加わるため、結果として運用コストが割高になります。また、自社にノウハウ・知見が貯まらない点にも注意が必要です。運用トラブルは頻発するものではありませんが、いざ異常が発生したときに自社で対応ノウハウがないとダウンタイムが伸びてしまいます。
以上の点を踏まえ、システム運用会社に外注するときには「すべての運用を任せるのか」「徐々に内製化するのか」などを慎重に検討しましょう。
3. フリーランスエンジニア
メリット | デメリット |
即戦力を活用できる 新しい知見を得やすい 自社ニーズに応じて人材を活用できる | 人材の質がまちまち 業務への熱意に差が出る |
ITインフラ運用に長けた人材を求めるなら、フリーランスエンジニアがおすすめです。
フリーランスエンジニアは、専門スキルを生かして多様なプロジェクトを経験しているため、即戦力として動いてくれます。自社にはない知識・スキルも豊富なため、業務の視野を広げるうえでも有効です。
また、フリーランスは期間を決めて契約することが多いため、自社のニーズに応じて活用することができます。たとえば、運用の初期段階はフリーランスエンジニアにアシストしてもらい、安定したタイミングで内製化という方法も取れるでしょう。
ただし、フリーランスエンジニアは経験も得意分野も異なります。案件によっては熱意に差がでることもあるため、自社の運用ニーズにマッチした人材を採用することが重要です。
ITインフラ運用を依頼するならクロスネットワークがおすすめ
本記事ではITインフラの運用業務とその重要性、外注のメリットなどについて解説しました。ITインフラの運用は、サービスの安定稼働や企業の生産性向上において不可欠です。運用に注力しないとシステム障害やセキュリティリスクの増大も考えられ、いざトラブルが発生したら多大な損失を被ります。
しかし「自社で運用する余裕がない」「専門知識がないため、非効率な運用になってしまう」という企業もいるでしょう。
優秀なエンジニアにITインフラの運用をお願いするなら、ぜひクロスネットワークにご相談ください。クロスネットワークはインフラエンジニア専門のエージェントサービスで、インフラ運用に長けた人材をクライアントの要望に合わせてスムーズにマッチングします。
採用後のやりとりもサポートしますので、トラブルを回避できるのもメリットです。さらに、登録しているインフラエンジニアと合意があれば、正社員登用もできます。
エージェントに相談いただければ、最短3営業日でのアサインも可能です。また、週3日程度の依頼も可能なので、自社の必要リソースに合わせて外注できます。
こちらよりサービス資料を無料でダウンロードできます。即戦力のインフラエンジニアをお探しの方は【お問い合わせ】ください。平均1営業日以内にご提案します。
- クロスネットワークの特徴
- クロスネットワークに登録しているインフラエンジニア参考例
- 各サービスプラン概要
- 支援実績・お客様の声
新卒で大手インフラ企業に入社。約12年間、工場の設備保守や運用計画の策定に従事。 ライター業ではインフラ構築やセキュリティ、Webシステムなどのジャンルを作成。「圧倒的な初心者目線」を信条に執筆しています。