[https://www.youtube.com/watch?v=ikBBe8p-LsE:embed:cite]
本動画では、令和5年度春期 ITサービスマネージャ試験 午後Ⅰ 問1を取り上げ、AIを用いた動的しきい値監視ソフトウェア(Rソフト)を導入してシステム監視を改善する事例を、問題文・解答例・採点講評の意図に沿って解説します。午後Ⅰで評価されるのは、AIという言葉の新しさに反応することではなく、自動化ツールの特性と限界を踏まえて監視設計を組み直し、誤検知や見逃しのリスクを管理しながら運用負荷を下げ、さらにインシデントの未然防止に活用するというサービスマネジメントの筋道を、与件根拠に基づいて説明できるかどうかです。本問は「固定しきい値監視の弱点」と「動的しきい値の利点・注意点」を対比させ、監視の改善を“検知の精度”と“対応の時間確保”と“記録の自動化”の三つの観点で整理できるかを問う構造になっています。 出題趣旨の中心は、監視の目的が単にアラートを鳴らすことではなく、サービス影響を防ぐために適切なタイミングで行動可能な情報を提供することにある、という理解です。W社の現行ルールではCPU使用率の固定しきい値を80%に置き、超過後に再発が確認されるとインシデントとして対応を開始する運用になっていますが、CPUが90%以上になると「業務影響有インシデント」として利用者への業務抑制依頼まで必要になるため、監視は「90%に至る前に手を打つ」設計になっていなければ意味が薄れます。採点講評が要求する視点もここにあり、単に“しきい値を変える”といった表面的な改善ではなく、改善が対応手順や行動可能時間にどう影響するかまで言及できるかが合否を分けます。 設問1(1)は、しきい値を80%から90%へ変更する案が現実的でなかった理由を問うことで、監視設計におけるバッファ時間の概念を理解しているかを確認しています。しきい値80%の監視には、80%を超えた段階で状況を把握し、必要なら利用者への連絡や業務抑制依頼に向けて準備する時間的余裕が存在します。これに対して90%は、既に業務影響が顕在化する領域であり、そこを最初の検知ラインにしてしまうと、検知した時点で手遅れに近く、インシデント対応に必要な時間が確保できなくなります。午後Ⅰの読解ポイントは、しきい値の議論を“誤検知の減少”だけで捉えず、“対応に必要なリードタイムが減る”という運用上の不利益として説明することです。採点講評でも、単に「業務影響有インシデントになるから」ではなく、「対応のための時間が減少するから」という行動可能性に踏み込んだ理由付けが求められている点が重要になります。 設問1(2)は、Rソフトが警告メッセージを出力した場合に監視チームが確認すべき内容を問うことで、AIの自動設定を無条件に受け入れない統制の考え方を試しています。Rソフトは過去4週間の平均値に指定する割合(5%ポイント)を加算してしきい値を自動設定しますが、設定しようとするしきい値が指定基準値(80%)を超える時間帯がある場合に警告が表示されるという仕様は、平常時でも高負荷になるとAIが判断していることを意味します。この場合、監視チームが確認すべきなのは、Rソフトが算出したしきい値が運用上妥当かどうか、つまり高いしきい値を許容してよい時間帯なのか、あるいはそもそも平常時の高負荷を放置してよいのかという点です。午後Ⅰの読解ポイントは、警告が出た事実を“異常”と短絡せず、“AIが置こうとしている基準が人間の運用ルールと整合しているか”をチェックする必要がある、と整理することです。採点講評の意図は、AIの導入が監視業務をゼロにするのではなく、設定の妥当性判断という新たなレビュー業務が発生することを理解しているかを確認する点にあります。 設問1(3)は、動的しきい値の計算を正確に行えるかを問う計算問題で、ここは午後Ⅰらしく手順の読み取りが重要になります。過去4週間の「同じ曜日・同じ測定時間帯」の平均値に5%ポイントを加えるという定義に従い、水曜日13:31~13:40のデータが67%、64%、66%、67%であれば平均は66%となり、しきい値は71%になります。計算そのものは難しくありませんが、同じ曜日・同じ時間帯を揃えるという条件を落とすと誤答になります。午後Ⅰの読解ポイントは、AIの学習といっても本問では統計的処理のルールが明示されており、与件の定義どおりに算出することが最優先である点です。 設問2(1)は、除外日の設定が必要な理由を問うことで、学習データの品質管理というAI活用の基本をサービス運用に結び付けています。W社では土日祝が休業日で、勤務日に高負荷処理が集中する前提があるため、平日の祝日のように“勤務日と同じ曜日だが負荷が低い日”を学習に含めると、平均値が下がり、結果としてしきい値が本来より低く設定されます。その結果、通常の勤務日負荷で誤ってしきい値超過となり、誤検知が増えるリスクが高まります。したがって除外日設定が必要である、という流れになります。採点講評の観点では、除外日の話を単なる設定作業としてではなく、「低負荷データを学習するとしきい値が下がる」という因果で説明できるかが重要で、ここがAIの特性理解の評価点になります。 設問2(2)は、Rソフト導入によって作業負担を減らせると判断した理由を問うことで、自動化の効果を“検知”ではなく“記録・証跡”に置いている点が特徴です。改善前は、しきい値超過のたびに監視チームが手動でイベント記録簿へ時刻や対象などを記録しており、これが運用負荷になっていました。Rソフトは、しきい値超過時のイベント情報と設定しきい値を自動的に記録し、イベント記録簿として出力できるため、記録作業が自動化され、工数削減が可能になります。午後Ⅰの読解ポイントは、AI導入の効果を「監視が賢くなる」だけで語らず、運用の定型作業が自動化されるという具体的な省力化の根拠を与件から拾うことです。採点講評の意図としても、運用改善は検知精度だけでなく、証跡管理や報告の効率化も含むというサービスマネジメントの視点が求められています。 設問3は、Rソフトを業務影響有インシデントの未然防止にどう活用できるかを問うことで、監視の価値を「早期発見」に置いています。与件の過去事例では、通常は同じ曜日・同じ時間帯でCPU使用率が50%程度なのに対し、インシデント発生日は70%が1時間継続し、その後80%超へ上昇して業務影響へ至っています。固定しきい値80%監視では、80%超過まで検知できず、検知後もルール上の待ち時間を経て対応開始となるため、70%の“前兆”段階で手が打てません。一方、Rソフトは通常50%程度なら動的しきい値を55%程度に置くため、70%で推移している時点で既にしきい値超過となり、平常時と異なる傾向を早期に検知できます。その結果、80%超に至る前に原因調査や負荷抑制などの対処が可能になり、業務影響有インシデントの発生を未然に防げる、という論理になります。採点講評が求めるのは、前日予測や一般論ではなく「当日のCPU推移が平常時と違うことを検知できる」という、動的しきい値の本質に根差した説明であり、ここを与件事実と結び付けて書けるかが高得点の分岐点です。 この問題で合否を分ける論点は、AI導入を“しきい値を自動で決める便利な道具”として捉えるのではなく、運用設計の中でどこを自動化し、どこを人がレビューし、どのタイミングで行動できる状態を作るかという統制の視点で整理できるかにあります。しきい値を90%に上げる案がダメなのは、誤検知の議論ではなく対応時間が減るというサービス影響の議論であり、警告メッセージはAIの判断を人が検証するトリガであり、除外日は学習データの偏りを排除して誤検知を抑える統制であり、イベント記録の自動化は運用負担と証跡品質を同時に改善する効果であり、前兆検知は固定しきい値では拾えない傾向変化を捉えることで未然防止へ繋がる、という一貫した構造を押さえることが重要です。難所は計算よりも、動的しきい値が“通常の振る舞いからの逸脱”を検知する仕組みであることを理解し、そこから運用改善と未然防止の効果を論理的に導く部分にあります。 最後に、この動画を見る意義をまとめます。令和5年度春期 ITサービスマネージャ 午後Ⅰ 問1は、AIを用いた監視改善という題材を通じて、監視の目的を行動可能時間の確保と未然防止に置き、学習データの扱いと人のレビューを含む運用統制を設計し、記録の自動化で運用負担を下げるという、現場で通用する監視設計の考え方を問う良問です。本動画では、問題文・解答例・採点講評が示す「対応時間を意識したしきい値設計」「AIの自動設定に対する妥当性確認」「除外日による学習品質管理」「イベント記録簿の自動生成による省力化」「傾向変化の早期検知による未然防止」を、午後Ⅰの読解ポイントとして再現可能な形で整理します。過去問の解説として理解するだけでなく、次に出会う監視・運用改善系の午後問題でも同じ観点で答案を組み立てられるようになることが、この動画を視聴する最大の価値です。