So-net無料ブログ作成

パフォーマンスモニタの監視項目 [Windows]


システム監視は、監視目的(ボトルネック、エラーや使用状況の検出)を明確にしておくことです。しかし、幾つかの項目の閾値は一般的な数値として定義できますが、多くの項目はシステム運用中にデータを取得しシステムに適合できる閾値を見極めることが大事だと思います。

扱う項目や依頼数の変化と監視項目の変化のデータを取り将来起こりうるボトルネックや障害を予想する為にもデータは日々取得し日次、週次、月次、半期及び年次などで分析を行う必要があります。

監視する項目

・CPUのボトルネックと使用状況

・メモリのボトルネックと使用状況

・ディスクのボトルネックと使用状況

・ネットワークのボトルネックと使用状況



スループット
スループットは単位時間(秒)当たりにシステムが実行できる処理数


ボトルネック
ボトルネックは、システムが処理を行っている時にリクエストからレスポンスを返す過程で滞留を起こしスループットの低下の原因になっているもの



Windows系の監視を行う場合は、パフォーマンスモニタにより監視を行うのが視覚的にも分かりやすくお手軽に使えると思います。

定期的にデータが欲しい場合も、ログファイルやDBに記録ができ定期的に情報を得ることも可能でです。また、リモートホストへのアクセスも権限があれば取得可能です。
*定期的にログを取得する場合は、シャットダウンのタイミングでログが収集されなくなるので”サービス”の”Performance Logs and Alerts”を”手動”から”自動”に切り替えてください。

パフォーマンスモニタでリモートサーバのデータを取得する場合は、下記の手順で取得します。
・[管理ツール]→[パフォーマンス] で[パフォーマンス]画面を開きます。
・[パフォーマンス ログと警告] を選択して、[新しいログの設定]で[オブジェクトの追加]画面を開きます。
・[オブジェクトの追加]画面で[次のコンピュータからカウンタオブジェクトを選ぶ]を選びコンピュータ名を追加します
LogicalDiskのパフォーマンスデータを取得すためにはdiskperfコマンドで監視を有効にしてください。
diskperfコマンド
引数:
-yv LogicalDiskを有効にする
-yd PhisicalDiskを有効にする
-y PhisicalDiskとLogicalDiskの両方を有効にする
-nv LogicalDiskを無効にする
-nd PhisicalDiskを無効にする
-n PhisicalDiskとLogicalDiskの両方を無効にする
* dsikprefコマンドの結果はシステムの再起動後になります。

パフォーマンスモニタ監視オブジェクト一覧
Memory

カウンタ 監視目的 説明/判定
Available Bytes 使用状況 プロセスの実行に使用できるバイト数
常に5MBより大
小さい値 → RAM不足
また、値が減少していく場合はメモリリークの可能性あり。
Pages/sec ボトルネック RAM,ディスク間読み書き込みページ数
20以下(理想は4,5)
大きい値 → ページングファイル使用
PAGEFILE.SYSのディスクのLogical Disk\Avg. Disk sec/Transferが共に10より大きな値の場合はメモリ増設の必要があり
Commit Limit ボトルネック 物理/仮想メモリを合わせた利用可能メモリ最大容量
ページ ファイルが最大ページファイルサイズに達している場合は、イベントビューアに"2001"、"2016"、"2019"または"2020"のエラーが表示されます。
"2001"、"2016"、"2020"の場合は、メモリーリークの恐れがありますので、プロセスのPage File Bytes または Working Set を監視してください。
"2019"の場合は、アプリケーションのシステムコールが、割り当てられた非ページプールを統べて使い果たしたために発生します。システムのMemory Pool Non Paged Bytes を確認してください。
"2019"と共に"利用可能な記憶領域が不足しているので、このコマンドを処理できません。"が表示された場合は、アプリケーションのシステムコールが正しくない可能性があるので、各プロセスの非ページプール割り当てを確認してください。
Commited Bytes ボトルネック メモリ使用量
物理メモリより大きい値 → ページングが頻繁に発生、メモリの増設が必要
Process
カウンタ 監視目的 説明/判定
Page Faults/sec ボトルネック メモリ上の指定されたワーキングセット内でのページフォルト
大きい値(20以上) → ページングが過度
Working Set ボトルネック アプリケーションが使用するメモリ使用量
%Processor Time 使用状況 サービスごとのCPU使用率
80%以上→高速なプロセッサにアップグレードするか、マルチプロセッサ化する。
% Privileged Time(_Total) 使用状況及びボトルネック 特権モードで費やされるCPU時間
User Time の 15% 未満
高い場合、障害をともなう機器によって発生した多数の割り込みが原因である可能性があります
25%を超える場合は、ディスクに問題がある場合が多いので高速なディスクに交換する必要があります
% User Time(_Total) 使用状況 ユーザー モードで費やされるCPU時間
Pool Nonpage Byte 使用状況 カーネルモードプログラムのスワップアウト不可のメモリ容量を表示
Pool Paged Byte と共に監視しどちらかの値だけが増加していく場合はメモリリークの可能性あり。
Paging File
カウンタ 監視目的 説明/判定
% Usage ボトルネック 使用中のページファイルインスタンスの合計をパーセントで表示
70%以上の場合は、メモリー使用量を調査し、必要に応じてRAMを増設する
Processor
カウンタ 監視目的 説明/判定
%Processor Time ボトルネック CPU使用率
継続して90%以上 → CPUのアップグレード/追加が必要
%Privileged Time ボトルネック カーネルコマンド実行のための特権時間に費やす時間の割合
できるだけ小さい値
大きい値 → ディスクI/Oサブシステムのパフォーマンスを上げる必要
Interrupts/sec ボトルネック 秒ごとにプロセッサが受け取って処理するハードウエア割り込みの平均値
1,000未満
4以上→CPUがボトルネックになっている
システムの変更が無いのに急激に値が増えた場合は、ハードウェア障害の恐れあり
Processor Queue Length ボトルネック CPUで命令が処理できなくて、待ちに入っている数。
2未満
2以上→CPUがボトルネックになっている。
間隔を置いて数回取得する必要があり
%User Time ボトルネック プロセッサがユーザープロセス実行に費やす時間の割合
他プロセス/アプリケーションが動作を妨げている可能性
Server Work Queues
カウンタ 監視目的 説明/判定
Queue Length ボトルネック CPU のサーバー作業キューの現在の長さです。
4を超える状態が続く場合は、プロセッサに負荷がかっています。 
System
カウンタ 監視目的 説明/判定
%Total Processor Time ボトルネック 全プロセッサの平均
Processor Queue Length ボトルネック プロセッサキューにあるスレッド数
2以下
2より大きい値 → CPUのアップ
グレード/追加が必要
Context Switches/sec ボトルネック プロセッサがスレッドを切り替える1秒あたりの回数
8000に達している → CPUのアップグレード/追加が必要
LogicalDisk
カウンタ 監視目的 説明/判定
% Free Space 使用状況 論理ディスク ドライブ上で使用可能な領域全体に対する空き領域の割合
PhysicalDisk
カウンタ 監視目的 説明/判定
%Disk Time ボトルネック ディスクI/O処理時間の割合
65%より小
Avg. Disk Bytes/Transfer ボトルネック 書き込みまたは読み取り操作中にディスク間で転送されたバイト数の平均値です
20KByte以下の場合は、ディスクI/Oがボトルネックになっています。
Avg. Disk sec/Transfer ボトルネック ディスク転送時間の平均秒数です
0.3 秒より大きい値は、エラーのためにディスク コントローラがディスクを再試行している場合があります。
Avg. Disk Queue Length ボトルネック ディスクI/O待ちキュー長の平均
スピンドル数+2より大きい値 → ディスクI/O処理要求で待ち発生
Current Disk Queue Length ボトルネック ディスクI/O待ちキュー長の平均
>2より大きい値 → ディスクI/O処理要求で待ち発生
Disk Reads/sec ボトルネック 読み取り操作比率
一般にUltra Wide SCSIディスクは1秒当たり、50~70のI/O処理が可能
Disk Write/sec ボトルネック 書込み操作比率
Redirector
カウンタ 監視目的 説明/判定
Current commands ボトルネック キューないのリダイレクタへの要求の数
ネットワークアダプタの数を超えている場合は、
・通信相手がサーバーのリダイレクタより遅い。
・ネットワークで容量の問題が発生している可能性がある。
・リダイレクタがビジーで、アダプタが追従できない。
の要因の可能性があります。ネットワークのセグメント化などの対応が必要
Network Errors/sec エラー状況 エラーの数
イベント ログをチェック
Reads Denieds/sec
エラー状況 ビジー状態で要求を拒否した数
カウントされている場合はメモリ割り当ての問題がある可能性あり
NetworkSegment
カウンタ 監視目的 説明/判定
%Net Utilization スループット ネットワーク・セグメントの利用率
Ethernetネットワークでは40%~60%を超えない
Network Interface
カウンタ 監視目的 説明/判定
Bytes Total/sec スループット 1秒あたりのNIC上で送受信されるバイト数
Packets Outbound Errors スループット エラーが原因で伝送されなかった発信パケットの数
Packets/sec スループット 1秒あたりのNIC上で送受信されるパケット数
Server
カウンタ 監視目的 説明/判定
Bytes Total/sec スループット 1秒あたりのサーバーがネットワーク間で送受信したバイト数
Bytes Total/secの合計がネットワークの最大転送速度とほぼ等しい場合、ネットワークをセグメントに分割する必要
Raw Reads Rejected/sec
Raw Writes Rejected/sec
ボトルネック ファイル転送のビジー
ファイル転送でビジーのときに使用されるRAW作業項目が使い切った時カウントされます。発生時にはレジストリ値のRawWorkItemsを増やす必要があります
Error System エラー状況 内部サーバー エラーが検出された回数
サーバに問題がる場合はほとんどなので調査が必要
Errors Access Permissions エラー状況 クライアントとしてのファイルのオープンが失敗し、STATUS_ACCESS_DENIED が出された回数数
ファイルへのアクセスをランダムに試みていることがわかります。急激に増えている場合は、Dos攻撃の可能性があります。
Errors Logon エラー状況 サーバーへのログオンに失敗した回数
急激に増えている場合は、サーバーのセキュリティを破ることを目的とするパスワード推測プログラムなどが使用されている可能性があります。
Error Granted Access エラー状況 ファイルへのアクセスが拒否された回数
アクセス権限を持たないユーザーがファイルにアクセス。急激に増えている場合は、Dos攻撃の可能性があります。
File Open 使用状況 サーバー上で現在開かれているファイルの数
現在のサーバーの処理状況を判定
Work Item Shortages ボトルネック 起動時にプロセッサに割り当てられる作業項目の数
3以上の場合は、InitWorkItems または MaxWorkItemsをレジストリ[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\LanmanServer\Parameters]の下に追加し、InitWorkItemsには任意の値(1~512)、MaxWorkItems(1~65,535)に4,096の倍数を指定し、閾値値が3未満なるように調整
Pool Nonpaged Failures ボトルネック 非ページ プールからの割り当てが失敗した回数
発生した場合は、コンピュータの物理メモリが少なすぎることを示します
Pool Paged Peak ボトルネック 最大ページング ファイル サイズと物理メモリ容量
IP
カウンタ 監視目的 説明/判定
Datagrams Received Header Errors 監視 不正なIPヘッダエラー(正しくないチェックサム、バージョン番号の不一致、そのほかのフォーマット エラー、タイムアウト、期限切れ TTL、IP オプション処理時に検出されたエラーなど) が原因で破棄されたデータグラムのカウンタ。
ルータなどのネットワーク機器エラー及びサービス拒否攻撃(DoS攻撃)などで発生する可能性がある。
Datagrams Received Unknown Protocol 監視 正常に受信されたが、不明またはサポートされていないプロトコルが原因で廃棄されたローカル アドレス指定のデータグラムの数

Windows2003やWindowsXpではlogmanというコマンドがあるので、これを使用してデータを収集すると便利です。

logmanは、リモート コンピュータのログファイル データの収集を開始、停止、実行中のログおよびトレースを照会することが出来ます。


nice!(1)  コメント(0)  トラックバック(2) 

nice! 1

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 2

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は180日以上新しい記事の更新がないブログに表示されております。