10.1 モニタリング

サービスの概要

概要

お客さまがいつでも本サービスの正常性・パフォーマンスが評価できるように、仮想サーバをはじめとする各種リソースの情報(メーター)を収集し、レポートする機能を提供します。
また、監視項目に対して閾値を設定することで、アラームを設定できます。アラームは指定したメールアドレスに送られます。
お客様は、本モニタリング機能によって以下の管理を実現することができます。
  • 監視対象の死活確認、リソース不足
  • 各設備の統計情報を確認することによるキャパシティ管理
  • 故障発生状況の記録

特徴

本モニタリングの基本機能は無料でご利用いただけます。
お客様のご利用方法や目的によって、基本機能で不足する場合は、有料メニューにお申し込みいただくことで機能を拡張することができます。

利用できる機能

機能一覧

モニタリングでは、お客様が必要な設定を行うことで、以下の機能をご提供いたします。

機能 内容
データ収集・蓄積 各種リソースからモニタリングに必要なデータを収集し、一定期間蓄積しておくことが可能です。
カスタムメーター スクリプト等で収集したデータ値をモニタリングサーバーに蓄積することができます。
グラフ生成機能 モニタリングによって収集・蓄積したデータをもとに、グラフ表示して可視化する機能です。
アクション設定機能 お客様が各種リソースに設定した閾値を超過した場合に幾つかのアクションを設定することが可能です。
監視項目一覧 設定された監視項目を一覧で表示し、確認することが可能です。
アラーム履歴画面 過去に閾値を超過しアクションした履歴を確認することが可能です。
データダウンロード APIによって蓄積されているモニタリングのデータをダウンロードすることが可能です。
API APIを利用することが可能です。

各機能の説明

データ収集・蓄積

  • 各種リソースから監視項目に該当するデータを収集します。
  • 収集されたデータはシステム上に蓄積され、後述のグラフ表示機能として利用することが可能です。
  • データの蓄積期間は、32日間(当日含む)です。

Virtual Server Instance

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
CPU使用率 ※1 CPU Utilization nova.cpu.utilization.percents percent 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の平均値を算出 5分
ディスク読取バイト数 Disk Read Bytes nova.disk.read.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク書込バイト数 Disk Write Bytes nova.disk.write.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク読取回数 Disk Read Requests nova.disk.read.requests request 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク書込回数 Disk Write Requests nova.disk.write.requests request 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ネットワーク受信バイト数 Incoming Traffic nova.network.incoming.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ネットワーク送信バイト数 Outgoing Traffic nova.network.outgoing.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
VM死活監視 ※2 VM Status nova.vm.status.bool boolean
仮想サーバーインスタンスが起動しているHypervisor上で収集
正常=0
故障=1
監視時の値 1分
HV死活監視 Hypervisor Status nova.hv.status.bool boolean
仮想サーバーインスタンスが起動しているHypervisor上で各仮想サーバーインスタンスのネットワークインターフェースのステートにより判定
正常=0
故障=1
監視時の値 1分

注釈

※1 値の最大値は”100 percent x CPUのコア数”となります。(例:仮想サーバーインスタンスが16CPUの場合、値は 0 ~ 1600 percentの範囲となります。)

注釈

※2 “VM死活監視”は仮想サーバーインスタンスを提供する基盤側からの監視結果を示しており、仮想サーバーインスタンスが起動したままの状態で発生するインスタンス内部のトラブル(カーネルパニックやOSクラッシュ) による故障を検知することはできません。


Virtual Server Volume

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
ディスク読取バイト数 Disk Read Bytes cinder.disk.read.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク書込バイト数 Disk Write Bytes cinder.disk.write.bytes byte 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク読取回数 Disk Read Requests cinder.disk.read.requests request 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分
ディスク書込回数 Disk Write Requests cinder.disk.write.requests request 仮想サーバーインスタンスが起動しているHypervisor上で収集 監視間隔内の合計値を算出 5分

Baremetal Server / vSphere ESXi / Hyper-V

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
筐体電源 Chassis Power Status baremetal-server.chassis-power.status.bool boolean
当該リソースからIPMIにより収集
オン=false (0)
オフ=true (1) と定義
監視時の値 5分
ファン故障 Fan Status baremetal-server.fan.status.bool boolean
当該リソースからIPMIにより収集したファン故障の有無により判定
1つでもファンが故障していたら、true (1)を送信
正常時は、false(0)を送信
監視時の値 5分
筐体電源故障 Power Supply Status baremetal-server.power-supply.status.bool boolean
当該リソースからIPMIにより収集
1つでも電源が故障していたら、true (1)を送信
正常時は、false(0)を送信
監視時の値 1分
CPU故障 CPU Status baremetal-server.cpu.status.bool boolean
当該リソースからIPMIにより収集したCPU故障の有無により判定
1つでもCPUが故障していたら、true (1)を送信
正常時は、false(0)を送信
監視時の値 1分
メモリ故障 Memory Status baremetal-server.memory.status.bool boolean
当該リソースからIPMIにより収集したメモリ故障の有無により判定
1つでもメモリが故障していたら、true (1)を送信
正常時は、false(0)を送信
監視時の値 1分
HDD故障 Disk Failure Number baremetal-server.disk.status.failures int
当該リソースからIPMIにより収集したメモリ故障の有無により判定
故障しているディスクの本数を送る(0~36)
監視時の値 1分
NIC故障 NIC Status baremetal-server.nic.status.bool boolean
当該リソースからIPMIにより収集したメモリ故障の有無により判定
1つでもNICが故障していたら、true (1)を送信
正常時は、false(0)を送信
※Workload Optimized 2では表示されません
監視時の値 1分
システムボード故障 System Board Status baremetal-server.system.board.status.bool boolean
当該リソースからIPMIにより収集したメモリ故障の有無により判定
1つでもシステムボードが故障していたら、true (1)を送信
正常時は、false(0)を送信
※Workload Optimized 2では表示されません
監視時の値 1分
その他故障 Other Statuses baremetal-server.etc.status.bool boolean
当該リソースからIPMIにより収集した以下の故障の有無により判定
- RAIDコントローラー故障
- HDD情報が取得できなかった場合(Workload Optimaized 2のみ)
- その他の故障
上記を検知したら、true (1)を送信
正常時は、false(0)を送信
監視時の値 1分

Internet Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
トラフィックIN Incoming Traffic internet-connectivity.traffic.in.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic internet-connectivity.traffic.out.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
GW死活監視 Gateway Status internet-connectivity.internet_gateway.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のSNMP応答の有無により判定
Internet GWのロジカルネットワークと接続されているIF
正常=0
故障=1
監視時の値 1分
IF死活監視 Interface Status internet-gw-interface.gw_interface.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のVRRPステータスの正常性により判定
Internet GWのInternetと接続されているIF
正常=0
故障=1
監視時の値 1分

注釈

インターネットゲートウェイに対するグローバルIPが存在しない場合、インターネット接続のトラフィックが発生しないため、トラフィックINとトラフィックOUTのサンプル値はモニタリングされません。


VPN Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
トラフィックIN Incoming Traffic vpn-interface.traffic.in.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic vpn-interface.traffic.out.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
GW死活監視 Gateway Status vpn-connectivity.vpn_gateway.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のSNMP応答の有無により判定
正常=0
故障=1
監視時の値 1分
GW-IF死活監視 Interface Status vpn-gw-interface.gw_interface.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のVRRPステータスの正常性により判定
VPN GWのロジカルネットワークと接続されているIF
正常=0
故障=1
監視時の値 1分
IF死活監視 Interface Status vpn-interface.vpn_interface.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のVRRPステータスの正常性により判定
VPN GWのVPN網と接続されているIF
正常=0
故障=1
監視時の値 1分

Logical Network

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
トラフィックIN Incoming Traffic logical-network-port.traffic.in.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic logical-network-port.traffic.out.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
NW死活監視 Operational State logical-network.network.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器に対するHTTPによるヘルスチェックの結果により判定
正常=0
故障=1
監視時の値 1分
ポート死活監視 Operational State logical-network-port.port.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器から収集
正常=0
故障=1
監視時の値 1分

Datacenter Inter-Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
トラフィックIN Incoming Traffic interdc-interface.traffic.in.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic interdc-interface.traffic.out.bps bps 当該リソースの機能が割り当てられたネットワーク機器から収集 監視間隔内の平均値を算出 5分
GW死活監視 Gateway Status interdc-connectivity.interdc_gateway.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のSNMP応答の有無により判定
正常=0
故障=1
監視時の値 1分
GW-IF死活監視 Interface Status interdc-gw-interface.gw_interface.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のVRRPステータスの正常性により判定
Datacenter Inter-Connectivity GWのロジカルネットワークと接続されているIF
正常=0
故障=1
監視時の値 1分
IF死活監視 Interface Status interdc-interface.interdc_interface.status.bool boolean
当該リソースの機能が割り当てられたネットワーク機器のVRRPステータスの正常性により判定
Datacenter Inter-Connectivity GWの網側と接続されているIF
正常=0
故障=1
監視時の値 1分

Amazon Web Services Inter-Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
GW死活監視 Gateway Status aws-connectivity.aws_gateway.status.bool boolean
AWSと接続されているネットワーク機器のSNMP応答の有無により判定
正常=0
故障=1
監視時の値 1分
GW-IF死活監視 Interface Status aws-gw-interface.gw_interface.status.bool boolean
AWSと接続されているネットワーク機器のVRRPステータスの正常性により判定
正常=0
故障=1
監視時の値 1分
トラフィックIN Incoming Traffic aws-interface.traffic.in.bps bps AWSと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
トラフィックOUT Outgoing Traffic aws-interface.traffic.out.bps bps AWSと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
IF死活監視 Interface Status aws-interface.aws_interface.status.bool boolean
AWSと接続されているネットワーク機器のBGPステータスの正常性により判定
正常=0
故障=1
監視時の値 1分

Google Cloud Platform Inter-Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
GW死活監視 Gateway Status gcp-connectivity.gcp_gateway.status.bool boolean
GCPと接続されているネットワーク機器のSNMP応答の有無により判定
正常=0
故障=1
監視時の値 1分
GW-IF死活監視 Interface Status gcp-gw-interface.gw_interface.status.bool boolean
GCPと接続されているネットワーク機器のVRRPステータスの正常性により判定
正常=0
故障=1
監視時の値 1分
トラフィックIN Incoming Traffic gcp-interface.traffic.in.bps bps AWSと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
トラフィックOUT Outgoing Traffic gcp-interface.traffic.out.bps bps AWSと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
IF死活監視 Interface Status gcp-interface.gcp_interface.status.bool boolean
GCPと接続されているネットワーク機器のBGPステータスの正常性により判定
正常=0
故障=1
監視時の値 1分

Azure Inter-Connectivity

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
GW死活監視 Gateway Status azure-connectivity.azure_gateway.status.bool boolean Azureと接続されているネットワーク機器からSNMPによって取得 監視時の値 1分
GW-IF死活監視 Interface Status azure-gw-interface.gw_interface.status.bool boolean Azureと接続されているネットワーク機器からnetconfによって取得 監視時の値 1分
トラフィックIN Incoming Traffic azure-interface.traffic.in.bps bps Azureと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
トラフィックOUT Outgoing Traffic azure-interface.traffic.out.bps bps Azureと接続されているネットワーク機器からSNMPによって取得 5分間の平均値を送信 5分
IF死活監視 Interface Status azure-interface.azure_interface.status.bool boolean
Azureと接続されているネットワーク機器のBGPステータスの正常性により判定
正常=0
故障=1
監視時の値 1分

Firewall(Brocade 5600 vRouter)

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
CPU使用率(User) CPU Utilization (User) firewall.cpu.user.percents percent 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
CPU使用率(System) CPU Utilization (System) firewall.cpu.system.percents percent 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
CPU使用率(Idle) CPU Utilization (Idle) firewall.cpu.idle.percents percent 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
割り当てメモリ Memory Total firewall.memory.total.kbytes kbyte 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
利用可能メモリ Memory Available firewall.memory.available.kbytes kbyte 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
TCPアクティブ接続数 TCP Active Connections firewall.tcp.active.connections connection 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 起動時から総接続数 5分
TCPパッシブ接続数 TCP Passive Connections firewall.tcp.passive.connections connection 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 起動時から総接続数 5分
FW死活監視 Firewall Status firewall.firewall.status.bool boolean
当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMP応答の有無により判定
正常=0
故障=1
監視時の値 1分
IF死活監視 Interface Status firewall-interface.firewall_interface.status.bool boolean
当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集
正常=0
故障=1
監視時の値 1分
トラフィックIN Incoming Traffic firewall-interface.traffic.in.bps bps 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic firewall-interface.traffic.out.bps bps 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分

Firewall(vSRX)

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
CPU使用率(RE) CPU Utilization (RE) vsrx.cpu.utilization-re.percents percent vSRX の RE (CPU処理部分) のCPU usage (%) 監視間隔内の平均値を算出 5分
CPU使用率(FPC) CPU Utilization (FPC) vsrx.cpu.utilization-fpc.percents percent vSRX FPC (Packet転送部分) のCPU usage (%) 監視間隔内の平均値を算出 5分
メモリ使用率(RE) Memory Utilization (RE) vsrx.memory.utilization-re.percents percent vSRX の RE (CPU処理部分) のMemory usage (%) 監視間隔内の平均値を算出 5分
メモリ使用率(FPC) Memory Utilization (FPC) vsrx.memory.utilization-fpc.percents percent vSRX の FPC (Packet転送部分) のMemory usage (%) 監視間隔内の平均値を算出 5分
TCPアクティブ接続数 TCP Active Connections vsrx.tcp.active.connections cps(connections per sec) vSRXから累積値を取得し、差分をcps(connections per sec)に変換して表示 5分間の平均値 5分
TCPパッシブ接続数 TCP Passive Connections vsrx.tcp.passive.connections connection vSRXから累積値を取得し、差分をcps(connections per sec)に変換して表示 5分間の平均値 5分
死活監視1(sysUptime) OS Monitoring Status vsrx.os.monitoring.status.bool boolean
vSRXから SNMP sysUptime を取得した返り値から、snmpによるモニタリングが正常かどうかを判定
正常=0
故障=1
監視時の値 1分
死活監視2(vSRX GuestOS) OS Login Status vsrx.os.login.status.bool boolean
vSRX へ rest API でログイン処理実施可能かどうかを判定
正常=0(200 OK)
故障=1(401 Unauthorized)
監視時の値 1分
死活監視3(nova VM) VM Status vsrx.vm.status.bool boolean
仮想サーバーインスタンスが起動しているHypervisor上で収集
正常=0(200 OK & Status Active)
故障=1(200 OK & Status Shut Off)
監視時の値 1分
トラフィックIN Incoming Traffic for ge-00X vsrx.ge-00X.traffic.in.bps bps
vSRXからは累積値を収集(ifHCInOctets)し、前回との差分をbyteからbps(bit per sec)に変換して表示
“ge-00X”は、Interface毎に表示
監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic for ge-00X vsrx.ge-00X.traffic.out.bps bps
vSRXからは累積値を収集(ifHCInOctets)し、前回との差分をbyteからbps(bit per sec)に変換して表示
“ge-00X”は、Interface毎に表示
監視間隔内の平均値を算出 5分

注釈

  • vSRXのメーターでは、インターフェース数が15port分表示されますが、ge-008〜ge-014のインターフェースは利用されていません。したがって、モニタリングデータも表示はされませんのでご注意ください。
  • メモリ使用率(FPC)は、Juniper社vSRXの仕様上67%を常に使用した状態となります。したがって、67%以上のメモリを使用した場合に値が変動します。

Load Balancer(NetScaler VPX)

メーター メーター表示名 メーター名 単位 収集元及び判定方法 備考 監視間隔
CPU使用率 CPU Utilization load-balancer.cpu.usage.percents percent
当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集
コアごとの値を合算
監視間隔内の平均値を算出 5分
メモリ使用量 Memory Usage load-balancer.memory.usage.percents percent 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
リクエストHTTP数 HTTP Request Connections load-balancer.http.request.connections connection 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 起動時から総リクエスト数 5分
TCPクライアントコネクション数 TCP Client Connections load-balancer.tcp.client.connections connection 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
TCPサーバコネクション数 TCP Server Connections load-balancer.tcp.server.connections connection 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
LB死活監視 Load Balancer Status load-balancer.load_balancer.status.bool boolean
当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集
正常=0
故障=1
監視時の値 1分
IF死活監視 Interface Status load-balancer-interface.load_balancer_interface.status.bool boolean
当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集
正常=0
故障=1
監視時の値 1分
トラフィックIN Incoming Traffic load-balancer-interface.traffic.in.bps bps 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分
トラフィックOUT Outgoing Traffic load-balancer-interface.traffic.out.bps bps 当該リソースの機能が割り当てられた仮想サーバーインスタンスからSNMPにより収集 監視間隔内の平均値を算出 5分

Custom Resource

  • カスタムリソースは、カスタムメーター機能でお客様が任意に作成可能な監視リソースです。
  • EnterpriseCloud2.0以外のサーバーをEnterpriseCloud2.0で監視する際などにご利用ください。
  • カスタムリソースの作成方法については、カスタムメーターの欄をご参照ください。

注釈

なんらかの影響によりメーター情報が取得できなかった場合、ステータスが”MONITORING_UNAVAILABLE(取得失敗)”と表示されることがあります。この場合、グラフ上は欠落して表示がされ、再度取得することはできませんので、ご了承ください。

カスタムメーター

  • カスタムメーターは、お客さまが任意にスクリプト等によって収集したデータ値をモニタリングサーバーに蓄積させる機能です。
  • これにより、任意の値を他のメーターと同様にグラフ化・アラート設定を実施することが可能です。
  • 本機能はAPIを利用していますので、APIの送信元となる機器はインターネットに接続されている必要があります。
  • カスタムメーター作成時にお客様が任意の名前をリソースIDに指定することで、指定した名前のカスタムリソースが作成できます。

カスタムメーターの仕組み

カスタムメーターの利用にあたっては、お客さまにてデータを定期的に取得し、モニタリングに送信するためのスクリプト(もしくはアプリケーション)を事前に作成しておく必要があります。
スクリプトで取得したデータは、別途定めるリクエストパラメータおよび書式に従ってモニタリングのAPIエンドポイントへ送信することでモニタリング項目の作成・サンプル値の蓄積・編集が可能になります。
また、対象とするリソースは、Enterprise Cloud 2.0以外のサーバーも対応とすることができますので、例えば、Enterprise Cloud 1.0上のサーバーを監視対象として各種データを登録することも可能です。
  • カスタムメーター登録対象データを取得するためのスクリプト作成し、実行(スクリプトはお客さま準備)
  • 上記データをAPIを使ってカスタムメーターに送信、APIは同様にスクリプト内に実装することも可能(APIリファレンス参照)
  • Enterprise Cloud 2.0のカスタマーポータルやAPIを使ってモニタリングに蓄積されたデータを閲覧またはアラート設定を実施

カスタムメーターの機能

カスタムメーターの種類 内容
カスタムメーターの新規作成(API)
カスタムメーターのデータ格納領域を作成することができます。
データ格納領域を作成した後でデ ータの登録が可能になり、新規作成とデータ登録は同時にできませんのでご注意ください。
カスタムメーターデータの登録(API) 作成されたデータ格納領域にモニタリングで管理するデータ(サンプル値)を登録することができます。
カスタムメーターの編集(API) 一度作成したカスタムメーターの各パラメータを変更することができます。
カスタムメーターエージェント あらかじめ規定された収集項目を自動でモニタリングサーバへ蓄積することができます。

カスタムメーターのステータス

作成されたカスタムメーターは、その状態に応じて以下の2種類のステータスが存在します。
アクティブカスタムメーター
実際に利用中で課金対象のカスタムメーターを表します。カスタムメーターにサンプル値登録を実行すると、このステータスに遷移します。
同時に存在することが可能なアクティブカスタムメーターの数は最大30個までとなります。これを超える場合、31個目の作成時にエラーとなります。
非アクティブカスタムメーター
最後の値登録を実施後、24時間何もサンプル値登録がなかった場合、アクティブカスタムメーターから非アクティブカスタムメーターとなります。
このステータスになった場合、アクティブカスタムメーター数としてカウントされなくなるため、新たに別のアクティブカスタムメーターを利用することができます。
なお、それまでに蓄積されたサンプル値は設定された保存期間中(デフォルトでは31日、メーター保存期間延長機能を組み合わせることで397日)は保持されます。
また、一度非アクティブになったカスタムメーターに値登録を実行した場合、アクティブカスタムメーターとして再びカウントされます。

注釈

カスタムメーターの作成上限は120個となります。
Enterprise Cloud 2.0上のVM等からカスタムメーターを定期送信する場合、Enterprise Cloud 2.0のネットワークやゲートウェイのメンテナンスおよび故障によってMonitoring APIエンドポイントに到達できなくなりカスタムメーターの値登録が一時的に不可能となる場合がございます。
Enterprise Cloud 2.0環境上でカスタムメーターをご利用の際はネットワークのメンテナンス・故障情報にご注意ください。

カスタムメーターエージェント

カスタムメーターでは、お客さまが任意に作成したスクリプトによって収集したデータ値をモニタリングサーバーに蓄積します。
このカスタムメーターエージェントを対象のサーバーで起動させると、スクリプトを作成しなくても一般にOS上で収集したい項目(メモリ使用率やロードアベレージ等)を取得しモニタリングサーバーへ蓄積させるまでを自動で実行することが可能です。
また、カスタムメーターエージェントのソースコードは GitHub で公開しています。

カスタムメーターエージェントで取得するメーター

No 分類 メーター名 内容 単位 収集元及び判定方法 任意 監視間隔
1 CPU使用率 cpu.user.percents CPU使用率(ユーザーモード) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
2 CPU使用率 cpu.nice.percents CPU使用率(低優先度のユーザーモード) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
3 CPU使用率 cpu.system.percents CPU使用率(システムモード) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
4 CPU使用率 cpu.idle.percents CPU使用率(タスク待ち) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
5 CPU使用率 cpu.iowait.percents CPU使用率(I/O待ち) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
6 CPU使用率 cpu.irq.percents CPU使用率(割り込み) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
7 CPU使用率 cpu.softirq.percents CPU使用率(ソフト割り込み) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
8 CPU使用率 cpu.steal.percents CPU使用率(仮想化環境で他の OS で使用した時間) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
9 CPU使用率 cpu.guest.percents CPU使用率(ゲスト OS の仮想 CPU) percent /proc/stat を参照し、前回収集値との差分から算出 監視間隔内の平均値を算出 任意
10 ディスク disk.{device名}.reads.completed.count 完了読み込みIO数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
11 ディスク disk.{device名}.reads.merged.count マージ読み込みIO数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
12 ディスク disk.{device名}.reads.sectors.count 読み込みセクター数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
13 ディスク disk.{device名}.reads.milliseconds 読み込みミリ秒数 millisecond 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
14 ディスク disk.{device名}.writes.completed.count 完了書き込みIO数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
15 ディスク disk.{device名}.writes.merged.count マージ書き込みIO数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
16 ディスク disk.{device名}.writes.sectors.count 書き込みセクター数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
17 ディスク disk.{device名}.writes.milliseconds 書き込み秒数 millisecond 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
18 ディスク disk.{device名}.currently.ios.count 実行中のI/O数 count 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視時の値 任意
19 ディスク disk.{device名}.ios.milliseconds IO実行秒数 millisecond 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
20 ディスク disk.{device名}.weighted.ios.milliseconds 重み付きIO実行秒数 millisecond 監視対象の device を調べ、/proc/diskstats の該当行を参照し、前回収集値との差分から算出 監視間隔内の合計値を算出 任意
21 ネットワーク network.{nwif名}.receive.bytes 受信バイト数 byte /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
22 ネットワーク network.{nwif名}.receive.packets.count 受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
23 ネットワーク network.{nwif名}.receive.errs.count エラーが発生した受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
24 ネットワーク network.{nwif名}.receive.drop.count drop された受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
25 ネットワーク network.{nwif名}.receive.fifo.count FIFO エラーが発生した受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
26 ネットワーク network.{nwif名}.receive.frame.count フレームエラーが発生した受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
27 ネットワーク network.{nwif名}.receive.compressed.count 圧縮された受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
28 ネットワーク network.{nwif名}.receive.multicast.count マルチキャストで送られた受信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
29 ネットワーク network.{nwif名}.transmit.bytes 送信バイト数 byte /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
30 ネットワーク network.{nwif名}.transmit.packets.count 送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
31 ネットワーク network.{nwif名}.transmit.errs.count エラーが発生した送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
32 ネットワーク network.{nwif名}.transmit.drop.count drop された送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
33 ネットワーク network.{nwif名}.transmit.fifo.count FIFO エラーが発生した送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
34 ネットワーク network.{nwif名}.transmit.colls.count コリジョンが発生した送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
35 ネットワーク network.{nwif名}.transmit.carrier.count キャリアロスされた送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
36 ネットワーク network.{nwif名}.transmit.compressed.count 圧縮された送信パケット数 count /proc/net/dev を参照し、前回収集値との差分から算出。NWインターフェースごとの値を算出 監視間隔内の合計値を算出 任意
37 ロードアベレージ loadavg.1.count ロードアベレージ(1分) count /proc/loadavg を参照 監視時における過去1分間の平均値 任意
38 ロードアベレージ loadavg.5.count ロードアベレージ(5分) count /proc/loadavg を参照 監視時における過去5分間の平均値 任意
39 ロードアベレージ loadavg.15.count ロードアベレージ(15分) count /proc/loadavg を参照 監視時における過去15分間の平均値 任意
40 メモリ memory.memtotal.kilobytes メモリ総容量 kilobyte /proc/meminfo を参照 監視時の値 任意
41 メモリ memory.memfree.kilobytes 空きメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
42 メモリ memory.buffers.kilobytes バッファメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
43 メモリ memory.cached.kilobytes キャッシュメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
44 メモリ memory.swapcached.kilobytes スワップキャッシュメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
45 メモリ memory.active.kilobytes アクティブメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
46 メモリ memory.inactive.kilobytes インアクティブメモリ容量 kilobyte /proc/meminfo を参照 監視時の値 任意
47 メモリ memory.swaptotal.kilobytes スワップ総容量 kilobyte /proc/meminfo を参照 監視時の値 任意
48 メモリ memory.swapfree.kilobytes スワップ空き容量 kilobyte /proc/meminfo を参照 監視時の値 任意
49 メモリ memory.usedtotal.kilobytes 使用メモリ容量 kilobyte /proc/meminfo の MemTotal, MemFree, Buffers, Cached から算出 監視時の値 任意

注釈

カスタムメーターエージェントを動作させるサーバーからインターネットを介してモニタリングAPIエンドポイントに疎通可能である必要があります。
カスタムメーターエージェントが起動するインスタンスが停止した場合やインターネットとの疎通が途絶えた場合は、カスタムメーターで収集した値はモニタリングサーバへ蓄積されません。
カスタムメーターエージェントの動作対象OSは、以下の通りとなります。
Linux: CentOS 7.1, Ubuntu16.04LTS (左記以外のLinux環境でも動作いたしますが、サポート対象外とさせていただきます。)
カスタムメーターエージェントはEnterprise Coud 2.0の仮想サーバー上での使用・動作することを目的としており、その場合の使用する権利をご提供します。
お客さまがこれとは異なるサーバ上で動作させる場合にはお客さまの責任において実施するものとし、NTTComはこれをサポートすることはできません。
なお、お客さまは、NTTComが提供するベーシックサポートにおいて質問・相談を行うことが可能です。
1) カスタムメーターエージェントについての仕様、操作方法に関する質問
2) カスタムメーターエージェントが正常に動作しない場合における原因調査、回避措置に関する質問・相談
NTTComが、問題解決のために有効だと判断するした場合、カスタムメーターエージェントの修正版の開発および修正版の提供を行います。ただし、修正版の提供に関わるリードタイムは当社が判断した期間とします。
カスタムメーターエージェントのパッケージを提供するリポジトリサーバの稼働率や通信速度につきましてはベストエフォートです。

その他のご注意

  • カスタムメータデータの値登録の回数は1日あたり1500回までとなります(1501個目の登録はエラーとなります)。したがいまして、1日あたり約1分に1回の間隔で値を登録することができます。1日以内に1500を超過する値登録を実行した場合、受け付けられません。1日あたりの値登録数は0:00(UTC)にリセットされます。また、値登録では無いカスタムメーターの編集アクションに関しては1日あたりの上限(1500回)の対象外となります。
  • APIの1リクエストあたりの可能なアクション数は、100アクションとなります。ただし、同一のカスタムメーターに対して「カスタムメータの新規作成」と「カスタムメーターデータの登録」は同時に実施できません。
  • お客様操作によってカスタムメーターを削除することはできません。カスタムメーターは非アクティブカスタムメーターとなった後、設定された保存期間を超過すると自動的に削除されます。(非アクティブカスタムメーターは課金の対象外です。)

グラフ生成機能

  • 収集・蓄積されたデータを元にグラフ表示を行えます。
  • 一画面に複数のグラフ表示ができます。画面は自動的に更新され更新の間隔も変更できます。
グラフ作成画面

アクション設定機能

  • 監視対象のデータを収集、保存、分析するだけではなく、監視項目に対して閾値を設定し、アクションを設定することが可能です。
  • 様々な通知手段で管理者に障害発生の通知を行う事ができます。

通知手段

下記の障害通知方法があります。管理者はこれらの方法で障害通知を受信することができます。
  • メール
  • ユーザAPIリクエストの送信

注釈

ネットワーク遅延やサーバ負荷等により過去のアラームが通知される場合がございます。
アラームが通知された場合は、ポータル上で最新の状況をご確認ください。

通知の設定

さらに障害通知はその場の状況に応じてカスタマイズすることができます。
受信者は指定された時間帯と障害のレベルに応じた通知方法で障害通知を受信することができます。
  • 通知レベルの設定(緊急、警告、infoなど)し、レベルに応じて通知先を設定することが可能

障害通知の詳細情報

通知メッセージには障害発生時刻、資産情報、設定情報、および最新データを表示することができます。通知メッセージはこれらの表示項目を以下のマクロで表現することができます。
  • Date and time(日付と時刻)
  • Host name(ホスト名)
  • Item and trigger description(アイテムとトリガーの設定値)
  • Latest data(最新データ)
  • ユーザコメントの追加

注釈

リージョンがJP1,JP2,JP3,JP5のリソースに設定された通知については、送信されるアラームメールが日英併記での送信となります。
JP1,JP2,JP3,JP5以外のリージョンについてのアラームメールは、英語のみの送信となります。

監視項目一覧

お客様が設定している監視項目の一覧表示が可能です。
各監視項目に設定している閾値の内容、および閾値を超えているかどうかを示す状態もあわせて表示されます。
また、一覧で表示されているアラームを複数選択して削除することも可能です。
アラーム一覧

アラーム履歴画面

過去に実行されたアクションの履歴を表示することが可能です。
アラーム履歴

データダウンロード

各種リソースから収集されたパフォーマンスデータは、GUIまたはAPIでダウンロードすることができます。
ダウンロードには以下の項目を設定することが可能です。
  • リソース名
  • メーター名
  • 取得期間(最大は蓄積期間まで)

API

本サービスではAPIを提供します。
お客様はAPIリクエストを送信することによって、設定されたモニタリング情報を取得することができます。
APIのパラメータを指定することによって、取得するデータの内容や期間を指定することが可能です。
モニタリングのAPIリクエスト数は、SourceIPアドレス毎に4calls/secおよびユーザ毎に240calls/minでの制限となります。

メニュー

メニュー、プラン

サービスメニューは以下の2通りのいずれかを選択することができます。
お客様のご要望に合わせて選択してください。
  ベーシック アドバンスド
料金 無料 有料
データの保存期間 32日間(当日含む)
32日または397日間(約1年1ヶ月、当日含む)
100個まで
101個以上は、1個毎に月額料金が追加
メーターごとに設定が可能
1テナントあたり最大300個まで保存期間の延長が可能
設定可能なアラームの数
10個
1テナントあたり
100個まで
101個以上は、1個毎に月額料金が追加
1テナントあたり最大300個まで
カスタムメーター
1個
1テナントあたり
10個
11個以上は、1個毎に月額料金が追加
1テナントあたり最大30個まで
その他の機能 ダッシュボード機能、データダウンロード機能

注釈

アドバンスドプランをご利用のお客さまで、「データの保存期間」「アラーム」「カスタムメーター」の1テナントあたりの最大設定数が不足する場合には、別途ご相談をください。

申込方法

Enterprise Cloud 2.0をご契約いただくことで、ベーシックメニューの機能をご利用いただくことができます。
アドバンスドメニューのご利用は、都度GUI上からお申し込みいただく必要がございます。

ご利用条件

他サービスとの組み合わせ条件

監視設定ができるメーターは、ご利用いただいている各種メニューに限ります。

最低利用期間

アドバンスドメニューの最低利用期間は1ヶ月となります。

メニュー 課金単位
アドバンスドプラン 1テナント毎
アドバンスドプラン - 追加メーター 1メーター毎
アドバンスドプラン - 追加アラーム 1アラーム毎
アドバンスドプラン - 追加カスタムメーター 1メーター毎

料金

初期費用

無料でご利用いただけます。

月額費用

ベーシックメニューは、無料でご利用いただけます。アドバンスドメニューは、月額固定の料金となります。

サービス提供の品質

サポート範囲

上記に記載した機能はサポート範囲となります。

運用

本サービスは、以下の運用品質にて提供します。
項目 内容
運用時間 24時間/365日
故障時の対応方針 NTT Comにて復旧を速やかに実施します。

SLA

本メニューは、SLAの対象外となります。


制限事項

リソースの生存時間が監視間隔より短い場合、メーターが出力されません。あらかじめご了承ください。
モニタリングのAPIリクエスト数は、SourceIPアドレス毎に4calls/secおよびユーザ毎に240calls/minでの制限となります。