AWSで提供されているサービスをすべて覚えることはできないし、すべてのサービスを触ってみることも時間的にも不可能、、しかし、試験に受かるためにはざっくりでも聞きなれないサービス名も、名前を聞いたらなんとなく思い出せるレベルである必要があると思ったので、一覧でまとめます。
実務の観点からも、あーそんなサービス聞いたことあるなと、頭の片隅で引っかかる状態にしておけば、打合せで恥をさらすこともなく、抵抗感なくAWSと付き合っていけるのではないかと思ってます。
ということで、一気にまとまめてます。
調べるにあたって参考にさせていただいたサイトなどのリンクも掲載しておきます。
※正しいサービスの理解については公式ドキュメント等をご覧ください。
サービス一覧
モニタリングサービス
CloudWatch
EC2、RDS、DynamoDBなどの各リソースの現在の状態、情報をモニタリングするサービス。
・標準メトリクス
メトリクスとは、CPUやメモリといったリソースの使用率のことで、リソースの診断や分析に利用できる。
標準メトリクスという、AWSが管理している範囲の情報であれば追加設定なしで情報収集可能。
そのため、使用するサービスによって取得される情報が異なる(EC2ではメモリの情報やディスク使用量は含まれないが、RDSではOSもAWSが提供しているので、メモリの情報やディスク使用量も含まれる。)
・カスタムメトリクス
AWSが標準で提供しない情報を収集するために、カスタムメトリクスとしてCloudWatchへ書き込み可能。
・ログの収集
EC2のアプリログ、Lambdaのログ、VPCフローログを収集。
CloudWatch Logsに書き出しておけば、もしEC2に障害が発生して終了させたい時にも、異常なインスタンスや不要になったインスタンスをその時点で終了させることができる。もしログの収集ができていなかったら不用意に終了してしまうと、ログも消えてしまう。
つまり、ステートレス(情報や状態を持たない構成)にできる。
・CloudWatchアラーム
各サービスから収集したメトリクス値に対してアラームを設定できる。
例えば、EC2のCPU使用率が10分間80%を超えた時、RDSディスク容量が残り10GBになって5分間そのままの時など。
アラームが発生したら、EC2の回復、Auto Scaling実行、SNS通知など、モニタリング結果に応じて運用を自動化できる。
X-Ray
Lambdaなどのサーバレスアプリケーションの各処理の記録を一貫したトレース情報で調査、ボトルネックの特定と潜在的なエラーを分析。
トレース情報とは、アプリケーションや実行基盤のサービス実行状況を監視して、サービスの状況やエラーの状況を特定するための情報。
Healthダッシュボード
AWSアカウントに影響のあるイベントを確認できる。
EC2インスタンスが実行されているハードウェアのリタイアなど。
イベント情報にはAWS Health APIを使ってプログラムからもアクセスできるが、AWSサポートのビジネスプラン以上が必要。
ロギングサービス
CloudWatch Logsは様々なログを収集する汎用的なログ機能。
それとは別にAWSアカウントのAPIリクエストログとAWSリソースの設定情報の記録に特化したサービスがCloudTrailとConfig。
CloudTrail
AWSアカウントのほぼすべてのAPIリクエストとその結果を記録するサービス。
誰がいつ何したかを記録する。
Config
AWSリソースに対する設定情報の記録をするサービス。設定情報は勿論、設定履歴も確認できる。
組織として行うべき設定があれば、AWS Configルールとして定義しておけば、そのルールから逸脱した時リソースを抽出できる。
ルールに準拠するように自動修復もできる。
検出サービス
EventBridge
AWSアカウント内で発生したイベントを検知して、アクションを自動実行できる。
スケジュール機能で特定の時間にアクションを実行したり、定期的に実行したりできる。
SNSでメール通知したり、Lambda関数を実行したり、Systems Managerオートメーションを実行したりできる。
例えば、EC2が起動中からシャットダウンしたときにその情報をメールで通知する。
Trasted Advisor
AWS環境を自動チェックして、ベストプラクティスに沿ったアドバイスをレポートするサービス。
チェック観点は6つ。(コスト、パフォーマンス、セキュリティ、耐障害性、サービス制限、運用上の優秀性)
サポートプランによってチェック項目に制限があり、ビジネスプラン以上で全項目チェックとなる。
セキュリティのモニタリングサービス
セキュリティ関連に特化したモニタリングサービス。
GuardDuty
CloudTrailのログ、VPCフローログ、DNSリクエストを自動的に分析し、外部からの侵入や不正使用が発生していないか検出してくれるサービス。
Detective
GuardDutyで検出されたものを、調査する際にサポートしてくれる。
今後の対策、対応を検討したり、セキュリティログを設定したりしてくれる。
該当する関連ログを取り込んでくれるなど、調査をサポートしてくれる。
Security Hub
GuardDutyやInspectorなどのイベントを集約して、統合されたダッシュボードで管理できるようになるサービス。
セキュリティの重大度スコアがつけられ、優先度を付けた対応をする際に役立つ。
Audit Manager
CloudTrailやConfig、Security Hubなどから監査に必要な証跡を自動収集してくれる。
Auditとは、監査のこと。
その他のサービス一覧
〇コスト管理編
〇運用・デプロイ編
〇移行・導入編
〇人工知能・機械学習・ビジネス・分析編
まとめと参考文献
以上、ざっくり一覧整理でした。
内容は逐次更新かけていきたいと思います。
コメント