【AWS】AWS CLF 出題サービス一覧 【AI/ML・ビジネス・分析サービス】

AWS

AWSで提供されているサービスをすべて覚えることはできないし、すべてのサービスを触ってみることも時間的にも不可能、、しかし、試験に受かるためにはざっくりでも聞きなれないサービス名も、名前を聞いたらなんとなく思い出せるレベルである必要があると思ったので、一覧でまとめます。

実務の観点からも、あーそんなサービス聞いたことあるなと、頭の片隅で引っかかる状態にしておけば、打合せで恥をさらすこともなく、抵抗感なくAWSと付き合っていけるのではないかと思ってます。

ということで、一気にまとまめてます。

調べるにあたって参考にさせていただいたサイトなどのリンクも掲載しておきます。

※正しいサービスの理解については公式ドキュメント等をご覧ください。

サービス一覧

AI/MLサービス

Rekognition

画像と動画の分析ができる。

Comprehend

自然言語処理(NLP)サービス

Polly

文章→音声変換。AWSブログには、Pollyによる読み上げ機能がある。

Transcribe

Pollyと逆、音声→テキストに変換。カスタマーセンターで顧客の音声をテキストに変換したり、自動議事録作成したりできる。

Comprehend(自然言語処理)で自動分析する合わせ技が有効。

Translate

翻訳。翻訳前の言語が何かは、Comprehendで自動検出してくれる。

Textract

手書き文書や印刷物からテキストを抽出してくれる。事前設定不要。

手書きのアンケート用紙や申し込み用紙から文字を抽出して入力作業を楽にできるようなアプリの開発もできる。

Lex

会話型Bot。Alexaと同じ技術を搭載。

レストランの予約受付など会話パターンをノーコードで構築できる。お客様の返答によってLambda関数を実行するなど、他サービスとの組合せが有効。

Kendra

機械学習(ML)を利用した検索サービス

S3やRDSに蓄積されたデータ、SaaSストレージ(Google DriveやOneDriveなど)など様々な場所から情報を自然言語で検索できる。

Bedrock

AWS以外のものも含む様々な生成AIを、AWS APIから呼び出すサービス。

AWS外の生成AIを実行すると請求がそれぞれで発生したり、認証がそれぞれで発生するが、Bedrockを使用すればIAMポリシーで権限を設定でき、請求もAWSの請求にまとめられる。

Q

AWSマネジメントコンソール、開発環境、AWSユーザガイドに統合されていて、質問を書くとAWSサービスの使い方と対象ドキュメントへのリンクを提供してくれる。今後益々発展することが期待できる。

SageMaker

独自の推論モデルがない場合に、機械学習の開発環境構築や学習のためのリソースの準備など、環境準備を担ってくれる

開発者がクラウド上で機械学習モデルを作成、トレーニング、デプロイできるようにするクラウドベースの機械学習プラットフォーム。

これにより、開発者はモデルの開発に注力できる。

ビジネスサービス

SES (Simle Email Service)

E-メールの送受信を行うためのサービス。

受信についてはRoute 53などのDNSでMXレコードを作成し、SESサービスでエンドポイントにE-メールが届くように設定。受信メールに対するアクションをLambda関数などで自動化できる。

送信についても、ダイレクトメールの発信やユーザの申し込みに対するサンクスメールやリマインドメールの発信をSESを追加って自動化できる。

※MXレコード・・・特定のドメイン宛ての電子メールをどのメールサーバーに転送すればいいかを指定するレコード

WorkSpaces

クラウドで仮想デスクトップクライアントを使用できるサービス。

Windows、Linuxなどのデスクトップを使用できる。

クライアントアプリケーションやWebブラウザからアクセス可能。

Connect

クラウドにコンタクトセンターを構築するサービス。

電話の受発信を自動化でき、電話の着信に対する応答処理などを自動化、Lambda関数を呼び出して処理結果を分析したり、電話を自動発信したりできる。

分析サービス

QuickSight

BIサービス。Auroraや複数種類のデータベース、S3などをデータソースとしてグラフで可視化し、分析の手助けをしてくれる。

QuickSightの大きな特徴となっているのが、QuickSight Qという機能で、自然言語で質問するとその回答と参照グラフを生成してくれる。

さらに、生成AIを活用した機能をQ in QuickSightという。

Data Exchange

AWSユーザがAWSクラウドでサードパーティーデータを簡単に検索、使用できるようにするサービス。

クラウド上の様々なサードパーティーのデータセットをS3バケットへ継続的に連携させることで、分析に役立てたり、アプリケーションで使用したりできる。

例えば、FourSquareの地理情報を利用したり、IMDbで映画情報を取得したりできる。

要するに、AWS上で外部のデータを利用できるようにしてくれるサービス。

Athena

S3に保存されているJSON、CSV、Parquestなどのテキストデータに対してSQLクエリを実行できるサービス。

SQLクエリ結果に基づいてSQLクエリを書き換えながら、さらに分析ができるので「対話型なSQLクエリ」と言われる。

Glue

データ分析のために複数のデータソースのデータを簡単に検出、準備、移動、統合できるようにするデータ統合サービス。マネージドETLサービス。

S3やRDSのデータをGlue内で加工し別のS3(ターゲット)に格納する。S3(ターゲット)に格納したデータをAthenaなどで分析する。

メインの考え方、機能がETL、データカタログ。

ETL(Extra,Transfer,Load)はデータを送信元から送信先への連携させる機能。

送信元であるデータソースからデータを抽出するために、送信元のデータ形式を知る必要がある。その時にデータカタログを利用する。

データカタログでは、データソースのデータ形式をテーブルとうリソースで管理。データそのものではなくデータ形式情報で管理。テーブルには列名やデータ型、その他の属性などのメタ情報が含まれるのでメタデータテーブルとも呼ばれる。

データカタログは手動作成もできるが、S3に保存されたJSONはクローラーによって自動作成も可能。

Athenaはデータカタログを利用してSQLクエリを実行できる。

Kinesis

リアルタイムなデータストリーミング処理のためのサービス。

データが生成されたらすぐ送信して、たどり着いたデータはすぐ分析対象となり、リアルタイム対応をする。

ゲームアプリのユーザの行動ログ分析や、SNSでのクリックやポスト内容による広告配信などに活用。

EMR

ビッグデータを扱うオープンソースソフトウェア(Hadoop、Spark、Hive、Presto)を実行できるマネージドサービス。以前は、Elastic MapReduceと呼ばれていたため、頭文字をとってEMR。

これらのオープンソースソフトウェアの実行を簡素化し、AWSで使用することができる。設定済みのEC2インスタンスを必要な構成で起動できる。

MSK

Amazon Managed Streaming for Apache Kafka、Apache Kafkaのマネージドサービス

Kafkaとは、大規模なストリーミングデータを扱うことができるOSS。APログや機器情報、注文情報、センサデータなどのストリーム情報を集約、仲介し、データ分析などを行う処理サーバーに必要なタイミングでデータを連携してくれる。KafkaをAWSで使用したい場合に利用するのがMSK。

Apache kafkaとは
NTTデータのkafkaソリューション、Apache kafkaとは、Apache kafkaの特長を紹介
OpenSearch Service

データ分析やモニタリングをサポートするサービス。

OpenSearchダッシュボードでは、クラウドによるデータの可視化、ドリルダウン、検索、抽出ができ、高機能な分析ができる。S3やRDSなどに格納されているデータをOpenSearchによって検索することができる。

全文検索、セキュリティログ検索(SIEMツール)としても利用できる。

Redshift

高性能なDWHサービス。

列指向のデータウェアハウスサービス。列指向とは、クエリに対して特定の列を対象に扱うので、大量のデータ集計などを高速に行うことができる考え方のこと。

IoT Core

センサーなど、デバイスからのデータを受け取り、AWSサービスへ渡すサービス。

MQTTプロトコル(IoTデバイスの通信で良く使用されるプロトコル)をサポートしている。

IoT Greengrass

IoTデバイス側(=エッジ)で処理を行えるようにするサービス。

デバイス上でLambda関数を実行することで、送信するデータ量を減らすことができたり、デバイス側で発生した出来事をリアルタイムに処理したりできる。

デバイス側で処理することをエッジコンピューティングと呼び、データの送信元やアクセス元から一番違い場所をエッジと呼ぶ。

まとめと参考文献

以上、ざっくり一覧整理でした。

内容は逐次更新かけていきたいと思います。

コメント

タイトルとURLをコピーしました