- 1. DatabricksのアカウントIDを取得するまでの手順(AWS編)
- 2. AWSにおけるDatabricksを用いたレイクハウス構築を高速に:新たなPay-as-You-Goオファリングの発表
- 3. あえてVyattaのテンプレ使わずに、AWS Site to Site VPNの動的ルーティング(BGP)を設定する
- 4. AWS公式資料で挑むMLS認定(6)-Amazon AIサービスの全体像
- 5. S3×CloudFront を使用したActionTextの画像アップロード・配信方法
- 6. 【初心者】AWS Machine Learning Lensを整理する
- 7. AWS認定 機械学習 – 専門知識(DAS):合格への近道
- 8. AWSのサービスを単純明快に説明してみる(コンテナ編)
- 9. CloudWatch Synthetics Canary on Terraform で Error: Cannot find module エラー
- 10. AWSをはじめてさわる人向け
- 11. AWS Control Tower の始め方 2022 春
- 12. AWS Fault Injection Simulator触ってみる
- 13. aws cli にてファイルの暗号化・復号を行う
- 14. インフラエンジニアはブルーオーシャンなのか
- 15. [Python] DynamoDBをLambdaから使ってみる
- 16. 【AWS】Elastic Beanstalkで作成されたS3バケットを削除する場合の注意点
- 17. Terraform でクロスアカウントのCodePipeline を最小権限で構築する
- 18. 【初心者】特徴量エンジニアリングについて調べてみた
- 19. AWS認定 機械学習 – 専門知識(MLS):合格への近道
- 20. API Gateway+LambdaのAPI実行時にMissing Authentication Tokenとなった場合の確認観点
DatabricksのアカウントIDを取得するまでの手順(AWS編)
本書では、これからDatabricksを使い始めるケースで、アカウントIDを取得するまでの手順をまとめています。
:::note info
**注意**
– アカウントIDとはDatabricksのサブスクリプションごとに割り当てられるIDです。
– 本書で作成するユーザーアカウントは[アカウントオーナー](https://qiita.com/taka_yayoi/items/5a117a8bdea67051a0ce)となり、お使いのDatabricksのアカウントで最上級の権限を持つユーザーとなります。ですので、アカウントオーナーの情報は厳密に管理するようにしてください。
:::# Databricksへのサインアップ
1. Databricksのフリートライアルを開始するために、[Databricks 無料トライアル](https://databricks.com/jp/try-databricks)をクリックします。
![Screen Shot 2022-05-11 at 10.58.36.png](https://qiita-image-store.s3.ap-nort
AWSにおけるDatabricksを用いたレイクハウス構築を高速に:新たなPay-as-You-Goオファリングの発表
[Building a Lakehouse Faster on AWS With Databricks: Announcing Our New Pay\-as\-You\-Go Offering \- The Databricks Blog](https://databricks.com/blog/2022/05/10/building-a-lakehouse-faster-on-aws-with-databricks-announcing-our-new-pay-as-you-go-offering.html)の翻訳です。
:::note warn
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
:::データ&AIアプリケーションを加速するというニーズのため、お客さまはお使いのデータレイクハウスを始めるための迅速な手段を必要としています。Databricksレイクハウスプラットフォームは、シンプルかつアクセス可能になるように設計されており、業界にまたがる企業はお使いのデータ全てからクイックにメリットを得ることが可能となります。
あえてVyattaのテンプレ使わずに、AWS Site to Site VPNの動的ルーティング(BGP)を設定する
AWS Site to Site VPN を設定する際、Vyattaの動的ルーティング(BGP)用の設定ファイルテンプレートをダウンロードして楽に設定することもできるが、あえて手動で設定してみる。
Vyattaと書いてますが、VyOS1.3を使っています。
まず、Genericでテンプレートをダウンロードしておく。以降、設定値は基本的にこのファイルから拾っていく。
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/323706/35f8ef3d-b45c-6840-0b6a-edd9f121be96.png)
## IKEの設定
ここはコピペでOK
“`
set vpn ipsec ike-group AWS lifetime ‘28800’
set vpn ipsec ike-group AWS proposal 1 dh-group ‘2’
set vpn ipsec ike-group AWS proposal 1 encryption ‘aes128’
set vpn i
AWS公式資料で挑むMLS認定(6)-Amazon AIサービスの全体像
##### [前回] [AWS公式資料で挑むMLS認定(5)-機械学習手法のまとめと比較](https://qiita.com/mingchun_zhao/items/91cc59f69860f12e7638)
## はじめに
今回から、Amazon AIサービスの勉強です。
まずは、Amazon AIサービスの全体像から。## 勉強に使用する教材
下記AWS公式ドキュメントを参照しながら進めます。
– AWS Black Belt Online Seminar
– ユーザーガイド
– デベロッパーガイド
– チュートリアル
– よくある質問
– AWSナレッジセンター
– APIリファレンス## Amazon AIサービスの概要
– AWSの事前トレーニング済みAIサービスは、アプリケーションやワークフローですぐ使えるインテリジェンスを提供
– AWSのAIサービスをアプリケーションと簡単に統合できる
– Amazon.comおよびAmazon社のMLサービスと同様の深層学習技術を使用
– ビジネスメリット
– 継続的な学習によりAPIの品質と精度が得られる
S3×CloudFront を使用したActionTextの画像アップロード・配信方法
# はじめに
ActionTextから登録された画像や添付ファイルはデフォルトだとサーバー内のローカルディスクに保存されます。
大容量のファイルが溜まり続けた場合、サーバがいつかキャパオーバーになってしまう懸念があります。
そこで、ActionTextから投稿された画像の保存先を、ローカルディスクから`Amazon S3`に変更しストレージ容量を確保し、高速コンテンツ配信サービス(CDN)である`Amazon CloudFront`を使用して、配信を行う構成を実装してみたいと思います。
—
【環境】
・ AWS(EC2, S3, CloudFront, IAM etc.)
・ Ruby 2.7.3
・ Ruby on Rails 6.1.5:::note warn
**ActionText**を使用するには、Railsバージョン6系以上が必要です。
:::[Action Text の概要](https://railsguides.jp/action_text_overview.html)
![スクリーンショット 2022-05-11 6.38.44.png](h
【初心者】AWS Machine Learning Lensを整理する
# 背景・目的
私は、現在データエンジニアリングを生業としています。普段は、データ基盤の構築や、パフォーマンスチューニングなどビックデータに関する業務に従事しています。
ビックデータの収集や、蓄積、分析などの環境構築の経験はそこそこありますが、機械学習による予測や分類などのスキルは持ち合わせていませんでした。
今まで機械学習を避け続けてきましたが、一念発起し学ぼうと思います。学び方としては、AWS Certified Machine Learning – Specialty(以降、ML試験という。)の勉強を通して、理解を深めていきます。ML試験のガイドの第2分野に、探索的データ解析が登場しましたのでそこから学びたいと思います。
過去に以下について、学習を進めてきました。今回は機械学習レンズについて学びたいと思います。
– 2.探索的データ分析
– 2.1.モデリング用のデータをサニタイズおよび準備する
– [【初心者】探索的データ解析とは何かを調べてみた](https://qiita.com/zumax/items/52c97307bf18f407bb6e)
AWS認定 機械学習 – 専門知識(DAS):合格への近道
# AWS認定 機械学習 – 専門知識(DAS)に向けて、下記の通り対策すれば合格できます!
AWS DASは、モダンな開発技術とも言える **「データレイク・データウェアハウス・データ分析基盤」** が対象となります。
このような現場を経験している方は少ないと思うため、非常に価値ある資格かと思います。
市場価値を上げるためにも、是非とも取得して欲しい資格の一つです!「1」「2」「3」の順番で取り組んでください。実際にこの順序で学ぶことで、現場にも生かすことができます!
[1. AWSのサービスを実際に手を動かして学ぶ](#1-awsのサービスを実際に手を動かして学ぶ)
[2. 問題集を解く](#2-問題集を解く)
[3. 書籍を読む](#3-書籍を読む)# 1. AWSのサービスを実際に手を動かして学ぶ
初めの勉強は、本試験に出題されるAWSサービスをマネジメントコンソールから学んでください。
いきなり、問題集や書籍から始めると挫折する可能性が高いです。
よく出題されるAWSサービス(実際の業務でもよく利用される)は下記7つであり、
これらを理解することで、**「データレイ
AWSのサービスを単純明快に説明してみる(コンテナ編)
巷ではAWSさんのサービス説明文が難解だと話題です。
これは私も思ってました(笑)https://www.itmedia.co.jp/news/articles/2205/10/news123.html
AWSの各サービス、冒頭の説明文見てもどういうものなのか全然わからなくない?
もしAWSがカップラーメン発売したらこんな感じの紹介してると思う。 pic.twitter.com/4ZoxjQdUUk— Kazuya Gokita (@kazoo04) May 9, 2022
そこで、わかりやすく説明してみようと思います!
## Amazon Elastic Container Registry
**Docker Hub**のAWS版
## Amazon Elastic Container Service (ECS)
AWS版のコンテナ動作環境の**コントロールプレーン**
コンテナ動作環境はEC2/Fargate/ECS Anywhereから選択## Amazon ECS Anywhere
**ECSのコンテナ実行環境**の一つ。**オンプレに構築**しAWS上のECSコントロールプレーンで管理
## Amazon Elastic Kubernetes Service (EKS)
AWS版の**Kubernetes**をク
CloudWatch Synthetics Canary on Terraform で Error: Cannot find module エラー
# 課題
CloudWatch Synthetics Canary の設定を Terraform で構築すると次のエラーに遭遇。# エラー
“`
ERROR: Canary error:
Error: Cannot find module ‘/opt/nodejs/node_modules/pageLoadBuilderBlueprint’
Require stack:
– /var/task/index.js
– /var/runtime/UserFunction.js
– /var/runtime/index.js Stack: Error: Cannot find module ‘/opt/nodejs/node_modules/pageLoadBuilderBlueprint’
Require stack:
– /var/task/index.js
– /var/runtime/UserFunction.js
– /var/runtime/index.js
at Function.Module._resolveFilename (internal/modules
AWSをはじめてさわる人向け
# はじめに
AWSでLAMPを使い始めるので,手順をまとめておく.
今回は公式ページに則ってやった.https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/ec2-lamp-amazon-linux-2.html
# サーバ(インスタンス)をたてる
AWSのアカウントを作成してログイン1.右上にある地域を東京にする
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/2525698/015bb637-ed0f-9107-ea1e-e680c8ff044a.png)2.仮想マシンの起動をクリック
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/2525698/4b102826-5c75-ea54-a2c0-d298c4896418.png)3.サーバの名前を決める
![image.png](https://qiita-i
AWS Control Tower の始め方 2022 春
個人アカウントに AWS Control Tower を設定したので、その際の流れをメモしておきます。少し前で恐縮ですが、画面ショット自体は 2022/3/29 時点の情報です。Control Tower そのものや関連するサービス自体の説明はしていません。
## セットアップの流れ
Control Tower コンソールに移動し、ランディングゾーンの設定に進みます。![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/125105/8932991f-13d4-bb32-8e3a-fd7daed06905.png)
最初に Control Tower を設定するホームリージョンを指定します。ランディングゾーンの作成中に一部のリソースがホームリージョンでプロビジョニングされます。ランディングゾーンの作成後、ホームリージョンは変更できませんのでご注意ください。
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaw
AWS Fault Injection Simulator触ってみる
# 概要
https://aws.amazon.com/jp/fis/意図的に障害を起こすことで、事前の予防策や復旧について学ぶことが目的のサービス
カオスエンジニアリングというらしい
これをAWSサービスに対してテンプレートを組んで行えるようにしたサービス
楽しそうなので触ってみる# 準備
FIS経由で各サービスを動かすので必要なポリシーをアタッチしたIAMロールを作成する##### ポリシー作成
https://docs.aws.amazon.com/fis/latest/userguide/getting-started-iam-service-role.htmlとりあえず、ドキュメントに記載がある触りたいサービスの許可ポリシーをJSON形式で作成
また、後ほど実験テンプレートのログをcloudwatchに送信するためにcloudwatchLogsへのフルアクセスも追加“`
{
“Version”: “2012-10-17”,
“Statement”: [
{
“Sid”: “AllowFISExper
aws cli にてファイルの暗号化・復号を行う
### aws cli インターフェース(linux環境)で、ファイルの暗号化(復号)を行う
「aws kms」コマンドでファイルの暗号化は可能だが、ファイルサイズ制限がある。
awsサポートに「容量の大きいファイルをEC2(linux)環境で暗号化したい」と問い合わせた所、「aws-encryption-sdk-cli」を勧められた。
(暗号鍵は、kmsで管理し、暗号化(復号)は、aws-encryption-cli を使うのがベストプラクティスとのこと)今回は、「aws-encryption-cli」の使用例について記載する。
(前提)
① aws cli のインストールは済。
バージョン:aws-cli/2.4.28 Python/3.8.8 Linux/4.18.0-348.20.1.el8_5.x86_64 exe/x86_64.rhel.8 prompt/off (「aws –version」コマンドで確認)② aws-encryption-sdk-cliはインストール済。
バージョン:aws-encryption-cli –version (「aw
インフラエンジニアはブルーオーシャンなのか
インフラエンジニア5年ほどやってます。
最近SNSとかで話題になっていたので、終止符を打ってやるくらいの気持ちで書きます。
結論からいうと、**インフラエンジニアはブルーオーシャンではないです。**## インフラエンジニアとは
アプリケーションというものはネットワーク、サーバー、ストレージ(ディスク)
などの基盤(インフラ)の上で成立します。
このインフラを構築したり、運用する人のことをインフラエンジニアといいます。インフラエンジニアといってもいろいろな種類があります。
**・サーバエンジニア**
**・ネットワークエンジニア**
**・DBエンジニア(アプリより)**更にその中でクラウドかオンプレにわかれて、
また更に以下のようなカテゴリにわけられます。**・設計/構築**
**・1次保守**
**・2次保守(SRE)**## なぜこういう議論が巻き起こったのか
近年AWS等のおかげで認知度があがったからかなと思いました。
元々インフラエンジニアというものの一般的な知名度は低かった印象です。
といっても既存のインフラエンジニア自体がクラウドに流れるだけなので、
[Python] DynamoDBをLambdaから使ってみる
# はじめに
Boto3の公式ドキュメントを参考にしてLambdaからPythonを使ってDynamoDBを読み書きしてみます。
https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/dynamodb.html
https://boto3.amazonaws.com/v1/documentation/api/latest/guide/dynamodb.html
## DynamoDBでテーブルの作成
テーブル名とパーティションキーだけ指定して作成します。
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/83224/5777a24b-542f-2bac-8ac7-f0f5a7231963.png)
## Lambdaで権限設定
実行ロールをクリックして編集します。
![image.png](https://qiita-image-store.s3.ap-northeast-1.a
【AWS】Elastic Beanstalkで作成されたS3バケットを削除する場合の注意点
## はじめに
検証でAWS ElasticBeanstalkでアプリを立てた後、整理のため削除した。
S3を確認したところバケットも作成されていたので、削除したところ、アクセス権限がないため削除できなかった。
改めてElasticBeanstalkの作成プロセスを理解するために備忘録として残しておきます。
![スクリーンショット 2022-05-10 9.39.07.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/478546/9e5e9820-ed9c-87e5-161c-5ea11de75461.png)## 結論
S3バケットが作成されていることを知らなかったのが原因でした。
ちゃんと作成プロセスを把握しよう。## ElasticBeanstalkの作成プロセス
[公式ドキュメント](https://docs.aws.amazon.com/ja_jp/ja_jp/elasticbeanstalk/latest/dg/AWSHowTo.S3.html)の記載によると、ElasticBeans
Terraform でクロスアカウントのCodePipeline を最小権限で構築する
# はじめに
クロスアカウトのCodePipeline の構築で、各サービスのロールのIAMポリシーやリソースベースポリシーを最小権限で実装しようとした場合、アカウント間のアクセス制御を、公式のユーザーガイドだけで理解して実装するのは少し難しいのかなと思います。(自分は、詰まりました。)本記事では、クロスアカウントのCodePipeline を最小権限で構築するTerraform のコードとそのパイプライン(ビルドまで。)を図示してみましたので、参考までに、サンプルとして共有しますので、理解する手助けになればと思います。
また、補足として、アカウント間のアクセスを制御している各サービスのロールのIAM ポリシーやリソースベースポリシーについて、簡単に説明をしています。# Terraform で構築する全体構成図
![cross-account-codepipeline_全体構成図.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/283246/7483a844-77b0-5eef-ea8e-2504
【初心者】特徴量エンジニアリングについて調べてみた
# 背景・目的
私は、現在データエンジニアリングを生業としています。普段は、データ基盤の構築や、パフォーマンスチューニングなどビックデータに関する業務に従事しています。
ビックデータの収集や、蓄積、分析などの環境構築の経験はそこそこありますが、機械学習による予測や分類などのスキルは持ち合わせていませんでした。
今まで機械学習を避け続けてきましたが、一念発起し学ぼうと思います。学び方としては、AWS Certified Machine Learning – Specialty(以降、ML試験という。)の勉強を通して、理解を深めていきます。
ML試験のガイドの第2分野に、探索的データ解析が登場しましたのでそこから学びたいと思います。過去に以下について、学習を進めてきました。今回は特徴量エンジニアリングについて学びたいと思います。
– 2.探索的データ分析関連
– 2.1.モデリング用のデータをサニタイズおよび準備する
– [【初心者】探索的データ解析とは何かを調べてみた](https://qiita.com/zumax/items/52c97307bf18f407bb6e
AWS認定 機械学習 – 専門知識(MLS):合格への近道
# AWS認定 機械学習 – 専門知識(MLS)に向けて、下記の通り対策すれば必ず合格できます!
AWS MLSは、AWS周りで関連する機械学習のサービスや、機械学習そのものの知識が問われます。
一般的な機械学習の資格と違い、問われるのは知識であるため、用語を理解すれば合格できます。
試験名が名前負けしていると言いますか、そこまで難しい試験ではないので、
データサイエンス未経験の方は、これを機に機械学習とはどういうものかといった知識を蓄えられるチャンスです٩( ‘ω’ )وまず初めに「1」に取り掛かってから、「2」「3」を同時並行で進めてください。
いきなり、「2」「3」から取り掛かると、わけがわからず挫折する可能性があります。※機械学習経験済みのデータサイエンティストの方は「1」を飛ばして、「2」「3」で合格できます。
[1. 機械学習の参考書を一つ読み込む](#1-機械学習の参考書を一つ読み込む)
[2. 問題集を解く](#2-問題集を解く)
[3. AWSサービスや機械学習の意味を理解する](#3-awsサービスや機械学習の意味を理解する)# 1. 機械学習の参考書
API Gateway+LambdaのAPI実行時にMissing Authentication Tokenとなった場合の確認観点
## はじめに
API Gateway + LambdaでAPIを作成して、アクセスした際にタイトルのエラーが発生したので、その際の確認観点を記載します。## エラー内容
– ステータスコード: 403
– エラーメッセージ: Missing Authentication Token## 試したこと
### Missing Authentication Tokenで検索
– 認証情報周りは特に問題なさそうでした。### 403のステータスコードの意味を検索
ウィキペディアによると、以下と書いてあります。> ページが存在するものの、特定のアクセス者にページを表示する権限が付与されず、アクセスが拒否されたことを示すもの。また、サイトの制作者側の設計ミスによる障害やサイトが非常に混雑している時、URLが間違っている場合にも表示されることがある。
Ref:https://ja.wikipedia.org/wiki/HTTP_403
> URLが間違っている場合にも表示されることがある。
とあったので、この観点で確認してみました。
## 原因
– 上記の通り、APIのエン