AWS Summit 2024

AWS Summit 2024の参加メモ。

タイムテーブル

基調講演 - AWS と創る次の時代

導入

  • Tech for good
  • AI for good
    • AI についてはあまり話さない
    • 機能した AI は AI と気付けない →AI と呼ばなくなるだろう(AI の父ジョンマッカーシー
    • AI の歴史
      • 哲学者は自動化、機械を構築して人間の能力を向上させられるのではないか
        • 3000 年前から
        • プラトンも機械が人の大変な仕事をやることを想定
        • Basic:符号操作
        • アランチューリングのチューリングテスト
      • 1956 ダートマス大学
        • 哲学者が集まって AI について語った
        • 脳が司令して行動する(トップダウン)のがベーシック
        • エキスパートシステム
          • 少し複雑だっただけ
      • ボトムアップのトレンド
        • 感覚からエミュレーション
        • Amazon のセンターでロボットが走行
          • 自律走行
          • センサーで個別タスクの実行を可能に
          • rider, ペーダー?
      • transformers → LLMs
      • これまでもよく機能した AI もあったことを忘れてはいけない
    • AI for Now
      • 今何ができるか
    • AI for hard human problems
      • now for build
      • 2050 年の人口問題(97 億人)など
      • 日本:高齢者問題
        • テクノロジーで自宅にいられるかつ自立であるように、を目標
      • ジャカルタ:企業 HARA
      • Identity がない
        • → 銀行が融資してくれない
        • 闇金に行ってしまう
        • お金が結構なくなってしまう
    • AI for food
      • お米:世界の半数を占める食糧
      • IRRI:多様な品種の米を研究
        • 未処理の収穫物の貯蔵できる時間は短い
        • 遺伝子いじったりして研究
        • 種の仕分け → 画像認識
          • どれが長く生き延びたか確認
        • やったこと
        • 収穫量を最適化するシステムの構築
        • 面積を話す → 最適解
          • AI
      • ヤンマー
        • 作物の成長度を見る
        • → 必要なリソースを見る
      • What about protein?
        • 1kg の飼料 →1kg のタンパク質しか取れない
        • サーモンの養殖
        • コンピュータビジョンでの分析
        • 一匹毎に管理
          • 病気の検出(一匹かかると他にも影響あり
    • AI for Healthcare
      • スウェーデンの企業
        • 50 歳以上の女性でがんの早期検出
        • AI が画像を分析
        • 30%以上の危険を検知
        • ドローンでワクチンを届ける
        • 無人で完全自動化
        • 2018 年 12 月 赤ちゃんのジョイに届けた
      • ブラジル
        • 検体を持って帰る
        • 新生児の数%が持つ脳損傷の検知
        • 脳波キャプチャ
    • Data
      • AI for good(善) に必要
      • データは特権的 -事例:OpenStreetMap
        • ビジネス的に意味があるところしかマップを作らない
        • 何かあったときに赤十字とかがサポートできるように
      • 事例:Digital Earth Africa
        • アフリカ細かい衛星データを公開
        • → 違法な道路の検出
      • 昔は必要なデータを事前に構造化していた
      • 今は大量に保存できる
        • 金になり得るデータを見つけるのは難しい
        • → ML で発見しやすくする
      • 事例:THORN
        • 画像認識で児童虐待を防ぐ
        • SPOTLIGHT
          • 行方不明者の画像 DB→ 18,000 人の犠牲者を特定
        • safer(顧客プラットフォーム上で利用できる)
          • 児童性的虐待コンテンツの特定
          • アップロードされた画像に含まれているか
          • テキストベースでも検出可能
            • グルーミングの特定など
      • MSG
        • Good AI needs good data
        • Good data needs good AI
        • Good work needs good people
        • Now, go build

公演

Intro

  • Amazon で大事にしていること
    • 長期的視野、お客様視点
    • 必要な時に必要なリソース=お客様視点の一つ
    • サービスの品揃え数:240+
    • リージョン:33+7
    • AZ: 105+21
  • AWS の取り組み
    • データセンターの信頼性
    • セキュリティ
    • コストパフォーマンス
      • 自社の最適化
顧客
  • NTT docomo
    • AWS で全国展開
  • JPX
  • 関西電力
  • イオン Financial Group
    • 決済まわり
    • AWS で 16 のシステムを運用
  • 盛岡市
    • デジタル庁の指導の元
    • ガバメントクラウド

クラウド+生成 AI

Anthropic

Anthropic

  • 先進的なモデルを生み出す先進的な研究を行う
  • Claude の開発
    • ケンポウ AI
      • AWS の利用で安全性を担保
  • 社会的な研究
  • ポリシー
    • 安全性に考慮し、自らの範囲を超えないように
  • 他社の 1/5 の資本で最高水準のモデルをリリース
  • わずか一年後に Claude3 もリリース
  • エンタープライズ向けも開発
    • Opus:最も賢い
    • Haiku:高速でコンパクト
    • Sonnet:Opus と Haiku の中間

共同創設者権チーフサイエンティスト ジャレッドカプラン

  • AI の知能は予測的に向上させられる
    • HW、アルゴリズムで
  • AI は通常と異なり、実験 → 成熟といったサイクルではない
大きな問い

どのようにして責任を果たしながら生成 AI モデルの革新と拡大を続けるか?

AWS と生成 AI

お知らせ:AWS で Claude3 が使える(Tokyo Region)

  • AWS Trainium
    • トレーニングコストを最大 50%削減
  • AWS Inferentia2
    • インフレンシア
  • Amazon Bedrock
    • 最適な品質、コスト、レイテンシーを絵提供する
    • 幅広いモデルの選択肢

ソニーでの生成 AI の取り組み

ソニーグループ COO 兼 CIO 小寺さん

方針:生成 AI を使い倒す

  • カメラのオートフォーカス
  • ゲームの AI エージェント
  • ID や決済の不正検知

Enterprise LLM

社員が生成 AI のリスクと Opportunity を体感

AWS の AI 支援

  • Amazon Q(生成 AI アシスタント)
    • Tokyo Region での提供

後日

  • モデル開発
  • AI でプロダクトイノベーション

色々

  • ITX パッケージ

クラウドがもたらす影響

  • ファストドクター
    • 緊急問診、オンライン問診サービス
    • Amazon Connect
    • 生成 AI
  • atama+

ispace

宇宙の探査関連の会社 日本が本社

  • ペイロード
  • データ
  • パートナーシップ

サイバーインシデントをデモで実演! 巧妙化する脅威からあなたの組織を守るには?

  • インスタンスメタデータ
    • 仮想マシンの持つ固有情報
    • 本来は管理目的で実装されている

攻撃デモ

  • cmd.zip(ディレクトリトラバーサルを利用)で不正に apache の HTML の場所に配置
    • zip スリップ
  • cmd.php ページにアクセス
    • 任意のコマンドを入力
    • リージョン情報の取得
    • アクセスキー、トークンの取得
    • ロール情報取得
  • データ持ち出し
    • インスタンス情報の取得
    • secrets manager のアクセス失敗
    • s3 バケットにアクセス可能を確認
  • マルウェア配置
    • ランサム Exe を混入
    • appspec も変更(ランサム Exe 実行されるように)
  • CodeDeploy の仕様でデプロイされて感染

エンタープライズシステムが抱える課題とマイクロサービスアーキテクチャ

開発チーム

カインズ ホームセンター運営

  • Amazon との共通点
    • 低コスト、低価格、利便性
    • ビジネスモデルなど学ぶところが多い
      • Framework 参考など

ポイントカード会員 1200 万人

  • 0.7%の人にマーケして売り上げ出すには、、、???

  • 内製化の意味合い

    • オーナーシップを持つこと
    • ビジネス → システムの流れ

開発組織の変遷

  • 解決すべき課題

    • API の裏側の仕組みはベンダーに閉じている
      • =似たような機能がたくさんある
      • 発注システムが3つある
      • 普通の発注、グループ内の発注、出荷と入荷関連

既存の構成

  • オフラインとオンラインの融合

    • 店舗 → インターネット含む今
    • POS と EC、Mobile がやりとり、POS から売り上げ計上
    • POS、EC,Mobile→ コマースシステム → 売り上げ計上
  • コンセプト

    • サービス同士を繋いで(オーケストレーション)最終的なアプリケーションを作る
    • サービス単位で再利用可能

現在の構成

  • リテールシステムの目指すもの=コンポーサブルコマース(組み立て可能)
    • フロントエンド → フロントエンド用のコネクタ → オーケストレーション → バックエンド用のコネクタ → バックエンドサービス群

AWS への期待

  • コンポーザブルコマースのバックエンドアーキテクチャ
    • サービスのプロビジョニング仕組み
    • マイクロサービスで分離されるサービスの影向管理
    • システムを支えるデータプレーンと BI のバーチャル統合

まとめ

AWSマルチアカウント

欠席

AWSで実現するデータガバナンス

データ戦略の最優先事項

  • データガバナンスとは
    • 企業内のデータを限られたアクセス範囲に閉じ込めて守ること(守り) ではなく、
    • ビジネス上のイノベーションを加速するためのツール(攻め)

challenge

  • More Data
    • データサイズ、種類が増えている
  • More Sources
    • データが増えている
    • アクセスに時間がかかる
  • More Business Units
    • ビジネスに関わる人が増えている

AWS のデータガバナンスフレームワーク

フレームワーク

  • ビジネスを起点、要件からアプローチ
  • スモールスタート

データ管理

Point

  1. Curate
    • データ品質、データを綺麗にする
    • AWS Glue
      • 機密データ検知:個人情報(PII)があるか
        • 自動削除、ダミーで置き換えるなどのマスキング
      • 機密データは国によって変わるが、対応済み
      • Glue Data Quality で品質ルール推薦、手動で適用も可能
      • ML でデータ品質ルールを段階的に強化
  2. Understand
    • メタデータ管理
      • 要件
        • どこにあるかわからんので検索したい
        • 分析に活用できるか知りたい
        • 信頼できる品質のデータか知りたい
    • Amazon DataZone
      • 生成 AI で自動化
      • 社内データを管理するマーケットプレイスのようなもの
      • Glue のデータカタログを使って登録できる(リンクを貼るだけ)
    • ビジネスメタデータ
      • ビジネス的な意味、ラベル
      • テクニカルメタデータ
      • ビジネス用語集とデータフォーム
  3. Protect
    • アクセスコントロール
    • アクセス許可、権限の設定で組織間も共有可

まとめ

AWSコスト管理の最前線

  • CFM

  • Cloud Financial Manager

  • EC2 題材

  • ぱぱっと確認したい時:CE(AWS Cost Explorer)

    • 請求書と同じ金額 → ブレンドコスト
    • Amazon Q(AI) に聞いても回答してくれる, リンク付き

可視化

  • タグでリソースの管理者を識別できる
    • KV 式
    • 注意:コスト配分タグとして登録(有効化)しないとコスト関連サービスで見れない
      • org の時は Pay 権限を持つアカウントでないと利用できない
    • バックフィルで過去最大12ヶ月遡って見る事ができる
  • AWS Resource Explorer
    • 検索結果のエクスポートもできる
  • 補足
    • AWS Tag Editor でタグのないリソースを検索
      • 一括タグづけが可能
    • AWS Config 高度なクエリ(まだ Preview 版)でも検索できる
    • AWS Service Catalog App Registry でもできる(裏技)

最適化

  • AWS Cost And Usage Reports(CUR)

    • 請求と管理のデータエクスポートから作成
    • 格納先 S3 を指定
    • Amazon Athena(SQL)で分析可能
    • 最新= 2.0 を使おう
      • 今までのもの=レガシー CUR
      • 改善済み
  • AWS Cost And Usage Dashboard(CUD)

    • CUR 作成で S3 に格納から QuickSight の設定まで行う
    • いろんな分析ができる
    • 閲覧者にアクセス許可せずとも安全に共有できる

クイックウィン最適化

    1. 需要に合うスケジューリング
    • EventBridge スケジューラと Lambda(シンプル)
    • Systems Manager, Resource Scheduler
      • マルチアカウントの場合
    • Instance Scheduler
    1. 未使用リソース停止
    1. インスタンスタイプの見直し
    1. ストレージの見直し(EBS)
  • 2-4 までリコメンデーション確認できる
    • AWS Cost Optimization Hub
    1. Savings Plans
  • 補足
    • Amazon CloudWatch natural language query generation
      • メトリクスで使える生成 AI→SQL

計画・予測

  • AWS Budgets
    • 予算と予算アラートの設定(無料)
    • PJT 単位での指定も可能
  • AWS Cost Anomaly Detection(無料)
    • 異常検知アラート
    • 利用状況を学習モデルによって学習 → ベースラインを超えた値を検知
    • CE を有効化すると自動で有効になる

どこでもAI

歴史

  • MMX:整数演算の高速化
  • SSE:Streaming 拡張、浮動小数点演算の高速化
    • 音声認識とかでよく使う
    • 128bit→
  • AVX:Advanced Vector Extension
  • AMX:Advanced Matrix Extension
    • 行列演算
    • 1次元のタイルアーキテクチャ → 2次元のタイルアーキテクチャ

Xeon 第4世代について

Xeon セット

  • intel Xeon(ジーオン) クラウド用の GPU

    • 4chip が一つの基盤に実装されているイメージ
    • コヒーレンス
    • アクセラレータ
      • アプリケーション特化の計算をよくするユニット
      • c7i とかのインスタンスで利用でき、3 倍~10 倍性能が上がる
    • 省電力
    • AI 用に合わせて CPU、メモリも調整
  • 命令セットの進化

    • AVX 1 クロックあたり、85 回整数演算可能
    • VNNI 3サイクルかかっていた処理を一つにまとめて 2.75 倍くらい速くなった
    • AMX 2048 INT8 ops/cycle/core、爆速!!!

AMX は FW 側で制御され、ユーザー側からはほぼ見えない

Performance

Performance

  • Stable Diffusion
    • ファインチューニング:5 分以内
    • 生成:5 秒以内

CPU だけでもかなり速い

Why Intel?

  • 15 年以上、AWS とエンジニアリングパートナーシップ協定しているから

実際の PJT 例

  • がんの研究
  • シドニー大学のゲノム研究  10 日 →5 時間
  • IoT, Edge

ec2 instance

Intel インスタンスタイプ

前世代と比較して、10 倍 M7i, C7i, R7i

Intel でのユースケース

製造業が得意

  • 機械の異常検知
  • プロダクトの異常
  • 機材に関するマニュアルを覚えた LLM の実証実験

model のソース

  • Hugging Face 社と協力している
  • Intel の専用ライブラリもあり、それでモデルの最適化、量子化、コンパクト化が可能

今後の AI

  • パラメータの大きいモデル
  • ドメインのエキスパート(計算量を小さくしたもの)

エキスパートプロダクションモデル

  • LLM-x(クローズド)
  • LLM-Open(OSS)
  • LLM-enterprise
  • LLM-Expert
    • 7b~10b、鯖からスマホ
Hugo で構築されています。
テーマ StackJimmy によって設計されています。