ログイン

Google Cloud Professional Data Engineer Practice Test 2-1
25問 • 4ヶ月前
  • YUSUKE
  • 通報

    問題一覧

  • 1

    質問01:Bigtable にデータをストリーミングするリアルタイム監視アプリケーションを使用していますが、期待どおりのパフォーマンスが得られていません。各ソースシステムの一意の ID で始まる行キーを使用しています。各ソースシステムは毎分 500KB のデータを転送し、1 行に書き込んでいます。列ファミリーは約 200 個あり、それぞれ平均 10 列で構成されています。パフォーマンスが低い原因は何でしょうか?

    200 列ファミリは、推奨される 100 列ファミリの制限を超えています

  • 2

    質問02:gsutil rsynch を使用して数百のファイルを Google Cloud にアップロードしています。ファイルセットのアップロードが完了しません。正常にアップロードされたファイルを再読み込みしたくないのですが、rsynch 操作を再開するにはどのコマンドを使用すればよいですか?

    最初に使用したのと同じコマンドです。Gsutil rsynch が自動的に再開されます。

  • 3

    質問03:会社では新しいデータ分析チームを立ち上げました。データアナリストは、Cloud Storage との間でデータの読み書きや BigQuery へのクエリを実行する必要があります。また、データエンジニアは Cloud Storage バケットを作成し、バケットにデータライフサイクル管理ポリシーを設定する必要があります。Google Cloud が推奨するベストプラクティスに従う場合、新しいチームのアクセス権限をどのように管理すればよいでしょうか?

    データアナリスト用のグループとデータエンジニア用のグループを作成します。データアナリストのIDをデータアナリストグループに追加します。データエンジニアのIDをデータエンジニアグループに追加します。データアナリストに必要なアクセスを許可するために、データアナリストグループにロールを付与します。データエンジニアに必要なロールをデータエンジニアグループに付与します。

  • 4

    質問04:BigQuery データ ウェアハウスは、外部テーブルを使用して Cloud Storage 内のデータにアクセスする必要があります。Cloud Storage 内のファイルに基づく外部テーブルでサポートされていないファイル形式は次のどれですか。

    Excel xlsx format

  • 5

    質問05:データ サイエンティストが Google Cloud を使った分析方法を学習中です。Cloud Storage に保存されているデータセットに対して、データ品質チェックと探索的分析を実行したいと考えています。どのような Google Cloud サービスの使用をお勧めしますか?

    Cloud Dataprep

  • 6

    質問06:データアナリストのチームが、大規模なデータセットに対して一連のジョブを実行したいと考えています。ジョブ間には複雑な依存関係があり、可能であればマネージドサービスの利用を希望しています。以下のどれを試してみることをお勧めしますか?

    Python で Airflow 有向非巡回グラフを記述し、Cloud Composer で実行します。

  • 7

    質問07:データアナリストは現在、bigquery.dataViewer ロールを所有しており、マテリアライズド・ビューに対してクエリを実行できます。また、マテリアライズド・ビューをリフレッシュできるようにしたいと考えています。定義済みロールを使用する一方で、マテリアライズド・ビューのリフレッシュに必要な権限以上の権限は付与したくないとします。このユーザーに付与する定義済みロールは何でしょうか?

    bigquery.dataEditor

  • 8

    質問08:ある金融サービス会社では、株価データを保存するために単一のBigtableクラスタを使用しています。取引時間中は大量の書き込み操作が発生し、分析バッチジョブも一日中実行されています。あなたはBigtableのパフォーマンス最適化の支援を依頼されました。どのような提案をしますか?

    Bigtable インスタンスに 2 番目のクラスターを追加して書き込みワークロードとバッチワークロードを分離し、書き込みトラフィック用とバッチジョブ用の 2 つのアプリ プロファイルを作成します。

  • 9

    質問09:データアナリストのチームはSQLの使用には精通していますが、Java、Python、その他のプログラミング言語でのプログラミングは未経験です。彼らはリレーショナルデータで学習させた機械学習モデルの構築を試みています。扱うデータはおよそ1TBあります。どのようなツールを使うことをお勧めしますか?

    BigQuery ML

  • 10

    質問10:データベース管理者として、PostgreSQL を使用した Cloud SQL データベースが読み取り操作の SLA を満たしていないことに気づきました。データベース アプリケーションへの変更を最小限に抑えながらパフォーマンスを改善したいと考えています。読み取りパフォーマンスを改善するために、まず何を試すべきでしょうか。

    読み取りレプリカを作成します。

  • 11

    質問11:比較的少数の特徴量と多数のインスタンスを用いてディープラーニングモデルを学習させています。モデルのパフォーマンスが期待どおりではありません。モデルが過学習していると考えられます。パフォーマンスを改善するために、どのような手法を試してみますか?

    機能クロスを使用する

  • 12

    質問12:ある小売業者は、販売予定の商品数、ひいては在庫数を予測するための機械学習モデルを構築しています。どのようなモデルを構築すべきでしょうか?

    回帰

  • 13

    質問13:トレーニング中にモデルのパラメータを更新するためにバックプロパゲーションで使用される手法は何ですか?

    勾配降下法

  • 14

    質問14:アナリストグループがオンプレミスのHadoopクラスタをGCPに移行しようとしています。彼らはGoogle Cloudが推奨するベストプラクティスに従いたいと考えています。移行の一環として、どのような対策を講じるべきでしょうか?

    ローカル ストレージ上の HDFS の代わりに、エフェメラル クラスタと Cloud Storage を使用します。

  • 15

    質問15:配送ドローンメーカーは、部品の故障を事前に検知するための新しいデータ分析パイプラインを導入しています。ドローンには複数のセンサーが搭載されており、性能データと環境データを分析パイプラインに送信しています。現在、データはREST APIエンドポイントに送信されています。しかし、データを受信するREST APIエンドポイントは、データの到着ペースに追いつくことができません。追いつくことができない場合、データが失われてしまいます。機械学習エンジニアから、このデータ損失を削減するために取り込みプロセスを変更するよう依頼されました。あなたならどうしますか?

    REST API エンドポイントではなく Cloud Pub/Sub トピックにデータを書き込み、取り込みアプリケーションでトピックから読み取ります。

  • 16

    質問16:機械学習モデルがコンテナ化され、Kubernetes Engine にデプロイされました。現在、レプリカが 2 つデプロイされています。レプリカの数を 4 つに増やす必要があります。どのようなコマンドを使用すればよいですか?

    --replicas 4 パラメータを指定した kubectl scale デプロイメント コマンド。

  • 17

    質問17:データパイプラインは、データの取り込みに Cloud Pub/Sub を使用します。データはトピックに保存され、Dataflow ワークフローがそのトピックのサブスクリプションからデータを読み取り、処理して、BigQuery に出力を書き込みます。Cloud Pub/Sub からデータを読み取る際の推奨される認証方法は何ですか?

    サービスアカウントを使用する

  • 18

    質問18:Google Cloud に保存されているデータは、ハードウェア、インフラストラクチャ、プラットフォームの各レベルで暗号化されます。インフラストラクチャ レベルでの暗号化にはどのような暗号化アルゴリズムが使用されていますか?

    AES256

  • 19

    質問19:データベース管理者は、PostgreSQLデータベースを最小限の変更でGoogle Cloudのマネージドサービスに移行したいと考えています。このデータベースは、スペインとフランスに拠点を置く研究者チームによって使用されています。以下のサービスのうち、どれを推奨しますか?

    Cloud SQL

  • 20

    質問20:オンラインゲーム会社のCIOは、プレイヤーのゲームデータを保存するために使用されているMongoDBデータベースの維持コストの増加を懸念しています。MongoDBの代替として、Google Cloudのどのマネージドサービスを推奨しますか?

    Cloud Firestore

  • 21

    質問21:北米の小売業者がヨーロッパへの進出を計画しており、特にスペイン、フランス、ベルギー、ドイツに住む20歳から40歳の個人をターゲットとしています。同社は顧客の嗜好に関する詳細なプロファイルを作成し、推奨商品を提供する予定です。計画通りに進出した場合、どのような規制を遵守する必要がありますか?(2つ選択してください)

    GDPR, PCI Data Security Standard

  • 22

    質問22:ある保険会社は、顧客の質問に最適なカスタマーサポートチームを案内するためのチャットボットサービスを導入したいと考えています。おすすめのGCPサービスはありますか?

    Dialogflow

  • 23

    質問23:us-central1 リージョンで働く機械学習エンジニアは、機械学習モデルのトレーニングに使用する約 200 TB のデータを持っています。モデルのトレーニングには、このデータのごく一部しか使用されません。データはファイルに整理され、月に 1 回程度アクセスされます。ストレージコストを最小限に抑えつつ、信頼性と可用性の高いストレージを確保したいと考えています。このデータの保存にはどのような方法をお勧めしますか?

    クラウドストレージ ニアラインストレージ

  • 24

    質問24:オンプレミスの長期ストレージアーカイブをGoogle Cloudに移行しています。アーカイブファイルへのアクセス頻度は平均30日に1回程度です。ストレージコストを最小限に抑えたいと考えています。どのようなストレージオプションをお勧めしますか?

    ニアラインストレージ

  • 25

    質問25:欧州のヘルスケア企業がデータ処理パイプラインの一部としてCloud Pub/Subを使用しています。同社のCTOは、データが誤ってEU域外のリージョンに書き込まれ、GDPRに違反する可能性があることを懸念しています。データがEU域内のGoogle Cloudリージョン内に留まるようにするには、どのような対策を講じるべきでしょうか?

    すべてのトピックが許容されるリージョンにのみ保存されるように、リソースの場所の制限組織ポリシーを設定します。

  • Alibaba01

    Alibaba01

    YUSUKE · 60問 · 1年前

    Alibaba01

    Alibaba01

    60問 • 1年前
    YUSUKE

    Alibaba02

    Alibaba02

    YUSUKE · 60問 · 1年前

    Alibaba02

    Alibaba02

    60問 • 1年前
    YUSUKE

    Alibaba03

    Alibaba03

    YUSUKE · 60問 · 1年前

    Alibaba03

    Alibaba03

    60問 • 1年前
    YUSUKE

    Alibaba11

    Alibaba11

    YUSUKE · 60問 · 1年前

    Alibaba11

    Alibaba11

    60問 • 1年前
    YUSUKE

    Alibaba12

    Alibaba12

    YUSUKE · 60問 · 1年前

    Alibaba12

    Alibaba12

    60問 • 1年前
    YUSUKE

    2023年秋エンベデッド

    2023年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2023年秋エンベデッド

    2023年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2022年秋エンベデッド

    2022年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2022年秋エンベデッド

    2022年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2021年秋エンベデッド

    2021年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2021年秋エンベデッド

    2021年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2020年秋エンベデッド

    2020年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2020年秋エンベデッド

    2020年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2019年春エンベデッド

    2019年春エンベデッド

    YUSUKE · 25問 · 1年前

    2019年春エンベデッド

    2019年春エンベデッド

    25問 • 1年前
    YUSUKE

    2018年春エンベデッド

    2018年春エンベデッド

    YUSUKE · 25問 · 1年前

    2018年春エンベデッド

    2018年春エンベデッド

    25問 • 1年前
    YUSUKE

    2017年春エンベデッド

    2017年春エンベデッド

    YUSUKE · 25問 · 1年前

    2017年春エンベデッド

    2017年春エンベデッド

    25問 • 1年前
    YUSUKE

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    YUSUKE · 25問 · 9ヶ月前

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    25問 • 9ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    25問 • 5ヶ月前
    YUSUKE

    問題一覧

  • 1

    質問01:Bigtable にデータをストリーミングするリアルタイム監視アプリケーションを使用していますが、期待どおりのパフォーマンスが得られていません。各ソースシステムの一意の ID で始まる行キーを使用しています。各ソースシステムは毎分 500KB のデータを転送し、1 行に書き込んでいます。列ファミリーは約 200 個あり、それぞれ平均 10 列で構成されています。パフォーマンスが低い原因は何でしょうか?

    200 列ファミリは、推奨される 100 列ファミリの制限を超えています

  • 2

    質問02:gsutil rsynch を使用して数百のファイルを Google Cloud にアップロードしています。ファイルセットのアップロードが完了しません。正常にアップロードされたファイルを再読み込みしたくないのですが、rsynch 操作を再開するにはどのコマンドを使用すればよいですか?

    最初に使用したのと同じコマンドです。Gsutil rsynch が自動的に再開されます。

  • 3

    質問03:会社では新しいデータ分析チームを立ち上げました。データアナリストは、Cloud Storage との間でデータの読み書きや BigQuery へのクエリを実行する必要があります。また、データエンジニアは Cloud Storage バケットを作成し、バケットにデータライフサイクル管理ポリシーを設定する必要があります。Google Cloud が推奨するベストプラクティスに従う場合、新しいチームのアクセス権限をどのように管理すればよいでしょうか?

    データアナリスト用のグループとデータエンジニア用のグループを作成します。データアナリストのIDをデータアナリストグループに追加します。データエンジニアのIDをデータエンジニアグループに追加します。データアナリストに必要なアクセスを許可するために、データアナリストグループにロールを付与します。データエンジニアに必要なロールをデータエンジニアグループに付与します。

  • 4

    質問04:BigQuery データ ウェアハウスは、外部テーブルを使用して Cloud Storage 内のデータにアクセスする必要があります。Cloud Storage 内のファイルに基づく外部テーブルでサポートされていないファイル形式は次のどれですか。

    Excel xlsx format

  • 5

    質問05:データ サイエンティストが Google Cloud を使った分析方法を学習中です。Cloud Storage に保存されているデータセットに対して、データ品質チェックと探索的分析を実行したいと考えています。どのような Google Cloud サービスの使用をお勧めしますか?

    Cloud Dataprep

  • 6

    質問06:データアナリストのチームが、大規模なデータセットに対して一連のジョブを実行したいと考えています。ジョブ間には複雑な依存関係があり、可能であればマネージドサービスの利用を希望しています。以下のどれを試してみることをお勧めしますか?

    Python で Airflow 有向非巡回グラフを記述し、Cloud Composer で実行します。

  • 7

    質問07:データアナリストは現在、bigquery.dataViewer ロールを所有しており、マテリアライズド・ビューに対してクエリを実行できます。また、マテリアライズド・ビューをリフレッシュできるようにしたいと考えています。定義済みロールを使用する一方で、マテリアライズド・ビューのリフレッシュに必要な権限以上の権限は付与したくないとします。このユーザーに付与する定義済みロールは何でしょうか?

    bigquery.dataEditor

  • 8

    質問08:ある金融サービス会社では、株価データを保存するために単一のBigtableクラスタを使用しています。取引時間中は大量の書き込み操作が発生し、分析バッチジョブも一日中実行されています。あなたはBigtableのパフォーマンス最適化の支援を依頼されました。どのような提案をしますか?

    Bigtable インスタンスに 2 番目のクラスターを追加して書き込みワークロードとバッチワークロードを分離し、書き込みトラフィック用とバッチジョブ用の 2 つのアプリ プロファイルを作成します。

  • 9

    質問09:データアナリストのチームはSQLの使用には精通していますが、Java、Python、その他のプログラミング言語でのプログラミングは未経験です。彼らはリレーショナルデータで学習させた機械学習モデルの構築を試みています。扱うデータはおよそ1TBあります。どのようなツールを使うことをお勧めしますか?

    BigQuery ML

  • 10

    質問10:データベース管理者として、PostgreSQL を使用した Cloud SQL データベースが読み取り操作の SLA を満たしていないことに気づきました。データベース アプリケーションへの変更を最小限に抑えながらパフォーマンスを改善したいと考えています。読み取りパフォーマンスを改善するために、まず何を試すべきでしょうか。

    読み取りレプリカを作成します。

  • 11

    質問11:比較的少数の特徴量と多数のインスタンスを用いてディープラーニングモデルを学習させています。モデルのパフォーマンスが期待どおりではありません。モデルが過学習していると考えられます。パフォーマンスを改善するために、どのような手法を試してみますか?

    機能クロスを使用する

  • 12

    質問12:ある小売業者は、販売予定の商品数、ひいては在庫数を予測するための機械学習モデルを構築しています。どのようなモデルを構築すべきでしょうか?

    回帰

  • 13

    質問13:トレーニング中にモデルのパラメータを更新するためにバックプロパゲーションで使用される手法は何ですか?

    勾配降下法

  • 14

    質問14:アナリストグループがオンプレミスのHadoopクラスタをGCPに移行しようとしています。彼らはGoogle Cloudが推奨するベストプラクティスに従いたいと考えています。移行の一環として、どのような対策を講じるべきでしょうか?

    ローカル ストレージ上の HDFS の代わりに、エフェメラル クラスタと Cloud Storage を使用します。

  • 15

    質問15:配送ドローンメーカーは、部品の故障を事前に検知するための新しいデータ分析パイプラインを導入しています。ドローンには複数のセンサーが搭載されており、性能データと環境データを分析パイプラインに送信しています。現在、データはREST APIエンドポイントに送信されています。しかし、データを受信するREST APIエンドポイントは、データの到着ペースに追いつくことができません。追いつくことができない場合、データが失われてしまいます。機械学習エンジニアから、このデータ損失を削減するために取り込みプロセスを変更するよう依頼されました。あなたならどうしますか?

    REST API エンドポイントではなく Cloud Pub/Sub トピックにデータを書き込み、取り込みアプリケーションでトピックから読み取ります。

  • 16

    質問16:機械学習モデルがコンテナ化され、Kubernetes Engine にデプロイされました。現在、レプリカが 2 つデプロイされています。レプリカの数を 4 つに増やす必要があります。どのようなコマンドを使用すればよいですか?

    --replicas 4 パラメータを指定した kubectl scale デプロイメント コマンド。

  • 17

    質問17:データパイプラインは、データの取り込みに Cloud Pub/Sub を使用します。データはトピックに保存され、Dataflow ワークフローがそのトピックのサブスクリプションからデータを読み取り、処理して、BigQuery に出力を書き込みます。Cloud Pub/Sub からデータを読み取る際の推奨される認証方法は何ですか?

    サービスアカウントを使用する

  • 18

    質問18:Google Cloud に保存されているデータは、ハードウェア、インフラストラクチャ、プラットフォームの各レベルで暗号化されます。インフラストラクチャ レベルでの暗号化にはどのような暗号化アルゴリズムが使用されていますか?

    AES256

  • 19

    質問19:データベース管理者は、PostgreSQLデータベースを最小限の変更でGoogle Cloudのマネージドサービスに移行したいと考えています。このデータベースは、スペインとフランスに拠点を置く研究者チームによって使用されています。以下のサービスのうち、どれを推奨しますか?

    Cloud SQL

  • 20

    質問20:オンラインゲーム会社のCIOは、プレイヤーのゲームデータを保存するために使用されているMongoDBデータベースの維持コストの増加を懸念しています。MongoDBの代替として、Google Cloudのどのマネージドサービスを推奨しますか?

    Cloud Firestore

  • 21

    質問21:北米の小売業者がヨーロッパへの進出を計画しており、特にスペイン、フランス、ベルギー、ドイツに住む20歳から40歳の個人をターゲットとしています。同社は顧客の嗜好に関する詳細なプロファイルを作成し、推奨商品を提供する予定です。計画通りに進出した場合、どのような規制を遵守する必要がありますか?(2つ選択してください)

    GDPR, PCI Data Security Standard

  • 22

    質問22:ある保険会社は、顧客の質問に最適なカスタマーサポートチームを案内するためのチャットボットサービスを導入したいと考えています。おすすめのGCPサービスはありますか?

    Dialogflow

  • 23

    質問23:us-central1 リージョンで働く機械学習エンジニアは、機械学習モデルのトレーニングに使用する約 200 TB のデータを持っています。モデルのトレーニングには、このデータのごく一部しか使用されません。データはファイルに整理され、月に 1 回程度アクセスされます。ストレージコストを最小限に抑えつつ、信頼性と可用性の高いストレージを確保したいと考えています。このデータの保存にはどのような方法をお勧めしますか?

    クラウドストレージ ニアラインストレージ

  • 24

    質問24:オンプレミスの長期ストレージアーカイブをGoogle Cloudに移行しています。アーカイブファイルへのアクセス頻度は平均30日に1回程度です。ストレージコストを最小限に抑えたいと考えています。どのようなストレージオプションをお勧めしますか?

    ニアラインストレージ

  • 25

    質問25:欧州のヘルスケア企業がデータ処理パイプラインの一部としてCloud Pub/Subを使用しています。同社のCTOは、データが誤ってEU域外のリージョンに書き込まれ、GDPRに違反する可能性があることを懸念しています。データがEU域内のGoogle Cloudリージョン内に留まるようにするには、どのような対策を講じるべきでしょうか?

    すべてのトピックが許容されるリージョンにのみ保存されるように、リソースの場所の制限組織ポリシーを設定します。