ログイン

Google Cloud Professional Data Engineer Practice Test 1-2
25問 • 4ヶ月前
  • YUSUKE
  • 通報

    問題一覧

  • 1

    質問26:ある金融サービス企業が、データウェアハウスと分析にBigQueryを活用したいと考えています。同社は、暗号鍵をパブリッククラウド外にデプロイされた鍵管理システムで保管・管理することが義務付けられています。コンプライアンスを維持しながら、鍵管理のオーバーヘッドを最小限に抑えたいと考えています。どのような対策を推奨しますか?

    外部キー管理には Cloud EKM を使用する

  • 2

    質問27:大学の研究グループが、実験室管理システムを商用化するために会社を設立しました。彼らのアプリケーションではMongoDBデータベースを使用していますが、グループはGoogle Cloudのマネージドデータベースサービスに移行したいと考えています。どのサービスの使用をお勧めしますか?

    Cloud Firestore

  • 3

    質問28:ドローンに搭載されたセンサーからのデータを分析するIoTアプリケーションを開発している企業のコンサルティングを行っています。このアプリケーションは、低レイテンシで大容量データを書き込めるデータベースに依存しています。この企業はこれまでHadoop HBaseを使用していましたが、マネージドデータベースサービスへの移行を希望しています。どのようなサービスをお勧めでしょうか?

    Bigtable

  • 4

    質問29:Cloud Dataproc で同時実行ジョブの最大数を設定したいのですが、どうすればよいでしょうか?

    クラスタを作成するときに、dataproc:dataproc.scheduler.max-concurrent-jobs プロパティを設定します。

  • 5

    質問30:取り込みプロセスの一環として、Cloud Pub/Sub トピックに書き込まれるすべてのメッセージが標準構造になっていることを確認したいとします。メッセージが標準構造になっていることを確認するための推奨される方法は何ですか?

    スキーマを作成し、トピックの作成時にトピックに割り当てます。

  • 6

    質問31:IoTサービスでは、時系列データの保存にBigtableを使用しています。書き込み操作がノード間で均等に分散されるのではなく、一度に1つのノードでのみ実行される傾向があることにお気づきですか?この問題の原因は何でしょうか?

    時間的に近いところに到着したデータが均等に分散されるのではなく、単一のノードに書き込まれるようにする行キーを使用します。

  • 7

    質問32:クラウドストレージに保存されているオブジェクトを管理するためのライフサイクルポリシーを作成中です。ポリシーで使用できるライフサイクル条件は次のどれですか?(3つ選択してください)

    ストレージクラスに一致, 年, ライブです

  • 8

    質問33:社会経済研究者のチームが、調査研究の一環として文書を分析しています。文書には個人を特定できる情報が編集されています。研究者たちは、データにアクセスできる人物が、年齢や郵便番号といった準識別子を用いて個人を再特定できる可能性があることを懸念しています。研究者たちは、このリスクをどのように定量化できるでしょうか?

    データ損失防止サービスを使用して再識別リスク分析を実行します。

  • 9

    質問34:監査担当者から貴社のCIO(最高情報責任者)に対し、Google Cloudで実行されるアプリケーションのすべてのログを60日間保持する必要があるとの通知がありました。また、サードパーティ製ツールのログにも最大60日間アクセスしたいと考えています。この要件を満たすために、どのようなソリューションをお勧めしますか?

    Cloud Logging を使用してログルーターを設定し、ログを 60 日間保存する Cloud Storage シンクを作成します。60 日経過後にログを削除するデータ ライフサイクル ポリシーを作成します。

  • 10

    質問35:あるスタートアップ企業が、世界中のクリケットファン向けにストリーミングサービスを提供しています。このサービスでは、ライブストリーミングと過去の試合の動画の両方を提供します。スタートアップのアーキテクトは、ユーザーがどこにいても同じ体験を提供できるようにしたいと考えています。過去の試合で一貫した体験を提供するために、スタートアップ企業はどのようなGCPサービスを利用できるでしょうか?

    クラウドCDN

  • 11

    質問36:分類タスクのためにディープラーニングモデルを学習させています。モデルの適合率と再現率は非常に低いです。適合率と再現率を向上させるにはどうすればよいでしょうか?

    より多くのトレーニングインスタンスを使用する

  • 12

    質問37:オンプレミスからGoogle Cloudへデータウェアハウスを移行しようとしています。データウェアハウスのユーザーは、高パフォーマンスのインメモリ分析を利用できないことを懸念しています。Google Cloudで同等の機能とパフォーマンスを備えたサービスとして、どのようなものをお勧めですか?

    BigQuery BIエンジン

  • 13

    質問38:業界規制では、個人識別情報(PII)を分析する際に、他のクラウド顧客と共有している物理サーバー上で分析を実行してはならないと定められています。PIIを含むデータの分析にCloud Dataprocを使用する予定です。この規制に準拠するために、Cloud Dataprocクラスタを作成する際に何を行う必要がありますか?

    単一テナント ノード グループを作成し、クラスターの作成時にそのノード グループを指定します。

  • 14

    質問39:医療データを扱うアナリストチームが、BigQueryデータセット内の個人情報(PII)を分析しました。分析結果をマネージドサービスに保存することで、後からPII分析に関する情報を簡単に取得できるようにしたいと考えています。どのようなサービスをお勧めですか?

    Data Catalog

  • 15

    質問40:チームは新しいデータパイプラインをデプロイしています。パイプラインをメンテナンスする開発者には、3つの異なるロールから付与される権限が必要です。これらのロールには、メンテナーには必要のない権限も含まれています。Google Cloudの推奨プラクティスに従うと、どのような権限が推奨されますか?

    必要な権限のみを持つカスタムロールを作成します。これは、最小権限の原則に従います。

  • 16

    質問41:コンサルタントから、既存のメッセージングシステムをCloud Pub/Subに置き換えることを勧められました。既存のシステムの配信保証がCloud Pub/Subとは異なるのではないかと懸念されています。Cloud Pub/Subはどのようなメッセージ配信セマンティクスを保証しますか?

    少なくとも1回は配達する

  • 17

    質問42:Cloud Firestore ではどのような種類のインデックスが自動的に作成されますか? (2 つ選択してください)。

    原子値、降順, 原子値、昇順

  • 18

    質問43:Cloud Dataproc クラスタのワークロードが通常よりも高くなっており、複数のプリエンプティブ VM をワーカーノードとして追加したいと考えています。どのようなコマンドを使用すればよいですか?

    gcloud dataproc クラスタの更新(--num-secondary-workers パラメータ付き)

  • 19

    質問44:ディープラーニングモデルを開発中で、多数の特徴量を含む学習データがあります。どの特徴量が重要か分かりません。そこで、最も重要度の低い特徴量のパラメータをゼロに近づける正則化手法を使用したいと考えています。どのような正則化手法を使用すればよいでしょうか?

    L1またはLasso回帰

  • 20

    質問45:Cloud Dataproc に新しいワークロードがデプロイされ、自動スケーリングポリシーが設定されています。FetchFailedException が断続的に発生しているようです。この問題の原因として最も可能性が高いのは何でしょうか?

    自動スケーリング ポリシーによりスケールダウンが行われ、ノードが廃止されるとシャッフル データが失われます。

  • 21

    質問46:あるメーカーは、複数のデータウェアハウスをBigQueryに移行し、機械学習データにCloud Storageを使用しています。MLエンジニアとデータアナリストは、必要なデータセットを見つけるのに苦労しています。同社のCTOから、データセットを探す際のMLエンジニアとアナリストの作業負荷を軽減する方法についてアドバイスを求められています。どのようなアドバイスをいただけますか?

    Cloud Data Catalog を使用して、Cloud Storage オブジェクトと BigQuery データからメタデータを自動的に抽出します。

  • 22

    質問47:Cloud Firestore ドキュメント データモデルのどのデータ構造がリレーショナル データベースの行に類似していますか?

    Entity

  • 23

    質問48:Cloud Pub/Subトピックにメッセージが書き込まれるたびに実行される関数を作成しました。この関数をデプロイするにはどのコマンドを使用しますか?

    gcloud functions deploy

  • 24

    質問49:BigQueryでマテリアライズド・ビューを使用しています。BigQueryの料金が予想以上に高くなっており、マテリアライズド・ビューが原因ではないかと考えています。マテリアライズド・ビューのどのような特性がBigQueryのコスト増加につながる可能性がありますか?(2つ選択してください)

    マテリアライズドビューに保存されるデータの総量, マテリアライズドビューの更新頻度

  • 25

    質問50:配送ドローンのメーカーは、Apache Beamランナー上に監視システムを構築しています。過去1時間に受信した温度データが分析され、過去1時間の平均温度から2標準偏差以上離れた温度データがある場合、アラートがトリガーされます。この処理を実装するには、どのようなウィンドウ関数を使用すればよいでしょうか?

    スライディングウィンドウ(ホッピングウィンドウとも呼ばれる)

  • Alibaba01

    Alibaba01

    YUSUKE · 60問 · 1年前

    Alibaba01

    Alibaba01

    60問 • 1年前
    YUSUKE

    Alibaba02

    Alibaba02

    YUSUKE · 60問 · 1年前

    Alibaba02

    Alibaba02

    60問 • 1年前
    YUSUKE

    Alibaba03

    Alibaba03

    YUSUKE · 60問 · 1年前

    Alibaba03

    Alibaba03

    60問 • 1年前
    YUSUKE

    Alibaba11

    Alibaba11

    YUSUKE · 60問 · 1年前

    Alibaba11

    Alibaba11

    60問 • 1年前
    YUSUKE

    Alibaba12

    Alibaba12

    YUSUKE · 60問 · 1年前

    Alibaba12

    Alibaba12

    60問 • 1年前
    YUSUKE

    2023年秋エンベデッド

    2023年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2023年秋エンベデッド

    2023年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2022年秋エンベデッド

    2022年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2022年秋エンベデッド

    2022年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2021年秋エンベデッド

    2021年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2021年秋エンベデッド

    2021年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2020年秋エンベデッド

    2020年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2020年秋エンベデッド

    2020年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2019年春エンベデッド

    2019年春エンベデッド

    YUSUKE · 25問 · 1年前

    2019年春エンベデッド

    2019年春エンベデッド

    25問 • 1年前
    YUSUKE

    2018年春エンベデッド

    2018年春エンベデッド

    YUSUKE · 25問 · 1年前

    2018年春エンベデッド

    2018年春エンベデッド

    25問 • 1年前
    YUSUKE

    2017年春エンベデッド

    2017年春エンベデッド

    YUSUKE · 25問 · 1年前

    2017年春エンベデッド

    2017年春エンベデッド

    25問 • 1年前
    YUSUKE

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    YUSUKE · 25問 · 9ヶ月前

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    25問 • 9ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    25問 • 5ヶ月前
    YUSUKE

    問題一覧

  • 1

    質問26:ある金融サービス企業が、データウェアハウスと分析にBigQueryを活用したいと考えています。同社は、暗号鍵をパブリッククラウド外にデプロイされた鍵管理システムで保管・管理することが義務付けられています。コンプライアンスを維持しながら、鍵管理のオーバーヘッドを最小限に抑えたいと考えています。どのような対策を推奨しますか?

    外部キー管理には Cloud EKM を使用する

  • 2

    質問27:大学の研究グループが、実験室管理システムを商用化するために会社を設立しました。彼らのアプリケーションではMongoDBデータベースを使用していますが、グループはGoogle Cloudのマネージドデータベースサービスに移行したいと考えています。どのサービスの使用をお勧めしますか?

    Cloud Firestore

  • 3

    質問28:ドローンに搭載されたセンサーからのデータを分析するIoTアプリケーションを開発している企業のコンサルティングを行っています。このアプリケーションは、低レイテンシで大容量データを書き込めるデータベースに依存しています。この企業はこれまでHadoop HBaseを使用していましたが、マネージドデータベースサービスへの移行を希望しています。どのようなサービスをお勧めでしょうか?

    Bigtable

  • 4

    質問29:Cloud Dataproc で同時実行ジョブの最大数を設定したいのですが、どうすればよいでしょうか?

    クラスタを作成するときに、dataproc:dataproc.scheduler.max-concurrent-jobs プロパティを設定します。

  • 5

    質問30:取り込みプロセスの一環として、Cloud Pub/Sub トピックに書き込まれるすべてのメッセージが標準構造になっていることを確認したいとします。メッセージが標準構造になっていることを確認するための推奨される方法は何ですか?

    スキーマを作成し、トピックの作成時にトピックに割り当てます。

  • 6

    質問31:IoTサービスでは、時系列データの保存にBigtableを使用しています。書き込み操作がノード間で均等に分散されるのではなく、一度に1つのノードでのみ実行される傾向があることにお気づきですか?この問題の原因は何でしょうか?

    時間的に近いところに到着したデータが均等に分散されるのではなく、単一のノードに書き込まれるようにする行キーを使用します。

  • 7

    質問32:クラウドストレージに保存されているオブジェクトを管理するためのライフサイクルポリシーを作成中です。ポリシーで使用できるライフサイクル条件は次のどれですか?(3つ選択してください)

    ストレージクラスに一致, 年, ライブです

  • 8

    質問33:社会経済研究者のチームが、調査研究の一環として文書を分析しています。文書には個人を特定できる情報が編集されています。研究者たちは、データにアクセスできる人物が、年齢や郵便番号といった準識別子を用いて個人を再特定できる可能性があることを懸念しています。研究者たちは、このリスクをどのように定量化できるでしょうか?

    データ損失防止サービスを使用して再識別リスク分析を実行します。

  • 9

    質問34:監査担当者から貴社のCIO(最高情報責任者)に対し、Google Cloudで実行されるアプリケーションのすべてのログを60日間保持する必要があるとの通知がありました。また、サードパーティ製ツールのログにも最大60日間アクセスしたいと考えています。この要件を満たすために、どのようなソリューションをお勧めしますか?

    Cloud Logging を使用してログルーターを設定し、ログを 60 日間保存する Cloud Storage シンクを作成します。60 日経過後にログを削除するデータ ライフサイクル ポリシーを作成します。

  • 10

    質問35:あるスタートアップ企業が、世界中のクリケットファン向けにストリーミングサービスを提供しています。このサービスでは、ライブストリーミングと過去の試合の動画の両方を提供します。スタートアップのアーキテクトは、ユーザーがどこにいても同じ体験を提供できるようにしたいと考えています。過去の試合で一貫した体験を提供するために、スタートアップ企業はどのようなGCPサービスを利用できるでしょうか?

    クラウドCDN

  • 11

    質問36:分類タスクのためにディープラーニングモデルを学習させています。モデルの適合率と再現率は非常に低いです。適合率と再現率を向上させるにはどうすればよいでしょうか?

    より多くのトレーニングインスタンスを使用する

  • 12

    質問37:オンプレミスからGoogle Cloudへデータウェアハウスを移行しようとしています。データウェアハウスのユーザーは、高パフォーマンスのインメモリ分析を利用できないことを懸念しています。Google Cloudで同等の機能とパフォーマンスを備えたサービスとして、どのようなものをお勧めですか?

    BigQuery BIエンジン

  • 13

    質問38:業界規制では、個人識別情報(PII)を分析する際に、他のクラウド顧客と共有している物理サーバー上で分析を実行してはならないと定められています。PIIを含むデータの分析にCloud Dataprocを使用する予定です。この規制に準拠するために、Cloud Dataprocクラスタを作成する際に何を行う必要がありますか?

    単一テナント ノード グループを作成し、クラスターの作成時にそのノード グループを指定します。

  • 14

    質問39:医療データを扱うアナリストチームが、BigQueryデータセット内の個人情報(PII)を分析しました。分析結果をマネージドサービスに保存することで、後からPII分析に関する情報を簡単に取得できるようにしたいと考えています。どのようなサービスをお勧めですか?

    Data Catalog

  • 15

    質問40:チームは新しいデータパイプラインをデプロイしています。パイプラインをメンテナンスする開発者には、3つの異なるロールから付与される権限が必要です。これらのロールには、メンテナーには必要のない権限も含まれています。Google Cloudの推奨プラクティスに従うと、どのような権限が推奨されますか?

    必要な権限のみを持つカスタムロールを作成します。これは、最小権限の原則に従います。

  • 16

    質問41:コンサルタントから、既存のメッセージングシステムをCloud Pub/Subに置き換えることを勧められました。既存のシステムの配信保証がCloud Pub/Subとは異なるのではないかと懸念されています。Cloud Pub/Subはどのようなメッセージ配信セマンティクスを保証しますか?

    少なくとも1回は配達する

  • 17

    質問42:Cloud Firestore ではどのような種類のインデックスが自動的に作成されますか? (2 つ選択してください)。

    原子値、降順, 原子値、昇順

  • 18

    質問43:Cloud Dataproc クラスタのワークロードが通常よりも高くなっており、複数のプリエンプティブ VM をワーカーノードとして追加したいと考えています。どのようなコマンドを使用すればよいですか?

    gcloud dataproc クラスタの更新(--num-secondary-workers パラメータ付き)

  • 19

    質問44:ディープラーニングモデルを開発中で、多数の特徴量を含む学習データがあります。どの特徴量が重要か分かりません。そこで、最も重要度の低い特徴量のパラメータをゼロに近づける正則化手法を使用したいと考えています。どのような正則化手法を使用すればよいでしょうか?

    L1またはLasso回帰

  • 20

    質問45:Cloud Dataproc に新しいワークロードがデプロイされ、自動スケーリングポリシーが設定されています。FetchFailedException が断続的に発生しているようです。この問題の原因として最も可能性が高いのは何でしょうか?

    自動スケーリング ポリシーによりスケールダウンが行われ、ノードが廃止されるとシャッフル データが失われます。

  • 21

    質問46:あるメーカーは、複数のデータウェアハウスをBigQueryに移行し、機械学習データにCloud Storageを使用しています。MLエンジニアとデータアナリストは、必要なデータセットを見つけるのに苦労しています。同社のCTOから、データセットを探す際のMLエンジニアとアナリストの作業負荷を軽減する方法についてアドバイスを求められています。どのようなアドバイスをいただけますか?

    Cloud Data Catalog を使用して、Cloud Storage オブジェクトと BigQuery データからメタデータを自動的に抽出します。

  • 22

    質問47:Cloud Firestore ドキュメント データモデルのどのデータ構造がリレーショナル データベースの行に類似していますか?

    Entity

  • 23

    質問48:Cloud Pub/Subトピックにメッセージが書き込まれるたびに実行される関数を作成しました。この関数をデプロイするにはどのコマンドを使用しますか?

    gcloud functions deploy

  • 24

    質問49:BigQueryでマテリアライズド・ビューを使用しています。BigQueryの料金が予想以上に高くなっており、マテリアライズド・ビューが原因ではないかと考えています。マテリアライズド・ビューのどのような特性がBigQueryのコスト増加につながる可能性がありますか?(2つ選択してください)

    マテリアライズドビューに保存されるデータの総量, マテリアライズドビューの更新頻度

  • 25

    質問50:配送ドローンのメーカーは、Apache Beamランナー上に監視システムを構築しています。過去1時間に受信した温度データが分析され、過去1時間の平均温度から2標準偏差以上離れた温度データがある場合、アラートがトリガーされます。この処理を実装するには、どのようなウィンドウ関数を使用すればよいでしょうか?

    スライディングウィンドウ(ホッピングウィンドウとも呼ばれる)