ログイン

Google Cloud Professional Data Engineer Practice Test 2-2
25問 • 4ヶ月前
  • YUSUKE
  • 通報

    問題一覧

  • 1

    質問26:データアナリストのグループから、Spark を使用して大規模なデータセットを分析するための Cloud Dataproc クラスタの設定について支援を依頼されました。このクラスタでは多数のジョブが実行されます。Google が推奨するベスト プラクティスに従う予定です。次のうち、どの設定を行いますか?(2 つ選択してください)

    永続的なストレージには Cloud Storage を使用する, セカンダリワーカーに使用するプリエンプティブ VM は 30% 以下に抑える

  • 2

    質問27:機械学習モデルが本番環境で検証テストで予測されたほど良好なパフォーマンスを示していません。モデルが過学習しているのではないかと疑っています。過学習のリスクを軽減するために、トレーニング中にどのような手法を活用できますか?

    L2正則化

  • 3

    質問28:Bigtable を使用するアプリケーションのパフォーマンスは、ボリュームの増加に伴い低下し始めています。行キーの設計が最適ではないのではないかと疑っています。行キーのグループのアクセスパターンを確認したいと考えています。どのようなツールを使用すればよいでしょうか?

    Key Visualizer

  • 4

    質問29:Cloud Dataflow ジョブをモニタリングし、パイプライン内でアイテムが待機していた最大期間を知りたいと考えています。この最大期間を追跡するには、どの Cloud Monitoring 指標を使用すればよいでしょうか。

    ジョブ/システムラグ

  • 5

    質問30:開発者がデータパイプライン用のサービスアカウントを作成しようとしましたが、操作を完了できません。原因として考えられるのは次のうちどれですか。

    制約/iam.disableServiceAccountKeyCreation 制約を適用するポリシーがリソース階層に適用されました。

  • 6

    質問31:AWS S3オブジェクトストレージシステムから100TBのデータを正常に転送するという任務を負っています。これは1回限りの転送です。すべてのデータの完全かつ確実な転送が最優先事項です。このデータをCloud Storageにロードするには、どのような方法をお勧めしますか?

    Cloud Storage Transfer Service

  • 7

    質問32:Cloud Dataproc クラスタのユーザーには、クラスタを停止する権限が必要です。また、ワークフローテンプレートやその他の一般的なユーザータスクをインスタンス化する必要もあります。Google Cloud が推奨するセキュリティのベストプラクティスに従う場合、クラスタを停止する権限を付与するにはどのロールを使用すればよいでしょうか?

    ロール/データプロシージャエディター

  • 8

    質問33:Cloud Dataflow を使用して、Key-Value ペアとして表現されるデータを処理しています。ワークフローではどのような Apache Beam 構成要素を使用する予定ですか?

    PCollections

  • 9

    質問34:Cloud Data Fusion の使用中に、Dataproc オペレーションが失敗し、ユーザーにサービス アカウントとして操作する権限がないというエラーが表示されます。この問題を修正するにはどうすればよいですか?

    Cloud Data Fusion にサービス アカウント ユーザーのロールを付与します。

  • 10

    質問35:研究者チームがオンプレミスで高性能分散コンピューティング プラットフォームを運用していますが、Google Cloud への移行を考えています。このプラットフォームでは仮想マシンを使用しています。研究者は、CPU 負荷に応じてクラスタ内の仮想マシンの数をスケールアップしたいと考えています。どのような仮想マシンの使用をお勧めしますか?

    Managed instance groups

  • 11

    質問36:配送ドローンのメーカーは、ドローンに複数のセンサーを搭載し、パフォーマンスと環境データを分析パイプラインに送信しています。過去1時間に受信した温度を分析し、過去1時間の平均から2標準偏差以上離れた温度測定値があった場合、アラートがトリガーされます。マネージドサービスを使用して分析パイプラインを構築したいと考えています。おすすめのGoogle Cloudサービスはありますか?

    Cloud Dataflow

  • 12

    質問37:ある小売業者は、マイクロサービスアーキテクチャ上に構築された新しいアプリケーションのデプロイにKubernetesを使用しています。現在、Kubernetesに関する専門知識を活用しながら、機械学習パイプラインの構築を開始したいと考えています。Kubernetes上で機械学習ワークフローを実行するのにおすすめのサービスはありますか?

    Kubeflow

  • 13

    質問38:配送ドローンのメーカーは、Compute Engine で稼働する PostgreSQL データベースをデータの保存に使用しています。同社は成長を続けており、データベースがドローンからのテレメトリデータの取り込みに対応できなくなっています。CTO は、低レイテンシの書き込みとペタバイト規模のデータへの拡張性を備えたマネージド データベース サービスの導入を希望しています。最優先事項はスケーラビリティであり、CTO は必要に応じてアプリケーションの変更に開発時間を投資する用意があります。Google Cloud のマネージド データベース サービスで、どのようなサービスをお勧めですか?

    Cloud Bigtable

  • 14

    質問39:Cloud Spanner データベースでホットスポットが発生しています。データベース内のテーブルの主キーを変更することを提案します。新しいキーを定義する際に、どのような方法を検討しますか?(2つ選択してください)

    既存の主キーのハッシュ値, ビット反転した連続値

  • 15

    質問40:Bigtable を使用するレイテンシの影響を受けやすいアプリケーションがあります。Google Cloud が推奨するベスト プラクティスに従いたいと考えています。どうすればよいですか?

    ノードあたりのストレージ使用率を60%未満に保つ

  • 16

    質問41:現在、IoTセンサーからのメッセージを取り込むためにApache Kafkaを使用しています。Apache Flinkをベースとしたデータパイプラインは、Kafkaからデータを読み取り、処理してから結果を長期ストレージに書き込みます。Google Cloudに移行し、Apache KafkaとApache Flinkの代わりにマネージドサービスを利用する場合、どのサービスを使用しますか?(2つ選択してください)

    Cloud Pub/Sub, Cloud Dataflow

  • 17

    質問42:BigQueryのコストが予想よりも高くなっています。BigQueryデータウェアハウスを使用するデータアナリストに全体的なコスト削減を支援したいと考えています。次のうち、どの方法を推奨しますか?(2つ選択してください)

    SELECT *の使用を避ける, LIMIT はクラスタ化されたテーブルでのみ使用してください

  • 18

    質問43:Cloud Pub/Sub を使用しているサービスで、予期せぬメッセージが蓄積されています。Cloud Pub/Sub に不慣れな開発者から、問題の診断について支援を依頼されました。Cloud Pub/Sub トピックからメッセージが削除される仕組みについて、ご指摘いただけますでしょうか。

    各サブスクリプションの少なくとも 1 人のサブスクライバーがメッセージを確認すると、そのメッセージはストレージから削除されます。

  • 19

    質問44:データサイエンティストのチームは、Cloud Dataproc クラスタで実行されるジョブへの依存度が高まっています。可用性を向上させるため、マスターノードの数を 1 から 2 に増やしたいと考えています。どのようなコマンドを使用すればよいでしょうか。

    クラスターを作成した後は、マスターノードの数を変更することはできません。

  • 20

    質問45:あるプロジェクトスポンサーが、不正の可能性がある取引を分類するための機械学習モデルを開発したいと考えています。適合率と再現率の組み合わせに基づいてモデルをランク付けしたいと考えています。どのような評価指標をお勧めしますか?

    Fスコア

  • 21

    質問46:新しい Cloud Dataflow パイプラインの開発者として、新しいパイプラインのテスト時に使用される処理リソースを制限したいと考えています。新しい Cloud Dataflow ジョブを実行する際に、どのようなパラメータを指定しますか?

    --maxNumWorkers

  • 22

    質問47:データエンジニアのグループが複数のプロジェクトに取り組んでいます。それぞれのプロジェクトには、独自のVM、ストレージバケット、そしてCloud Functionsのセットが用意されます。そして、すべてのプロジェクトは、規制遵守に必要な同一の制約セットによって管理されます。データエンジニアには、Google Cloudのリソースをどのように整理すればよいでしょうか?

    各イニシアチブにプロジェクトを作成し、それらをフォルダに配置します。フォルダにポリシーを添付して制約を適用します。

  • 23

    質問48:あるウェブホスティング会社は、スパース多次元配列データ構造をモデルにしたカスタム構築されたデータストアを使用しています。CIOは、カスタムデータストアの開発と保守に費用を負担したくないと考えています。代わりに、可能であればマネージドデータベースサービスを利用し、そうでない場合は、同じくスパース多次元配列データ構造に基づく、サポートが充実したオープンソースデータベースの利用を希望しています。このウェブホスティング会社はすでにGoogle Cloud Compute Engine、Cloud Storage、Kubernetes Engineを使用しています。この会社にどのようなソリューションを推奨しますか?

    Cloud Bigtable

  • 24

    質問49:ある金融サービス会社は、監査記録を少なくとも7年間保管することが義務付けられています。データへのアクセスは少ないものの、いずれにしても保管する必要があります。同社はこれまでこのデータをオンプレミスのファイルシステムに保存していましたが、CIOはより低コストのソリューションを求めています。同社は複数のワークロードをGoogle Cloudに移行する予定で、Google Cloudベースのソリューションを検討しています。どのようなソリューションをお勧めでしょうか?

    Cloud Storage Archive class storage

  • 25

    質問50:組織内の複数のチームがアクセスするデータを保存するためのCloud Storageバケットセットを作成しています。各チームにはそれぞれ異なるアクセス要件があります。Google Cloudが推奨するベストプラクティスに従う場合、オブジェクトとバケットへのアクセス制御をどのように実装すればよいでしょうか?

    バケットレベルの統一的なアクセス制御

  • Alibaba01

    Alibaba01

    YUSUKE · 60問 · 1年前

    Alibaba01

    Alibaba01

    60問 • 1年前
    YUSUKE

    Alibaba02

    Alibaba02

    YUSUKE · 60問 · 1年前

    Alibaba02

    Alibaba02

    60問 • 1年前
    YUSUKE

    Alibaba03

    Alibaba03

    YUSUKE · 60問 · 1年前

    Alibaba03

    Alibaba03

    60問 • 1年前
    YUSUKE

    Alibaba11

    Alibaba11

    YUSUKE · 60問 · 1年前

    Alibaba11

    Alibaba11

    60問 • 1年前
    YUSUKE

    Alibaba12

    Alibaba12

    YUSUKE · 60問 · 1年前

    Alibaba12

    Alibaba12

    60問 • 1年前
    YUSUKE

    2023年秋エンベデッド

    2023年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2023年秋エンベデッド

    2023年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2022年秋エンベデッド

    2022年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2022年秋エンベデッド

    2022年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2021年秋エンベデッド

    2021年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2021年秋エンベデッド

    2021年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2020年秋エンベデッド

    2020年秋エンベデッド

    YUSUKE · 25問 · 1年前

    2020年秋エンベデッド

    2020年秋エンベデッド

    25問 • 1年前
    YUSUKE

    2019年春エンベデッド

    2019年春エンベデッド

    YUSUKE · 25問 · 1年前

    2019年春エンベデッド

    2019年春エンベデッド

    25問 • 1年前
    YUSUKE

    2018年春エンベデッド

    2018年春エンベデッド

    YUSUKE · 25問 · 1年前

    2018年春エンベデッド

    2018年春エンベデッド

    25問 • 1年前
    YUSUKE

    2017年春エンベデッド

    2017年春エンベデッド

    YUSUKE · 25問 · 1年前

    2017年春エンベデッド

    2017年春エンベデッド

    25問 • 1年前
    YUSUKE

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2024年春システムアーキテクト

    2024年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2023年春システムアーキテクト

    2023年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2022年春システムアーキテクト

    2022年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    YUSUKE · 25問 · 10ヶ月前

    2021年春システムアーキテクト

    2021年春システムアーキテクト

    25問 • 10ヶ月前
    YUSUKE

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    YUSUKE · 25問 · 9ヶ月前

    2019年秋システムアーキテクト

    2019年秋システムアーキテクト

    25問 • 9ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-1

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #01-2

    25問 • 5ヶ月前
    YUSUKE

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    YUSUKE · 25問 · 5ヶ月前

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    Google Cloud Platform Professional Data Engineer 試験 - 練習セット #02-1

    25問 • 5ヶ月前
    YUSUKE

    問題一覧

  • 1

    質問26:データアナリストのグループから、Spark を使用して大規模なデータセットを分析するための Cloud Dataproc クラスタの設定について支援を依頼されました。このクラスタでは多数のジョブが実行されます。Google が推奨するベスト プラクティスに従う予定です。次のうち、どの設定を行いますか?(2 つ選択してください)

    永続的なストレージには Cloud Storage を使用する, セカンダリワーカーに使用するプリエンプティブ VM は 30% 以下に抑える

  • 2

    質問27:機械学習モデルが本番環境で検証テストで予測されたほど良好なパフォーマンスを示していません。モデルが過学習しているのではないかと疑っています。過学習のリスクを軽減するために、トレーニング中にどのような手法を活用できますか?

    L2正則化

  • 3

    質問28:Bigtable を使用するアプリケーションのパフォーマンスは、ボリュームの増加に伴い低下し始めています。行キーの設計が最適ではないのではないかと疑っています。行キーのグループのアクセスパターンを確認したいと考えています。どのようなツールを使用すればよいでしょうか?

    Key Visualizer

  • 4

    質問29:Cloud Dataflow ジョブをモニタリングし、パイプライン内でアイテムが待機していた最大期間を知りたいと考えています。この最大期間を追跡するには、どの Cloud Monitoring 指標を使用すればよいでしょうか。

    ジョブ/システムラグ

  • 5

    質問30:開発者がデータパイプライン用のサービスアカウントを作成しようとしましたが、操作を完了できません。原因として考えられるのは次のうちどれですか。

    制約/iam.disableServiceAccountKeyCreation 制約を適用するポリシーがリソース階層に適用されました。

  • 6

    質問31:AWS S3オブジェクトストレージシステムから100TBのデータを正常に転送するという任務を負っています。これは1回限りの転送です。すべてのデータの完全かつ確実な転送が最優先事項です。このデータをCloud Storageにロードするには、どのような方法をお勧めしますか?

    Cloud Storage Transfer Service

  • 7

    質問32:Cloud Dataproc クラスタのユーザーには、クラスタを停止する権限が必要です。また、ワークフローテンプレートやその他の一般的なユーザータスクをインスタンス化する必要もあります。Google Cloud が推奨するセキュリティのベストプラクティスに従う場合、クラスタを停止する権限を付与するにはどのロールを使用すればよいでしょうか?

    ロール/データプロシージャエディター

  • 8

    質問33:Cloud Dataflow を使用して、Key-Value ペアとして表現されるデータを処理しています。ワークフローではどのような Apache Beam 構成要素を使用する予定ですか?

    PCollections

  • 9

    質問34:Cloud Data Fusion の使用中に、Dataproc オペレーションが失敗し、ユーザーにサービス アカウントとして操作する権限がないというエラーが表示されます。この問題を修正するにはどうすればよいですか?

    Cloud Data Fusion にサービス アカウント ユーザーのロールを付与します。

  • 10

    質問35:研究者チームがオンプレミスで高性能分散コンピューティング プラットフォームを運用していますが、Google Cloud への移行を考えています。このプラットフォームでは仮想マシンを使用しています。研究者は、CPU 負荷に応じてクラスタ内の仮想マシンの数をスケールアップしたいと考えています。どのような仮想マシンの使用をお勧めしますか?

    Managed instance groups

  • 11

    質問36:配送ドローンのメーカーは、ドローンに複数のセンサーを搭載し、パフォーマンスと環境データを分析パイプラインに送信しています。過去1時間に受信した温度を分析し、過去1時間の平均から2標準偏差以上離れた温度測定値があった場合、アラートがトリガーされます。マネージドサービスを使用して分析パイプラインを構築したいと考えています。おすすめのGoogle Cloudサービスはありますか?

    Cloud Dataflow

  • 12

    質問37:ある小売業者は、マイクロサービスアーキテクチャ上に構築された新しいアプリケーションのデプロイにKubernetesを使用しています。現在、Kubernetesに関する専門知識を活用しながら、機械学習パイプラインの構築を開始したいと考えています。Kubernetes上で機械学習ワークフローを実行するのにおすすめのサービスはありますか?

    Kubeflow

  • 13

    質問38:配送ドローンのメーカーは、Compute Engine で稼働する PostgreSQL データベースをデータの保存に使用しています。同社は成長を続けており、データベースがドローンからのテレメトリデータの取り込みに対応できなくなっています。CTO は、低レイテンシの書き込みとペタバイト規模のデータへの拡張性を備えたマネージド データベース サービスの導入を希望しています。最優先事項はスケーラビリティであり、CTO は必要に応じてアプリケーションの変更に開発時間を投資する用意があります。Google Cloud のマネージド データベース サービスで、どのようなサービスをお勧めですか?

    Cloud Bigtable

  • 14

    質問39:Cloud Spanner データベースでホットスポットが発生しています。データベース内のテーブルの主キーを変更することを提案します。新しいキーを定義する際に、どのような方法を検討しますか?(2つ選択してください)

    既存の主キーのハッシュ値, ビット反転した連続値

  • 15

    質問40:Bigtable を使用するレイテンシの影響を受けやすいアプリケーションがあります。Google Cloud が推奨するベスト プラクティスに従いたいと考えています。どうすればよいですか?

    ノードあたりのストレージ使用率を60%未満に保つ

  • 16

    質問41:現在、IoTセンサーからのメッセージを取り込むためにApache Kafkaを使用しています。Apache Flinkをベースとしたデータパイプラインは、Kafkaからデータを読み取り、処理してから結果を長期ストレージに書き込みます。Google Cloudに移行し、Apache KafkaとApache Flinkの代わりにマネージドサービスを利用する場合、どのサービスを使用しますか?(2つ選択してください)

    Cloud Pub/Sub, Cloud Dataflow

  • 17

    質問42:BigQueryのコストが予想よりも高くなっています。BigQueryデータウェアハウスを使用するデータアナリストに全体的なコスト削減を支援したいと考えています。次のうち、どの方法を推奨しますか?(2つ選択してください)

    SELECT *の使用を避ける, LIMIT はクラスタ化されたテーブルでのみ使用してください

  • 18

    質問43:Cloud Pub/Sub を使用しているサービスで、予期せぬメッセージが蓄積されています。Cloud Pub/Sub に不慣れな開発者から、問題の診断について支援を依頼されました。Cloud Pub/Sub トピックからメッセージが削除される仕組みについて、ご指摘いただけますでしょうか。

    各サブスクリプションの少なくとも 1 人のサブスクライバーがメッセージを確認すると、そのメッセージはストレージから削除されます。

  • 19

    質問44:データサイエンティストのチームは、Cloud Dataproc クラスタで実行されるジョブへの依存度が高まっています。可用性を向上させるため、マスターノードの数を 1 から 2 に増やしたいと考えています。どのようなコマンドを使用すればよいでしょうか。

    クラスターを作成した後は、マスターノードの数を変更することはできません。

  • 20

    質問45:あるプロジェクトスポンサーが、不正の可能性がある取引を分類するための機械学習モデルを開発したいと考えています。適合率と再現率の組み合わせに基づいてモデルをランク付けしたいと考えています。どのような評価指標をお勧めしますか?

    Fスコア

  • 21

    質問46:新しい Cloud Dataflow パイプラインの開発者として、新しいパイプラインのテスト時に使用される処理リソースを制限したいと考えています。新しい Cloud Dataflow ジョブを実行する際に、どのようなパラメータを指定しますか?

    --maxNumWorkers

  • 22

    質問47:データエンジニアのグループが複数のプロジェクトに取り組んでいます。それぞれのプロジェクトには、独自のVM、ストレージバケット、そしてCloud Functionsのセットが用意されます。そして、すべてのプロジェクトは、規制遵守に必要な同一の制約セットによって管理されます。データエンジニアには、Google Cloudのリソースをどのように整理すればよいでしょうか?

    各イニシアチブにプロジェクトを作成し、それらをフォルダに配置します。フォルダにポリシーを添付して制約を適用します。

  • 23

    質問48:あるウェブホスティング会社は、スパース多次元配列データ構造をモデルにしたカスタム構築されたデータストアを使用しています。CIOは、カスタムデータストアの開発と保守に費用を負担したくないと考えています。代わりに、可能であればマネージドデータベースサービスを利用し、そうでない場合は、同じくスパース多次元配列データ構造に基づく、サポートが充実したオープンソースデータベースの利用を希望しています。このウェブホスティング会社はすでにGoogle Cloud Compute Engine、Cloud Storage、Kubernetes Engineを使用しています。この会社にどのようなソリューションを推奨しますか?

    Cloud Bigtable

  • 24

    質問49:ある金融サービス会社は、監査記録を少なくとも7年間保管することが義務付けられています。データへのアクセスは少ないものの、いずれにしても保管する必要があります。同社はこれまでこのデータをオンプレミスのファイルシステムに保存していましたが、CIOはより低コストのソリューションを求めています。同社は複数のワークロードをGoogle Cloudに移行する予定で、Google Cloudベースのソリューションを検討しています。どのようなソリューションをお勧めでしょうか?

    Cloud Storage Archive class storage

  • 25

    質問50:組織内の複数のチームがアクセスするデータを保存するためのCloud Storageバケットセットを作成しています。各チームにはそれぞれ異なるアクセス要件があります。Google Cloudが推奨するベストプラクティスに従う場合、オブジェクトとバケットへのアクセス制御をどのように実装すればよいでしょうか?

    バケットレベルの統一的なアクセス制御