
Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) - Professional-Data-Engineer日本語 Exam Questions
QUESTION NO: 1
仮想プライベート クラウド (VPC) ネットワークの一部として VM に Oracle データベースをデプロイしています。50 個のテーブルを BigQuery に複製し、継続的に同期したいと考えています。インフラストラクチャを管理する必要性を最小限に抑えたいと考えています。どうすればよいでしょうか。
仮想プライベート クラウド (VPC) ネットワークの一部として VM に Oracle データベースをデプロイしています。50 個のテーブルを BigQuery に複製し、継続的に同期したいと考えています。インフラストラクチャを管理する必要性を最小限に抑えたいと考えています。どうすればよいでしょうか。
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 2
あなたの会社は最近急速に成長し、以前よりも大幅に高い速度でデータを取り込んでいます。あなたは Apache Hadoop で毎日のバッチ MapReduce 分析ジョブを管理しています。しかし、最近のデータの増加により、バッチ ジョブが遅れています。開発チームがコストを増やさずに分析の応答性を向上させる方法を提案するように求められました。あなたは開発チームに何を提案すべきでしょうか?
あなたの会社は最近急速に成長し、以前よりも大幅に高い速度でデータを取り込んでいます。あなたは Apache Hadoop で毎日のバッチ MapReduce 分析ジョブを管理しています。しかし、最近のデータの増加により、バッチ ジョブが遅れています。開発チームがコストを増やさずに分析の応答性を向上させる方法を提案するように求められました。あなたは開発チームに何を提案すべきでしょうか?
Correct Answer: C
QUESTION NO: 3
BigQuery には、会社のレポートを生成するために使用されるデータがあります。週次エグゼクティブ レポートの一部のフィールドが会社の標準に従った形式に対応していないことに気付きました。たとえば、レポート エラーには、異なる電話番号形式や異なる国コード識別子が含まれます。これは頻繁に発生する問題なので、データを正規化するための定期的なジョブを作成する必要があります。コーディングを必要としない迅速なソリューションが必要です。どうすればよいでしょうか。
BigQuery には、会社のレポートを生成するために使用されるデータがあります。週次エグゼクティブ レポートの一部のフィールドが会社の標準に従った形式に対応していないことに気付きました。たとえば、レポート エラーには、異なる電話番号形式や異なる国コード識別子が含まれます。これは頻繁に発生する問題なので、データを正規化するための定期的なジョブを作成する必要があります。コーディングを必要としない迅速なソリューションが必要です。どうすればよいでしょうか。
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 4
インフラストラクチャ チームは、Google Cloud とオンプレミス ネットワーク間の相互接続リンクを設定しました。オンプレミスでホストされている Apache Kafka クラスタからストリーミングでデータを取り込むための高スループット ストリーミング パイプラインを設計しています。レイテンシを可能な限り最小限にして、データを BigQuery に保存したいと考えています。どうすればよいでしょうか。
インフラストラクチャ チームは、Google Cloud とオンプレミス ネットワーク間の相互接続リンクを設定しました。オンプレミスでホストされている Apache Kafka クラスタからストリーミングでデータを取り込むための高スループット ストリーミング パイプラインを設計しています。レイテンシを可能な限り最小限にして、データを BigQuery に保存したいと考えています。どうすればよいでしょうか。
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 5
Cloud Dataproc クラスタを管理しています。クラスタで進行中の作業を失うことなく、コストを最小限に抑えながらジョブの実行を高速化する必要があります。どうすればよいでしょうか。
Cloud Dataproc クラスタを管理しています。クラスタで進行中の作業を失うことなく、コストを最小限に抑えながらジョブの実行を高速化する必要があります。どうすればよいでしょうか。
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 6
Dataflow はバッチ データ パイプラインまたはストリーミング データ パイプラインを処理しますか?
Dataflow はバッチ データ パイプラインまたはストリーミング データ パイプラインを処理しますか?
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 7
Dataflow プログラムをローカルで実行するために使用できる Java SDK クラスはどれですか?
Dataflow プログラムをローカルで実行するために使用できる Java SDK クラスはどれですか?
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 8
アナリティクス チームは、いくつかの異なる指標に基づいて、どの顧客があなたの会社と再び取引する可能性が最も高いかを判断するためのシンプルな統計モデルを構築したいと考えています。チームは、Google Cloud Storage に格納されているデータを使用して Apache Spark でモデルを実行したいと考えています。あなたは、このジョブを実行するために Google Cloud Dataproc を使用することを推奨しました。テストの結果、このワークロードは 15 ノードのクラスタで約 30 分で実行でき、結果を Google BigQuery に出力できることが分かりました。このワークロードを毎週実行する予定です。コストの観点からクラスタを最適化するにはどうすればよいでしょうか。
アナリティクス チームは、いくつかの異なる指標に基づいて、どの顧客があなたの会社と再び取引する可能性が最も高いかを判断するためのシンプルな統計モデルを構築したいと考えています。チームは、Google Cloud Storage に格納されているデータを使用して Apache Spark でモデルを実行したいと考えています。あなたは、このジョブを実行するために Google Cloud Dataproc を使用することを推奨しました。テストの結果、このワークロードは 15 ノードのクラスタで約 30 分で実行でき、結果を Google BigQuery に出力できることが分かりました。このワークロードを毎週実行する予定です。コストの観点からクラスタを最適化するにはどうすればよいでしょうか。
Correct Answer: C
QUESTION NO: 9
あなたは、配車需要の高いエリアを特定し、需要を満たすために利用可能なドライバーを効果的に再ルーティングする配車アプリ用のリアルタイム システムを設計しています。システムは、複数のソースから Pub/Sub にデータを取り込み、データを処理し、結果をリアルタイム ダッシュボードで視覚化および分析するために保存します。データ ソースには、5 秒ごとのドライバーの位置の更新と、乗客からのアプリベースの予約イベントが含まれます。データ処理には、過去 30 秒間の供給と需要のデータを 2 秒ごとにリアルタイムで集計し、結果を低レイテンシ システムに保存して視覚化することが含まれます。あなたは何をすべきでしょうか?
あなたは、配車需要の高いエリアを特定し、需要を満たすために利用可能なドライバーを効果的に再ルーティングする配車アプリ用のリアルタイム システムを設計しています。システムは、複数のソースから Pub/Sub にデータを取り込み、データを処理し、結果をリアルタイム ダッシュボードで視覚化および分析するために保存します。データ ソースには、5 秒ごとのドライバーの位置の更新と、乗客からのアプリベースの予約イベントが含まれます。データ処理には、過去 30 秒間の供給と需要のデータを 2 秒ごとにリアルタイムで集計し、結果を低レイテンシ システムに保存して視覚化することが含まれます。あなたは何をすべきでしょうか?
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 10
履歴データは Cloud Storage に保存します。履歴データに対して分析を実行する必要があります。無効なデータ エントリを検出し、プログラミングや SQL の知識を必要としないデータ変換を実行するソリューションを使用したいと考えています。
何をすべきでしょうか?
履歴データは Cloud Storage に保存します。履歴データに対して分析を実行する必要があります。無効なデータ エントリを検出し、プログラミングや SQL の知識を必要としないデータ変換を実行するソリューションを使用したいと考えています。
何をすべきでしょうか?
Correct Answer: D
QUESTION NO: 11
サードパーティから毎月CSV形式のデータファイルを受け取ります。このデータをクレンジングする必要がありますが、ファイルのスキーマは3ヶ月ごとに変更されます。これらの変換を実装するための要件は次のとおりです。
スケジュールに従って変換を実行する
開発者以外のアナリストが変換を変更できるようにする
変換を設計するためのグラフィカルツールの提供
何をすべきでしょうか?
サードパーティから毎月CSV形式のデータファイルを受け取ります。このデータをクレンジングする必要がありますが、ファイルのスキーマは3ヶ月ごとに変更されます。これらの変換を実装するための要件は次のとおりです。
スケジュールに従って変換を実行する
開発者以外のアナリストが変換を変更できるようにする
変換を設計するためのグラフィカルツールの提供
何をすべきでしょうか?
Correct Answer: C




