live chatMcAfee Secure sites help keep you safe from identity theft, credit card fraud, spyware, spam, viruses and online scams
Pass4Test 10%OFF Discount Code

Databricks Certified Data Engineer Professional Exam (Databricks-Certified-Data-Engineer-Professional日本語版) - Databricks-Certified-Data-Engineer-Professional日本語 Exam Questions

QUESTION NO: 1
ビューは次のコードで登録されます。

ユーザーと注文は両方とも Delta Lake テーブルです。
どの文が recent_orders のクエリ結果を表していますか?
Correct Answer: D
QUESTION NO: 2
ある組織は、Webアプリケーションとモバイルアプリケーションから顧客データを処理しています。データには、氏名、メールアドレス、電話番号、位置情報履歴などが含まれます。データは、バッチファイル(SFTPから毎日)とストリーミングJSONイベント(Kafkaからリアルタイム)の両方で受信されます。
データ プライバシー ポリシーに準拠するには、次の要件を満たす必要があります。
- 電子メール、電話などの個人識別情報(PII)
番号および IP アドレスは保存前にマスクまたは匿名化する必要があります。
- バッチパイプラインとストリーミングパイプラインの両方で一貫したPIIを適用する必要がある
取り扱い。
- マスキング ロジックは監査可能かつ再現可能である必要があります。
- マスクされたデータは、ダウンストリーム分析に使用できる必要があります。
データ エンジニアは、バッチ モードとストリーミング モードの両方をサポートし、PII にデータ マスキングを適用し、監査の追跡可能性を維持する準拠データ パイプラインを Databricks 上でどのように設計すればよいでしょうか。
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 3
外部オブジェクト ストレージ コンテナーが /mnt/finance_eda_bucket の場所にマウントされました。
財務チーム用のデータベースを作成するために、次のロジックが実行されました。

データベースが正常に作成され、権限が構成された後、財務チームのメンバーが次のコードを実行します。

財務チームのすべてのユーザーが財務グループのメンバーである場合、tx_sales テーブルがどのように作成されるかを説明するステートメントはどれですか。
Correct Answer: E
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 4
本番環境にデプロイされた構造化ストリーミングジョブで、ピーク時に遅延が発生しています。現在、通常の実行時には、各マイクロバッチのデータ処理時間は3秒未満です。しかし、ピーク時には各マイクロバッチの実行時間が非常に不安定になり、30秒を超えることもあります。ストリーミング書き込みのトリガー間隔は現在10秒に設定されています。
他のすべての変数を一定に保ち、レコードを 10 秒以内に処理する必要があると仮定すると、どの調整が要件を満たすでしょうか。
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 5
開発者はDatabricks Reposの認証情報を設定し、リモートGitリポジトリのクローンを作成しました。しかし、ワークスペースで現在表示されている唯一のブランチであるメインブランチに変更を加える権限がありません。このユーザーがチームメイトの作業を上書きするリスクなしにコードの更新を共有するには、どのような方法がありますか?
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 6
ジュニアデータエンジニアが、ワークロードをリレーショナルデータベースシステムからDatabricks Lakehouseに移行しています。ソースシステムはスタースキーマを使用しており、外部キー制約とマルチテーブル挿入を利用して書き込み時にレコードを検証しています。
このワークロードを移行する際にエンジニアが行う決定に影響を与える考慮事項は何ですか?
Correct Answer: E
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 7
実稼働クラスターには 3 つのエグゼキュータ ノードがあり、ドライバーとエグゼキュータに同じ仮想マシン タイプを使用します。
このクラスターの Ganglia メトリックを評価する場合、ドライバー上で実行されるコードによって発生したボトルネックを示すインジケーターはどれですか?
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 8
Databricks Asset Bundle プロジェクトのファイル resources/app.yml で、データ エンジニアは Databricks アプリ databricks_app_deployed とボリューム volume_deployed をデプロイし、Databricks アプリの背後にあるサービス プリンシパルにボリュームへの読み取りおよび書き込みのアクセス許可を付与したいと考えています。
データ エンジニアはどのようにしてデプロイメントを実現する必要がありますか?
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 9
Lakehouse内のcustomer_churn_paramsというテーブルは、機械学習チームによる顧客離脱予測に使用されています。このテーブルには、複数の上流ソースから得られた顧客情報が含まれています。現在、データエンジニアリングチームは、上流データソースから得られた最新の有効な値でこのテーブルを毎晩上書きすることで、データを更新しています。
MLチームが使用しているチャーン予測モデルは、本番環境では比較的安定しています。チームは過去24時間以内に変更されたレコードのみに基づいて予測を行うことに注力しています。
変更されたレコードの識別を簡素化するアプローチはどれでしょうか?
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 10
データエンジニアが、ソースからのCDC(変更データキャプチャ)データを処理するために、Lakeflow宣言型パイプラインを設定しています。ソースイベントは順序どおりに到着しないことがあり、同じupdate_timestampで異なるupdate_sequence_idを持つ複数の更新が発生することがあります。
イベントが正しく順序付けられていることを確認するために、データ エンジニアは何をすべきでしょうか?
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 11
3 つのエグゼキュータ ノードを持つ特定のクラスターの Ganglia メトリックを評価する場合、VM のリソースが適切に使用されていることを示す指標はどれですか。
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 12
データエンジニアは、修復履歴を含む最新のジョブ実行に関する情報を収集するアプリケーションを作成する必要があります。データエンジニアはリクエストをどのようにフォーマットすればよいでしょうか?
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 13
ストレージとコンピューティングのコストを削減するために、データ エンジニアリング チームには、ビジネス インテリジェンス ダッシュボード、顧客向けアプリケーション、本番環境の機械学習モデル、アドホック分析クエリによって活用される一連の集計テーブルをキュレートする任務が与えられています。
データエンジニアリングチームは、顧客向けアプリケーションからの新たな要件を認識しました。これは、彼らが完全に管理する唯一のダウンストリームワークロードです。その結果、組織全体の多数のチームが使用する集計テーブルで、いくつかのフィールドの名前を変更する必要があり、さらにフィールドも追加する必要があります。
管理する必要があるテーブルの数を増やすことなく、組織内の他のチームへの影響を最小限に抑えながら状況に対処できるソリューションはどれですか?
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 14
Databricksワークスペース管理者は、各データエンジニアリンググループに対して対話型クラスターを構成しました。コスト管理のため、クラスターは30分間操作が行われないと終了するように設定されています。
各ユーザーは、割り当てられたクラスターに対して、いつでもワークロードを実行できる必要があります。
ユーザーがワークスペースに追加されているが、権限が付与されていないと仮定すると、すでに構成されているクラスターを起動してアタッチするためにユーザーが必要とする最小限の権限は次のどれですか。
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).