Amazon AWS Certified Machine Learning Engineer - Associate (MLA-C01 Korean Version)

QUESTION NO: 1
한 기업이 사용자 정의 학습된 분류 머신러닝 모델을 AWS에 배포해야 합니다. 이 모델은 낮은 지연 시간으로 거의 실시간으로 예측을 수행해야 하며, 가변적인 요청량을 처리할 수 있어야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

A. Amazon SageMaker AI 엔드포인트를 배포합니다. 엔드포인트에 대한 자동 확장을 구성합니다. B. 추론 요청을 일괄 처리하도록 Amazon SageMaker AI 배치 변환 작업을 생성합니다. C. Amazon API Gateway를 사용하여 예측 요청을 수신합니다. Amazon S3 버킷을 사용하여 모델을 호스팅하고 제공합니다. D. 두 개의 Amazon EC2 인스턴스에서 AWS 딥러닝 AMI(DLAMI)를 시작합니다. 해당 인스턴스들을 애플리케이션 로드 밸런서 뒤에서 실행합니다.

Correct Answer: A

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 2
한 회사가 각 광고의 색상 구성을 고려하여 광고 캠페인의 성공을 예측하고자 합니다. ML 엔지니어가 신경망 모델을 위한 데이터를 준비하고 있습니다. 이 데이터 세트에는 범주형 데이터인 색상 정보가 포함되어 있습니다.
ML 엔지니어는 모델에 대해 어떤 기능 엔지니어링 기술을 사용해야 합니까?

A. 모든 색상 특징 벡터의 길이가 동일하도록 패딩을 구현합니다. B. 색상 범주를 원핫 인코딩하여 색상 구성표 기능을 이진 행렬로 변환합니다. C. 색상 범주에 대한 차원 축소를 수행합니다. D. 색상 범주에 레이블 인코딩을 적용합니다. 각 색상에 고유한 정수를 자동으로 할당합니다.

Correct Answer: B

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 3
머신러닝 엔지니어가 대규모 언어 모델(LLM)을 사용하여 아마존 베드락 플랫폼에서 생성형 AI 애플리케이션을 구축하고 있습니다.
다음 목록에서 각 설명에 맞는 생성형 인공지능 용어를 선택하십시오. 각 용어는 한 번씩만 선택하거나 전혀 선택하지 않아야 합니다. (세 개 선택)
* 임베딩
* 검색 증강 생성(RAG)
* 온도
* 토큰

Correct Answer:

Explanation:

Text representation of basic units of data processed by LLMs: Token
High-dimensional vectors that contain the semantic meaning of text: Embedding Enrichment of information from additional data sources to improve a generated response: Retrieval Augmented Generation (RAG) Comprehensive Detailed Explanation Token:
Description: A token represents the smallest unit of text (e.g., a word or part of a word) that an LLM processes. For example, " running " might be split into two tokens: " run " and " ing. " Why? Tokens are the fundamental building blocks for LLM input and output processing, ensuring that the model can understand and generate text efficiently.
Embedding:
Description: High-dimensional vectors that encode the semantic meaning of text. These vectors are representations of words, sentences, or even paragraphs in a way that reflects their relationships and meaning.
Why? Embeddings are essential for enabling similarity search, clustering, or any task requiring semantic understanding. They allow the model to " understand " text contextually.
Retrieval Augmented Generation (RAG):
Description: A technique where information is enriched or retrieved from external data sources (e.g., knowledge bases or document stores) to improve the accuracy and relevance of a model ' s generated responses.
Why? RAG enhances the generative capabilities of LLMs by grounding their responses in factual and up-to- date information, reducing hallucinations in generated text.
By matching these terms to their respective descriptions, the ML engineer can effectively leverage these concepts to build robust and contextually aware generative AI applications on Amazon Bedrock.

QUESTION NO: 4
한 회사가 수천 개의 PDF 정책 문서를 아마존 S3와 아마존 베드락 지식 베이스에 업로드하고 있습니다. 각 문서는 구조화된 섹션으로 구성되어 있습니다. 사용자들은 종종 특정 섹션을 검색하지만, 해당 섹션의 전체적인 맥락을 파악해야 합니다. 이 회사는 정확한 섹션 수준 검색과 자동 맥락 검색 기능을 최소한의 사용자 지정 코딩으로 구현하고자 합니다.
어떤 청킹 전략이 이러한 요구 사항을 충족합니까?

A. 고정 크기 B. 최대 토큰 수 C. 계층적 D. 의미론적

Correct Answer: C

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 5
머신러닝 엔지니어가 여러 개의 GPU를 사용하여 Amazon SageMaker AI에서 학습 작업을 실행하려고 합니다. 학습 데이터 세트는 Apache Parquet 형식으로 저장되어 있습니다.
Parquet 파일의 크기가 너무 커서 SageMaker AI 학습 인스턴스의 메모리에 저장할 수 없습니다.
어떤 해결책이 메모리 문제를 해결할까요?

A. Amazon EMR의 Apache Spark를 사용하여 Parquet 파일을 재분할하고 재분할된 파일을 학습에 사용합니다. B. Amazon EBS 프로비저닝된 IOPS SSD 볼륨을 연결하고 파일을 EBS 볼륨에 저장합니다. C. 메모리가 충분한 메모리 최적화 인스턴스 유형으로 변경합니다. D. SageMaker 분산 데이터 병렬 처리(SMDDP)를 사용하여 메모리 사용량을 분할합니다.

Correct Answer: A

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 6
한 회사가 시계열 데이터를 기반으로 미래 값을 예측하는 머신러닝 모델을 개발하고 있습니다. 데이터 세트에는 정기적인 간격으로 수집된 과거 측정값과 범주형 변수가 포함되어 있습니다. 이 모델은 과거의 패턴과 추세를 바탕으로 미래 값을 예측해야 합니다.
회사는 모델 개발을 위해 어떤 알고리즘과 하이퍼파라미터를 사용해야 할까요?

A. k를 사용하여 클러스터 수를 지정하는 k-평균 클러스터링을 사용합니다. B. 오염을 고려한 Amazon SageMaker AI Random Cut Forest(RCF) 알고리즘을 사용하여 이상치의 예상 비율을 설정합니다. C. Amazon SageMaker AI XGBoost 알고리즘을 사용합니다. 클래스 불균형을 조정하기 위해 scale_pos_weight 하이퍼파라미터를 설정합니다. D. 컨텍스트 길이 및 예측 길이 하이퍼파라미터를 일치시켜 Amazon SageMaker AI DeepAR 알고리즘을 사용합니다.

Correct Answer: D

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 7
한 회사가 Amazon SageMaker를 사용하여 ML 모델을 만들고 있습니다. 이 회사의 데이터 과학자들은 자신이 조율하는 ML 워크플로를 세밀하게 제어해야 합니다. 또한 SageMaker 작업과 워크플로를 방향성 비순환 그래프(DAG)로 시각화할 수 있어야 합니다. 데이터 과학자들은 모델 탐색 실험의 실행 이력을 관리하고 감사 및 규정 준수 검증을 위한 모델 거버넌스를 구축해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?

A. AWS CodePipeline과 SageMaker Experiments와의 통합을 사용하여 전체 ML 워크플로를 관리합니다. Sag eMaker Experiments를 사용하여 실험 실행 내역을 관리하고 감사 및 규정 준수를 검증합니다. B. SageMaker Pipelines 및 SageMaker Experiments와의 통합을 사용하여 전체 ML 워크플로를 관리합니다. SageMaker Experiments를 사용하여 실험 실행 내역을 관리하고 감사 및 규정 준수를 검증합니다. C. SageMaker Pipelines와 SageMaker Studio와의 통합을 통해 전체 ML 워크플로를 관리합니다. SageMaker ML Lineage Tracking을 사용하여 실험 실행 이력을 관리하고 감사 및 규정 준수를 검증합니다. D. AWS CodePipeline과 SageMaker Studio와의 통합을 사용하여 전체 ML 워크플로를 관리합니다. SageMaker ML Lineage Tracking을 사용하여 실험 실행 내역을 관리하고 감사 및 규정 준수를 검증합니다.

Correct Answer: C

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 8
머신러닝 엔지니어가 Amazon SageMaker AI의 머신러닝 워크플로우를 위한 지속적 통합 및 지속적 배포(CI/CD) 파이프라인을 구축하고 있습니다. 이 파이프라인은 새로운 데이터가 Amazon S3 버킷에 업로드될 때마다 모델 재학습, 테스트 및 배포를 자동화해야 합니다. 새로운 데이터 파일의 크기는 약 10GB입니다. 또한, 엔지니어는 감사 목적으로 모델 버전을 추적하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

A. SageMaker 모델 레지스트리와 함께 SageMaker 파이프라인을 사용하여 모델 학습 및 버전 추적을 오케스트레이션합니다. B. AWS CodePipeline, Amazon S3 및 AWS CodeBuild를 사용하여 모델을 자동으로 재학습 및 배포하고 모델 버전을 추적합니다. C. 필요에 따라 SageMaker AI 노트북 인스턴스를 사용하여 모델을 수동으로 재학습하고 배포하세요. 모델 버전을 추적하려면 AWS CloudTrail 로그를 참조하세요. D. 모델을 재학습하고 배포하기 위한 AWS Lambda 함수를 생성합니다. Amazon EventBridge를 사용하여 Lambda 함수를 호출합니다. Lambda 로그를 참조하여 모델 버전을 추적합니다.

Correct Answer: A

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 9
머신러닝 엔지니어는 대규모 데이터 세트에서 비동기 방식으로 추론을 도출하기 위해 머신러닝 모델을 배포해야 합니다. 또한 모델의 데이터 품질을 정기적으로 모니터링하고 데이터 품질 변화가 발생할 경우 알림을 받아야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

A. 예약된 AWS Glue 작업을 사용하여 모델을 배포합니다. Amazon CloudWatch 알람을 사용하여 데이터 품질을 모니터링하고 알림을 보냅니다. B. 예약된 AWS 배치 작업을 사용하여 모델을 배포합니다. AWS CloudTrail을 사용하여 데이터 품질을 모니터링하고 알림을 보냅니다. C. AWS Fargate의 Amazon ECS를 사용하여 모델을 배포합니다. Amazon EventBridge를 사용하여 데이터 품질을 모니터링하고 알림을 보냅니다. D. Amazon SageMaker AI 배치 변환을 사용하여 모델을 배포합니다. SageMaker Model Monitor를 사용하여 데이터 품질을 모니터링하고 알림을 보냅니다.

Correct Answer: D

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 10
ML 엔지니어는 훈련된 ML 모델을 호스팅하는 솔루션을 구현해야 합니다. 모델에 대한 요청 빈도는 하루 종일 일정하지 않습니다.
ML 엔지니어는 모델을 사용하지 않을 때 비용을 최소화하는 확장 가능한 솔루션이 필요합니다. 또한, 이 솔루션은 사용량이 가장 많은 시간대에도 모델의 요청에 응답할 수 있는 용량을 유지해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?

A. 모델을 호스팅하기 위해 고정된 동시성을 가진 AWS Lambda 함수를 생성합니다. 모델에 대한 요청 수에 따라 Lambda 함수가 자동으로 확장되도록 구성합니다. B. AWS Fargate를 사용하는 Amazon Elastic Container Service(Amazon ECS) 클러스터에 모델을 배포합니다. 사용량이 가장 많은 시간대에 요청을 처리할 작업 수를 고정적으로 설정합니다. C. Amazon SageMaker 엔드포인트에 모델을 배포합니다. Amazon CloudWatch 지표를 기반으로 인스턴스 수를 동적으로 조정하는 SageMaker 엔드포인트 자동 확장 정책을 생성합니다. D. Amazon SageMaker 엔드포인트에 모델을 배포합니다. 엔드포인트에 여러 모델 사본을 배포합니다. 엔드포인트에서 모델의 여러 사본 간 트래픽을 라우팅하는 애플리케이션 로드 밸런서를 생성합니다.

Correct Answer: C

QUESTION NO: 11
한 회사가 아마존 세이지메이커(SageMaker)를 사용하여 딥러닝 모델을 구축하고 있습니다. 이 회사는 방대한 양의 데이터를 학습 데이터셋으로 사용합니다. 회사는 검증 데이터셋에서 손실 함수를 최소화하기 위해 모델의 하이퍼파라미터를 최적화해야 합니다.
어떤 하이퍼파라미터 튜닝 전략이 가장 적은 계산 시간으로 이 목표를 달성할 수 있을까요?

A. 베이지안 최적화 B. 고압산소! C. 그리드 검색 D. 무작위 검색

Correct Answer: B

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

QUESTION NO: 12
한 회사가 아마존 베드락에서 지원하는 대규모 언어 모델(LLM)을 사용하여 회사 내부 기술 문서용 채팅 인터페이스를 개발하려고 합니다. 이 회사는 문서를 수십 개의 텍스트 파일 형태로 저장하며, 각 파일의 총 크기는 수 메가바이트에 달합니다. 또한, 이 텍스트 파일은 자주 업데이트됩니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족할까요?

A. Amazon Bedrock에 새 LLM을 생성합니다. 원본 데이터셋과 회사 문서를 사용하여 새 LLM을 학습시킵니다. 채팅 인터페이스에서 호출할 수 있도록 Bedrock에서 새 모델을 사용할 수 있도록 합니다. B. 회사 문서를 Amazon Bedrock 가이드라인과 통합합니다. 채팅 인터페이스에서 모든 Amazon Bedrock 호출에 대해 가이드라인을 실행합니다. C. 모든 텍스트 파일을 사용하여 Amazon Bedrock에서 모델을 미세 조정합니다. 미세 조정된 모델을 사용하여 사용자 프롬프트를 처리합니다. D. 모든 텍스트 파일을 Amazon Bedrock 지식 기반에 업로드합니다. 채팅 인터페이스가 Amazon Bedrock을 호출할 때 지식 기반을 사용하여 컨텍스트를 제공합니다.

Correct Answer: D

Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).

Amazon AWS Certified Machine Learning Engineer - Associate (MLA-C01 Korean Version) - MLA-C01 Korean Exam Questions