
Amazon AWS Certified Machine Learning Engineer - Associate (MLA-C01 Korean Version) - MLA-C01 Korean Exam Questions
QUESTION NO: 1
한 기업이 사용자 정의 학습된 분류 머신러닝 모델을 AWS에 배포해야 합니다. 이 모델은 낮은 지연 시간으로 거의 실시간으로 예측을 수행해야 하며, 가변적인 요청량을 처리할 수 있어야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
한 기업이 사용자 정의 학습된 분류 머신러닝 모델을 AWS에 배포해야 합니다. 이 모델은 낮은 지연 시간으로 거의 실시간으로 예측을 수행해야 하며, 가변적인 요청량을 처리할 수 있어야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 2
한 회사가 각 광고의 색상 구성을 고려하여 광고 캠페인의 성공을 예측하고자 합니다. ML 엔지니어가 신경망 모델을 위한 데이터를 준비하고 있습니다. 이 데이터 세트에는 범주형 데이터인 색상 정보가 포함되어 있습니다.
ML 엔지니어는 모델에 대해 어떤 기능 엔지니어링 기술을 사용해야 합니까?
한 회사가 각 광고의 색상 구성을 고려하여 광고 캠페인의 성공을 예측하고자 합니다. ML 엔지니어가 신경망 모델을 위한 데이터를 준비하고 있습니다. 이 데이터 세트에는 범주형 데이터인 색상 정보가 포함되어 있습니다.
ML 엔지니어는 모델에 대해 어떤 기능 엔지니어링 기술을 사용해야 합니까?
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 3
머신러닝 엔지니어가 대규모 언어 모델(LLM)을 사용하여 아마존 베드락 플랫폼에서 생성형 AI 애플리케이션을 구축하고 있습니다.
다음 목록에서 각 설명에 맞는 생성형 인공지능 용어를 선택하십시오. 각 용어는 한 번씩만 선택하거나 전혀 선택하지 않아야 합니다. (세 개 선택)
* 임베딩
* 검색 증강 생성(RAG)
* 온도
* 토큰

머신러닝 엔지니어가 대규모 언어 모델(LLM)을 사용하여 아마존 베드락 플랫폼에서 생성형 AI 애플리케이션을 구축하고 있습니다.
다음 목록에서 각 설명에 맞는 생성형 인공지능 용어를 선택하십시오. 각 용어는 한 번씩만 선택하거나 전혀 선택하지 않아야 합니다. (세 개 선택)
* 임베딩
* 검색 증강 생성(RAG)
* 온도
* 토큰

Correct Answer:

Explanation:

Text representation of basic units of data processed by LLMs: Token
High-dimensional vectors that contain the semantic meaning of text: Embedding Enrichment of information from additional data sources to improve a generated response: Retrieval Augmented Generation (RAG) Comprehensive Detailed Explanation Token:
Description: A token represents the smallest unit of text (e.g., a word or part of a word) that an LLM processes. For example, " running " might be split into two tokens: " run " and " ing. " Why? Tokens are the fundamental building blocks for LLM input and output processing, ensuring that the model can understand and generate text efficiently.
Embedding:
Description: High-dimensional vectors that encode the semantic meaning of text. These vectors are representations of words, sentences, or even paragraphs in a way that reflects their relationships and meaning.
Why? Embeddings are essential for enabling similarity search, clustering, or any task requiring semantic understanding. They allow the model to " understand " text contextually.
Retrieval Augmented Generation (RAG):
Description: A technique where information is enriched or retrieved from external data sources (e.g., knowledge bases or document stores) to improve the accuracy and relevance of a model ' s generated responses.
Why? RAG enhances the generative capabilities of LLMs by grounding their responses in factual and up-to- date information, reducing hallucinations in generated text.
By matching these terms to their respective descriptions, the ML engineer can effectively leverage these concepts to build robust and contextually aware generative AI applications on Amazon Bedrock.
QUESTION NO: 4
한 회사가 수천 개의 PDF 정책 문서를 아마존 S3와 아마존 베드락 지식 베이스에 업로드하고 있습니다. 각 문서는 구조화된 섹션으로 구성되어 있습니다. 사용자들은 종종 특정 섹션을 검색하지만, 해당 섹션의 전체적인 맥락을 파악해야 합니다. 이 회사는 정확한 섹션 수준 검색과 자동 맥락 검색 기능을 최소한의 사용자 지정 코딩으로 구현하고자 합니다.
어떤 청킹 전략이 이러한 요구 사항을 충족합니까?
한 회사가 수천 개의 PDF 정책 문서를 아마존 S3와 아마존 베드락 지식 베이스에 업로드하고 있습니다. 각 문서는 구조화된 섹션으로 구성되어 있습니다. 사용자들은 종종 특정 섹션을 검색하지만, 해당 섹션의 전체적인 맥락을 파악해야 합니다. 이 회사는 정확한 섹션 수준 검색과 자동 맥락 검색 기능을 최소한의 사용자 지정 코딩으로 구현하고자 합니다.
어떤 청킹 전략이 이러한 요구 사항을 충족합니까?
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 5
머신러닝 엔지니어가 여러 개의 GPU를 사용하여 Amazon SageMaker AI에서 학습 작업을 실행하려고 합니다. 학습 데이터 세트는 Apache Parquet 형식으로 저장되어 있습니다.
Parquet 파일의 크기가 너무 커서 SageMaker AI 학습 인스턴스의 메모리에 저장할 수 없습니다.
어떤 해결책이 메모리 문제를 해결할까요?
머신러닝 엔지니어가 여러 개의 GPU를 사용하여 Amazon SageMaker AI에서 학습 작업을 실행하려고 합니다. 학습 데이터 세트는 Apache Parquet 형식으로 저장되어 있습니다.
Parquet 파일의 크기가 너무 커서 SageMaker AI 학습 인스턴스의 메모리에 저장할 수 없습니다.
어떤 해결책이 메모리 문제를 해결할까요?
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 6
한 회사가 시계열 데이터를 기반으로 미래 값을 예측하는 머신러닝 모델을 개발하고 있습니다. 데이터 세트에는 정기적인 간격으로 수집된 과거 측정값과 범주형 변수가 포함되어 있습니다. 이 모델은 과거의 패턴과 추세를 바탕으로 미래 값을 예측해야 합니다.
회사는 모델 개발을 위해 어떤 알고리즘과 하이퍼파라미터를 사용해야 할까요?
한 회사가 시계열 데이터를 기반으로 미래 값을 예측하는 머신러닝 모델을 개발하고 있습니다. 데이터 세트에는 정기적인 간격으로 수집된 과거 측정값과 범주형 변수가 포함되어 있습니다. 이 모델은 과거의 패턴과 추세를 바탕으로 미래 값을 예측해야 합니다.
회사는 모델 개발을 위해 어떤 알고리즘과 하이퍼파라미터를 사용해야 할까요?
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 7
한 회사가 Amazon SageMaker를 사용하여 ML 모델을 만들고 있습니다. 이 회사의 데이터 과학자들은 자신이 조율하는 ML 워크플로를 세밀하게 제어해야 합니다. 또한 SageMaker 작업과 워크플로를 방향성 비순환 그래프(DAG)로 시각화할 수 있어야 합니다. 데이터 과학자들은 모델 탐색 실험의 실행 이력을 관리하고 감사 및 규정 준수 검증을 위한 모델 거버넌스를 구축해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?
한 회사가 Amazon SageMaker를 사용하여 ML 모델을 만들고 있습니다. 이 회사의 데이터 과학자들은 자신이 조율하는 ML 워크플로를 세밀하게 제어해야 합니다. 또한 SageMaker 작업과 워크플로를 방향성 비순환 그래프(DAG)로 시각화할 수 있어야 합니다. 데이터 과학자들은 모델 탐색 실험의 실행 이력을 관리하고 감사 및 규정 준수 검증을 위한 모델 거버넌스를 구축해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?
Correct Answer: C
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 8
머신러닝 엔지니어가 Amazon SageMaker AI의 머신러닝 워크플로우를 위한 지속적 통합 및 지속적 배포(CI/CD) 파이프라인을 구축하고 있습니다. 이 파이프라인은 새로운 데이터가 Amazon S3 버킷에 업로드될 때마다 모델 재학습, 테스트 및 배포를 자동화해야 합니다. 새로운 데이터 파일의 크기는 약 10GB입니다. 또한, 엔지니어는 감사 목적으로 모델 버전을 추적하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
머신러닝 엔지니어가 Amazon SageMaker AI의 머신러닝 워크플로우를 위한 지속적 통합 및 지속적 배포(CI/CD) 파이프라인을 구축하고 있습니다. 이 파이프라인은 새로운 데이터가 Amazon S3 버킷에 업로드될 때마다 모델 재학습, 테스트 및 배포를 자동화해야 합니다. 새로운 데이터 파일의 크기는 약 10GB입니다. 또한, 엔지니어는 감사 목적으로 모델 버전을 추적하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Correct Answer: A
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 9
머신러닝 엔지니어는 대규모 데이터 세트에서 비동기 방식으로 추론을 도출하기 위해 머신러닝 모델을 배포해야 합니다. 또한 모델의 데이터 품질을 정기적으로 모니터링하고 데이터 품질 변화가 발생할 경우 알림을 받아야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
머신러닝 엔지니어는 대규모 데이터 세트에서 비동기 방식으로 추론을 도출하기 위해 머신러닝 모델을 배포해야 합니다. 또한 모델의 데이터 품질을 정기적으로 모니터링하고 데이터 품질 변화가 발생할 경우 알림을 받아야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 10
ML 엔지니어는 훈련된 ML 모델을 호스팅하는 솔루션을 구현해야 합니다. 모델에 대한 요청 빈도는 하루 종일 일정하지 않습니다.
ML 엔지니어는 모델을 사용하지 않을 때 비용을 최소화하는 확장 가능한 솔루션이 필요합니다. 또한, 이 솔루션은 사용량이 가장 많은 시간대에도 모델의 요청에 응답할 수 있는 용량을 유지해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?
ML 엔지니어는 훈련된 ML 모델을 호스팅하는 솔루션을 구현해야 합니다. 모델에 대한 요청 빈도는 하루 종일 일정하지 않습니다.
ML 엔지니어는 모델을 사용하지 않을 때 비용을 최소화하는 확장 가능한 솔루션이 필요합니다. 또한, 이 솔루션은 사용량이 가장 많은 시간대에도 모델의 요청에 응답할 수 있는 용량을 유지해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?
Correct Answer: C
QUESTION NO: 11
한 회사가 아마존 세이지메이커(SageMaker)를 사용하여 딥러닝 모델을 구축하고 있습니다. 이 회사는 방대한 양의 데이터를 학습 데이터셋으로 사용합니다. 회사는 검증 데이터셋에서 손실 함수를 최소화하기 위해 모델의 하이퍼파라미터를 최적화해야 합니다.
어떤 하이퍼파라미터 튜닝 전략이 가장 적은 계산 시간으로 이 목표를 달성할 수 있을까요?
한 회사가 아마존 세이지메이커(SageMaker)를 사용하여 딥러닝 모델을 구축하고 있습니다. 이 회사는 방대한 양의 데이터를 학습 데이터셋으로 사용합니다. 회사는 검증 데이터셋에서 손실 함수를 최소화하기 위해 모델의 하이퍼파라미터를 최적화해야 합니다.
어떤 하이퍼파라미터 튜닝 전략이 가장 적은 계산 시간으로 이 목표를 달성할 수 있을까요?
Correct Answer: B
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).
QUESTION NO: 12
한 회사가 아마존 베드락에서 지원하는 대규모 언어 모델(LLM)을 사용하여 회사 내부 기술 문서용 채팅 인터페이스를 개발하려고 합니다. 이 회사는 문서를 수십 개의 텍스트 파일 형태로 저장하며, 각 파일의 총 크기는 수 메가바이트에 달합니다. 또한, 이 텍스트 파일은 자주 업데이트됩니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족할까요?
한 회사가 아마존 베드락에서 지원하는 대규모 언어 모델(LLM)을 사용하여 회사 내부 기술 문서용 채팅 인터페이스를 개발하려고 합니다. 이 회사는 문서를 수십 개의 텍스트 파일 형태로 저장하며, 각 파일의 총 크기는 수 메가바이트에 달합니다. 또한, 이 텍스트 파일은 자주 업데이트됩니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족할까요?
Correct Answer: D
Explanation: Only visible for Pass4Test members. You can sign-up / login (it's free).




