본문 바로가기

자격증( 금융 IT)

[데이터분석기사_Domain1] 시험 대비 기출 공략(2회)

[데이터분석 기사_Domain1 빅데이터 분석 기획 (2회)


01. 데이터 수집을 위해 다양한 데이터 원천으로부터 데이터를 추출하고 변환하여 데이터베이스에 적재하는 작업에 가장 가까운 것은 무엇인가?
① ETL     ② CDC     ③ ΕΑΙ      ④ OCD

 

[정답 ①] 

 


02. 다음 중 딥러닝의 설명 중 틀린 것은?
① 오류역전파(Error Backpropagation)를 사용한다.
② 딥러닝 분석에서 주로 ReLU, softmax 함수 등을 사용한다.
③ 인공신경망 기법을 사용하기 때문에 은닉층들의 가중치를 통해 모형을 해석하는데 편리하다. 
④ 드롭아웃은 학습 시에 히든노드의 연결을 일정 비율로 끊는다.


[정답

 

 

03. 다음 중 빅데이터 분석 방법론의 절차에 해당하는 것은?
① 데이터 준비 - 데이터 분석 - 분석기획 - 시스템 구현 - 평가 및 전개 
② 데이터 분석 - 데이터 준비 - 시스템 구현 - 평가 및 전개 - 분석기획
③ 분석기획 - 데이터 준비 - 데이터 분석 - 시스템 구현 - 평가 및 전개
④ 평가 및 전개 - 시스템 구현 - 데이터 준비 - 분석기획 - 데이터 분석

[정답 

 


04. 입력한 데이터에 완벽한 라벨값을 주고 학습시키는 방법으로, 회귀분석, 서포트 벡터 머신 등의 모델이 있는 데이터마이닝 기법은?
① 지도학습 
② 비지도학습 
③ 강화학습 
④ 준지도학습

[정답

 


05. 다음 중 비식별화에 대한 설명 중 틀린 것은?
① K-익명성은 특정인에 대한 추론 가능 여부를 검토하여 

일정 확률수준 이상 비식별 되도록조치해야한다.
② L-다양성은 K-익명성을 만족하더라도 각 블록이 최대 

1개 미만의 민감정보를 가지고 있어야한다는 조건을 만족해야 한다.
③ T-근접성은 민감한 정보의 분포를 낮추어 

추론 가능성을 더욱 낮추는 기법이다.
④ 유일성은 원본 데이터 S와 이를 익명 처리한 데이터 T의

 모든 부분속성집합에 대해 S와 T에동일한 속성값을 갖는 레코드들이

 존재하면 S에는 최소 m개 이상의 레코드들이 존재해야한다.

[정답

 


06. 비식별화 처리 방법으로 옳지 않은 것은?
① 가명처리(pseudonymisation)
② 치환(substitution)
③ 특이화(specification)
④ 섭동(Perturbation)

[정답

 


07. 탐색적 자료 분석에 대한 설명 중 틀린 것은?
① 주어진 데이터만 가지고도 충분한 정보를 찾을 수 있도록 개발한 방법이다.
② 탐색적 자료분석을 통해 분포 비교, 결측치/이상치 확인 등을 할 수 있다.
③ 분석 결과물로는 유의확률과 신뢰구간 등이 있다.
④ 데이터에서 특이한 점이나 의미있는 사실을 도출하는 과정이다.

 

[정답

 


08. 다음 중 분석 유형을 구분할 때 조직 내 분석 대상을 명확하게 

인지하고 데이터 분석 방법도 충분히이해하고 있는 유형은?
① 최적화(Optimization)
② 통찰(Insight)
③ 솔루션(Soluition)
④ 발견(Discovery)

[정답

 



09. 개인정보 조회 시 이용자의 동의 없이 조회가 불가능한 경우는?
① 전기, 가스 등의 요금 부과를 위해 정보를 조회하는 경우
② 회사 입사 지원자에 대해 회사가 개인정보(범죄 이력 등)를 조회하는 경우
③ 지진, 화산폭발 등 재난 위험에 처한 사람의 정보를 조회하는 경우
④ 범죄 수사를 위해 범죄자의 정보를 조회하는 경우

[정답 

 


10. 다음 중 정형 데이터 품질에 대한 설명으로 적절한 것은?
① 메타데이터는 데이터를 위한 데이터로 프로파일링을 수행하기 

이전에 수행되며, 데이터 관리문서로부터 수집하여 구조 및 유형을 파악한다.
② 사전정의 방식은 진단하려는 대상, 진단 목적 등을 고려해 

일치하는 측정 기준을 작성된중요도를 선정하여 활용하는 방식이다.
③ 임의적 방식은 사전에 정의된 바가 없어 별도의 중요도를

 산정해야 하는 경우 통계적 분석방법을 통해 산출하는 방법으로 

대표적으로 AHP와 같은 의사결정 방법이 있다.
 업무규칙 도출은 업무규칙 도출, 데이터 현상 분석, 

데이터 품질 측정 순으로 진행된다.

[정답 ①] 

 


11. 데이터를 분석하기 이전에 반드시 수행하는 것으로 그래프나 

통계적인 방법으로 자료를 직관적으로 바라보는 과정은 무엇인가?
① 탐색적 자료 분석(Exploratory Data Analysis)
② 비닝(Binning)
③ 변수 삭제
④ 데이터 마스킹

[정답 ①] 

 


12. 빅데이터 분석 프로세스에서 데이터를 이용한 분류, 예측, 군집 등의

 기능을 수행할 수 있도록하는 것을 만드는 과정을 무엇이라 하는가?
① t-SNE
② 차원 축소
③ 탐색적 자료분석
④ 모델링

 

[정답 

 

 

13. 다음 중 진단분석(Diagnostic Analytics)을 한 이유로 옳은 것은?
① 무슨 일이 일어났는가?
② 왜 일어났는가?
③ 어떤 일이 일어날 것인가?
④ 어떻게 해야 하는가?

[정답 

 

 


14. 다음 중 이상값이 발생하는 원인과 가장 거리가 먼 것은?
① 측정오차
② 우연오차
③ 입력오차
④ 보고오차

[정답 

 

 

15. 다음 중 데이터 유형에 따른 데이터 수집 기법으로 적절하지 않은 것은?
① 데이터베이스 - 크롤링
② Web - FTP
③ 센서데이터 - Open API 

미디어 - 스트리밍

[정답 ①] 

 


16. 다음 중 데이터 분석 성숙도(Data Analysis Maturity)와 관련 없는 것은?
① 도입    ③ 최적화      ② 활용      ④ 인프라

[정답 

 

 

17. 정보보호법에 의거하여 본인에게 알릴 필요가 없는 사항은?
① 개인정보의 수집·이용 목적
② 개인정보 파기 사유
③ 개인정보 수집 항목 및 기간
④ 개인정보 제공을 거부하는 권리

[정답 



18. 상향식 접근 방식으로 문제를 도출하는 프로세스는 무엇인가?
① 프로세스 흐름 분석 → 프로세스 분류 → 분석 요건 정의 → 분석 요건 식별 
② 프로세스 흐름 분석 → 프로세스 분류 → 분석 요건 식별 → 분석 요건 정의 
③ 프로세스 분류 → 프로세스 흐름 분석 → 분석 요건 정의 → 분석 요건 식별 
④ 프로세스 분류 → 프로세스 흐름 분석 → 분석 요건 식별 → 분석 요건 정의 

 

[정답 

 

 

19. 정형 데이터 품질 평가 기준으로 누락된 요소가 없도록 확인하는 것은?
① 완전성
② 유일성
③ 일관성
④ 정확성

[정답 ①] 

 


20. 전사적 차원에서 데이터를 관리하는 체계를 의미하는 용어는?
①데이터 거버넌스
② IT 거버넌스
③ 데이터 레이크
④ 데이터 리터러시


[정답 ①]