[데이터분석 기사_Domain1] 빅데이터 분석 기획 (2회)
01. 데이터 수집을 위해 다양한 데이터 원천으로부터 데이터를 추출하고 변환하여 데이터베이스에 적재하는 작업에 가장 가까운 것은 무엇인가?
① ETL ② CDC ③ ΕΑΙ ④ OCD
[정답 ①]
02. 다음 중 딥러닝의 설명 중 틀린 것은?
① 오류역전파(Error Backpropagation)를 사용한다.
② 딥러닝 분석에서 주로 ReLU, softmax 함수 등을 사용한다.
③ 인공신경망 기법을 사용하기 때문에 은닉층들의 가중치를 통해 모형을 해석하는데 편리하다.
④ 드롭아웃은 학습 시에 히든노드의 연결을 일정 비율로 끊는다.
[정답 ③]
03. 다음 중 빅데이터 분석 방법론의 절차에 해당하는 것은?
① 데이터 준비 - 데이터 분석 - 분석기획 - 시스템 구현 - 평가 및 전개
② 데이터 분석 - 데이터 준비 - 시스템 구현 - 평가 및 전개 - 분석기획
③ 분석기획 - 데이터 준비 - 데이터 분석 - 시스템 구현 - 평가 및 전개
④ 평가 및 전개 - 시스템 구현 - 데이터 준비 - 분석기획 - 데이터 분석
[정답 ③]
04. 입력한 데이터에 완벽한 라벨값을 주고 학습시키는 방법으로, 회귀분석, 서포트 벡터 머신 등의 모델이 있는 데이터마이닝 기법은?
① 지도학습
② 비지도학습
③ 강화학습
④ 준지도학습
[정답 ①]
05. 다음 중 비식별화에 대한 설명 중 틀린 것은?
① K-익명성은 특정인에 대한 추론 가능 여부를 검토하여
일정 확률수준 이상 비식별 되도록조치해야한다.
② L-다양성은 K-익명성을 만족하더라도 각 블록이 최대
1개 미만의 민감정보를 가지고 있어야한다는 조건을 만족해야 한다.
③ T-근접성은 민감한 정보의 분포를 낮추어
추론 가능성을 더욱 낮추는 기법이다.
④ 유일성은 원본 데이터 S와 이를 익명 처리한 데이터 T의
모든 부분속성집합에 대해 S와 T에동일한 속성값을 갖는 레코드들이
존재하면 S에는 최소 m개 이상의 레코드들이 존재해야한다.
[정답 ②]
06. 비식별화 처리 방법으로 옳지 않은 것은?
① 가명처리(pseudonymisation)
② 치환(substitution)
③ 특이화(specification)
④ 섭동(Perturbation)
[정답 ③]
07. 탐색적 자료 분석에 대한 설명 중 틀린 것은?
① 주어진 데이터만 가지고도 충분한 정보를 찾을 수 있도록 개발한 방법이다.
② 탐색적 자료분석을 통해 분포 비교, 결측치/이상치 확인 등을 할 수 있다.
③ 분석 결과물로는 유의확률과 신뢰구간 등이 있다.
④ 데이터에서 특이한 점이나 의미있는 사실을 도출하는 과정이다.
[정답 ③]
08. 다음 중 분석 유형을 구분할 때 조직 내 분석 대상을 명확하게
인지하고 데이터 분석 방법도 충분히이해하고 있는 유형은?
① 최적화(Optimization)
② 통찰(Insight)
③ 솔루션(Soluition)
④ 발견(Discovery)
[정답 ①]
09. 개인정보 조회 시 이용자의 동의 없이 조회가 불가능한 경우는?
① 전기, 가스 등의 요금 부과를 위해 정보를 조회하는 경우
② 회사 입사 지원자에 대해 회사가 개인정보(범죄 이력 등)를 조회하는 경우
③ 지진, 화산폭발 등 재난 위험에 처한 사람의 정보를 조회하는 경우
④ 범죄 수사를 위해 범죄자의 정보를 조회하는 경우
[정답 ②]
10. 다음 중 정형 데이터 품질에 대한 설명으로 적절한 것은?
① 메타데이터는 데이터를 위한 데이터로 프로파일링을 수행하기
이전에 수행되며, 데이터 관리문서로부터 수집하여 구조 및 유형을 파악한다.
② 사전정의 방식은 진단하려는 대상, 진단 목적 등을 고려해
일치하는 측정 기준을 작성된중요도를 선정하여 활용하는 방식이다.
③ 임의적 방식은 사전에 정의된 바가 없어 별도의 중요도를
산정해야 하는 경우 통계적 분석방법을 통해 산출하는 방법으로
대표적으로 AHP와 같은 의사결정 방법이 있다.
④ 업무규칙 도출은 업무규칙 도출, 데이터 현상 분석,
데이터 품질 측정 순으로 진행된다.
[정답 ①]
11. 데이터를 분석하기 이전에 반드시 수행하는 것으로 그래프나
통계적인 방법으로 자료를 직관적으로 바라보는 과정은 무엇인가?
① 탐색적 자료 분석(Exploratory Data Analysis)
② 비닝(Binning)
③ 변수 삭제
④ 데이터 마스킹
[정답 ①]
12. 빅데이터 분석 프로세스에서 데이터를 이용한 분류, 예측, 군집 등의
기능을 수행할 수 있도록하는 것을 만드는 과정을 무엇이라 하는가?
① t-SNE
② 차원 축소
③ 탐색적 자료분석
④ 모델링
[정답 ④]
13. 다음 중 진단분석(Diagnostic Analytics)을 한 이유로 옳은 것은?
① 무슨 일이 일어났는가?
② 왜 일어났는가?
③ 어떤 일이 일어날 것인가?
④ 어떻게 해야 하는가?
[정답 ②]
14. 다음 중 이상값이 발생하는 원인과 가장 거리가 먼 것은?
① 측정오차
② 우연오차
③ 입력오차
④ 보고오차
[정답 ④]
15. 다음 중 데이터 유형에 따른 데이터 수집 기법으로 적절하지 않은 것은?
① 데이터베이스 - 크롤링
② Web - FTP
③ 센서데이터 - Open API
④ 미디어 - 스트리밍
[정답 ①]
16. 다음 중 데이터 분석 성숙도(Data Analysis Maturity)와 관련 없는 것은?
① 도입 ③ 최적화 ② 활용 ④ 인프라
[정답 ④]
17. 정보보호법에 의거하여 본인에게 알릴 필요가 없는 사항은?
① 개인정보의 수집·이용 목적
② 개인정보 파기 사유
③ 개인정보 수집 항목 및 기간
④ 개인정보 제공을 거부하는 권리
[정답 ②]
18. 상향식 접근 방식으로 문제를 도출하는 프로세스는 무엇인가?
① 프로세스 흐름 분석 → 프로세스 분류 → 분석 요건 정의 → 분석 요건 식별
② 프로세스 흐름 분석 → 프로세스 분류 → 분석 요건 식별 → 분석 요건 정의
③ 프로세스 분류 → 프로세스 흐름 분석 → 분석 요건 정의 → 분석 요건 식별
④ 프로세스 분류 → 프로세스 흐름 분석 → 분석 요건 식별 → 분석 요건 정의
[정답 ④]
19. 정형 데이터 품질 평가 기준으로 누락된 요소가 없도록 확인하는 것은?
① 완전성
② 유일성
③ 일관성
④ 정확성
[정답 ①]
20. 전사적 차원에서 데이터를 관리하는 체계를 의미하는 용어는?
①데이터 거버넌스
② IT 거버넌스
③ 데이터 레이크
④ 데이터 리터러시
[정답 ①]
'자격증( 금융 IT)' 카테고리의 다른 글
[데이터분석기사_Domain3] 시험 대비 기출 공략(2회) (1) | 2023.03.15 |
---|---|
[데이터분석기사_Domain2] 시험 대비 기출 공략(2회) (1) | 2023.03.15 |
[데이터분석기사_Domain4] 시험 대비 기출 공략(3회) (0) | 2023.03.13 |
[데이터분석기사_Domain3] 시험 대비 기출 공략(3회) (0) | 2023.03.13 |
[데이터분석기사_Domain2] 시험 대비 기출 공략(3회) (0) | 2023.03.13 |