[데이터분석기사_Domain4] 빅데이터 결과해석 시험 대비 기출 공략(4회)
61.다음 그래프의 이름으로 적절한 것은?
① 히트맵 ② 트리맵 ③ 영역차트 ④ 누적영역차트
정답 ①
62. 홀드아웃으로 나눌 수 있는 데이터가 아닌 것은? ① 테스트 데이터 ② 검증데이터 ③ 학습데이터 ④ 오그먼트 데이터 정답 ④
63. 비교 그래프가 아닌 것은? ① 막대그래프 ② 레이더차트 ③ 히트맵 ④ 산점도 정답 ④ 비교 시각화 기술 여러 변수의 데이터 값들을 비교하는 방법으로 히트맵, 체르노프 페이스, 스타 차 트, 평행 좌표 그래프 등이 사용됨
64.다음 ( )에 알맞은 것은? 집락추출는 표집된 군집들은 가능한 군집간에는 ( A )이고, 군집 속에 포함된 표본요소 간에는 ( B )이어야 한다. ① A-동질적, B-동질적 ② A-동질적, B-이질적 ③ A-이질적, B-동질적 ④ A-이질적, B-이질적 정답 ② 집락추출은 이질적인 여러 개의 집락 또는 집단으로 구분한 후 집락을 표집단위로 무작위로 추출한 다음에 표본으로 추출된 집락에 대해 그 구성요소를 전수조사하는 방법이다. 집락 내에는 이질적으로 집락 간 동질적인 특성을 보인다. 층화표본추출 은 집단 내 동질적이고 집단 간 이질적인 특성을 보인다.
65. 회귀모델 평가지표에 해당하지 않는 것은? ① RMSE ② ROC ③ MAPE ④ MAE 정답 ② 66. 다음 아래 보기에서 설명하는 혼동행렬의 평가지표는? Ÿ 두 관찰자가 측정한 범주 값에 대한 일치도를 측정하는 방법 Ÿ 0 ~ 1사이의 값을 가지며 1에 가까울수록 모델의 예측값과 실제값이 일치 ① Kappa Statistic ② Accuracy ③ Sensitivity ④ Specificity 정답 ①
67. ROC Curve(Receiver Operating Characteristic Curve)에 대한 설명 중 틀린 것은? ① FPR과 TPR을 각각 x, y축으로 놓은 그래프 ② ROC curve는 x, y가 둘다 [0,1]의 범위이고, (0,0)에서 (1,1)을 잇는 곡선이다. ③ AUC = 1.0은 민감도가 1이고 가양성률이 0이므로 완벽한 검사(perfect test) 를 의미한다. ④ AUC = 0.5란 의미는 평균적인 분류모형 성능을 의미한다. 정답 ④
68. 인공지능 학습시 과대적합을 방지하기위한 학습과정에서 신경망 일부를 사용하 지 않는 학습 기법은? ① Dropout ② 매개 변수 최적화 ③ SGD ④ 가중치 규제 정답 ①
69. 분석모형 융합방법 중 여러개의 분석모형의 결과를 종합하여 많이 선택된 클래 스를 최종결과로 예측하는 방법을 무엇이라 하는가? ① Hard Voting ② Bagging ③ Boosting ④ Random Forest 정답 ①
70. 다음 중 부스팅에 대한 설명으로 옳지 않은 것은?
① 부스팅은 머신러닝 앙상블 기법 중 하나로
약한 학습기(Weak Learner)들을 순 차적으로
여러개를 결합하여 예측 혹은 분류 성능을 높이는 알고리즘이다
② 부스팅 알고리즘에는 AdaBoost, GBM(Gradient Boosting Machine),
XGBoost, LightBoost 등이 있다.
③ 매 학습마다 데이터에 가중치를 업데이트하는 과정이 필요하다.
④ 분류가 잘 된 데이터에 가중치를 부여하는 방식이다.
정답 ④ 부스팅 알고리즘은 여러 개의 약한 학습기(Weak Learner)를
순차적으로 학습-예 측하면서 잘못 예측한 데이터에
가중치를 부여해 오류를 개선해나가며 학습하는 방식이다
71.두 변수 사이의 상관관계를 알아보기 위한
시각화 도구로 적합하지 않은 것은?
① 산점도 ② 히트맵 ③ 트리맵 ④ 버블차트
정답 ③ 트리맵은 변수 값의 분포를 표현하는데 적합하다.
72.다음 중 비교시각화 방법이 아닌 것은?
① 히트맵 ② 스타차트 ③ 평행좌표계 ④ 트리맵
정답 ④
73. 일명 방사형 차트라고 하며, 중앙에서 외부링까지 이어지는
몇 개의 축을 그리 고, 전체 공간에서 하나의 변수마다
중앙으로부터 거리로 수치를 나타내는 시각화 도구는?
① 체르노프 페이스 ② 스타차트 ③ 산점도행렬 ④ 평행좌표계
정답 ②
74. 다음 중 인포그래픽에 대한 설명으로 옳지 않은 것은?
① 인포그래픽은 양적 정보디자인에 초점을 두고 있다.
② 인포그래픽이란 정보와 그래픽의 합성어이다.
③ 단순한 정보를 그래프화하여 나열하는 것이 아니라
수집한 정보를 분석하고 가 공하여 스토리텔링과
디자인을 더한 데이터라고 할 수 있다.
④ 설득형 메시지를 담을 수 있다.
정답 ① 인포그래픽은 양적 정보디자인에 초점을 맞추기보다는
다양한 정보를 종합해 정보 디자인의도에 따라 그래픽으로 전달하려는 경향이 강하다
75. 다음 중 데이터의 각 변수를 눈, 코, 입 등의 모양과 크기로 표현하는
비교시각 화 방법을 무엇이라 하는가?
① Catogram ② Treemap ③ Heatmap ④ Chernoff Face
정답 ④
76. 분석모형 모니터링의 대상이 아닌 것은?
① 분석모델관리
② 모델 성능 모니터링
③ 정기 또는 비정기적 학습 관리
④ 업무프로세스 변경
정답 ④ 보기 ④는 분석모형 리모델링 영역이다.
77. 분석모형 리모델링이 필요한 시점을 적절하지 않은 것은?
① 고객에게 적용하는 경우 고객의 행동패턴이 변화할 때
② 서비스 품목이 추가되어 주제 영역 도출이 필요한 경우
③ 법규 및 제도의 변동으로 데이터 전처리 규칙이 변경된 경우
④ 일, 주 단위 리모델링 등으로 주기적 리모델링을 실시한다
정답 ④ 주기적 리모델링은 분기, 반기, 연 단위로 수행한다. 일, 주단위 리모델링은 특수분 야를 제외하고 바람직하지 않다.
78.시각화의 종류와 방법이 잘못 연결된 것은?
① 시간시각화-막대그래프
② 공간시간화-등치선도
③ 분포시각화-도넛차트
④ 비교시각화-산점도행렬
정답 ④ 산점도행렬은 대표적 관계시각화 도구이다
79. 다음 중 정보 시각화 방법과 시각화 도구의 연결이 잘못된 것은?
① 시간시각화:막대그래프, 누적 막대그래프, 점그래프, 히스토그램
② 분포시각화:파이차트, 도넛차트, 트리맵
③ 관계시각화:스캐터 플롯, 버블차트
④ 비교시각화:히트맵, 체르노프 페이스, 스타차드, 평행좌표계, 다차원척도법
정답 ① 히스토그램은 관계시각화 도구이다.
80. 다음중 빅데이터 시각화 단계를 가장 바르게 나열한 것은?
① 정보시각화→정보구조화→정보시각표현
② 정보구조화→정보시각화→정보시각표현
③ 정보시각표현→정보시각화→정보구조화
④ 정보시각화→정보시각표현→정보구조화
정답 ②
'자격증( 금융 IT)' 카테고리의 다른 글
[데이터분석기사_Domain3] 시험 대비 기출 공략(3회) (0) | 2023.03.13 |
---|---|
[데이터분석기사_Domain2] 시험 대비 기출 공략(3회) (0) | 2023.03.13 |
[데이터분석기사_Domain3] 시험 대비 기출 공략(4회) (1) | 2023.03.13 |
[데이터분석기사_Domain2] 시험 대비 기출 공략(4회) (2) | 2023.03.13 |
[데이터분석기사_Domain1] 시험 대비 기출 공략(4회) (0) | 2023.03.13 |