본문 바로가기

자격증( 금융 IT)

[데이터분석기사_Domain4] 시험 대비 기출 공략(4회)

[데이터분석기사_Domain4] 빅데이터 결과해석 시험 대비 기출 공략(4회)


61.다음 그래프의 이름으로 적절한 것은?

① 히트맵 ② 트리맵 ③ 영역차트 ④ 누적영역차트

정답 ①

 

62. 홀드아웃으로 나눌 수 있는 데이터가 아닌 것은? ① 테스트 데이터 ② 검증데이터 ③ 학습데이터 ④ 오그먼트 데이터 정답 ④

 

63. 비교 그래프가 아닌 것은? ① 막대그래프 ② 레이더차트 ③ 히트맵 ④ 산점도 정답 ④ 비교 시각화 기술 여러 변수의 데이터 값들을 비교하는 방법으로 히트맵, 체르노프 페이스, 스타 차 트, 평행 좌표 그래프 등이 사용됨

 

64.다음 ( )에 알맞은 것은? 집락추출는 표집된 군집들은 가능한 군집간에는 ( A )이고, 군집 속에 포함된 표본요소 간에는 ( B )이어야 한다. ① A-동질적, B-동질적 ② A-동질적, B-이질적 ③ A-이질적, B-동질적 ④ A-이질적, B-이질적 정답 ② 집락추출은 이질적인 여러 개의 집락 또는 집단으로 구분한 후 집락을 표집단위로 무작위로 추출한 다음에 표본으로 추출된 집락에 대해 그 구성요소를 전수조사하는 방법이다. 집락 내에는 이질적으로 집락 간 동질적인 특성을 보인다. 층화표본추출 은 집단 내 동질적이고 집단 간 이질적인 특성을 보인다.

 

65. 회귀모델 평가지표에 해당하지 않는 것은? ① RMSE ② ROC ③ MAPE ④ MAE 정답 ② 66. 다음 아래 보기에서 설명하는 혼동행렬의 평가지표는? Ÿ 두 관찰자가 측정한 범주 값에 대한 일치도를 측정하는 방법 Ÿ 0 ~ 1사이의 값을 가지며 1에 가까울수록 모델의 예측값과 실제값이 일치 ① Kappa Statistic ② Accuracy ③ Sensitivity ④ Specificity 정답 ①

 

67. ROC Curve(Receiver Operating Characteristic Curve)에 대한 설명 중 틀린 것은? ① FPR과 TPR을 각각 x, y축으로 놓은 그래프 ② ROC curve는 x, y가 둘다 [0,1]의 범위이고, (0,0)에서 (1,1)을 잇는 곡선이다. ③ AUC = 1.0은 민감도가 1이고 가양성률이 0이므로 완벽한 검사(perfect test) 를 의미한다. ④ AUC = 0.5란 의미는 평균적인 분류모형 성능을 의미한다. 정답 ④

 

68. 인공지능 학습시 과대적합을 방지하기위한 학습과정에서 신경망 일부를 사용하 지 않는 학습 기법은? ① Dropout ② 매개 변수 최적화 ③ SGD ④ 가중치 규제 정답 ①

 

69. 분석모형 융합방법 중 여러개의 분석모형의 결과를 종합하여 많이 선택된 클래 스를 최종결과로 예측하는 방법을 무엇이라 하는가? ① Hard Voting ② Bagging ③ Boosting ④ Random Forest 정답 ①

 

70. 다음 중 부스팅에 대한 설명으로 옳지 않은 것은?

① 부스팅은 머신러닝 앙상블 기법 중 하나로

약한 학습기(Weak Learner)들을 순 차적으로

여러개를 결합하여 예측 혹은 분류 성능을 높이는 알고리즘이다

② 부스팅 알고리즘에는 AdaBoost, GBM(Gradient Boosting Machine),

XGBoost, LightBoost 등이 있다.

③ 매 학습마다 데이터에 가중치를 업데이트하는 과정이 필요하다.

④ 분류가 잘 된 데이터에 가중치를 부여하는 방식이다.

 

정답 ④ 부스팅 알고리즘은 여러 개의 약한 학습기(Weak Learner)를

순차적으로 학습-예 측하면서 잘못 예측한 데이터에

가중치를 부여해 오류를 개선해나가며 학습하는 방식이다

 

71.두 변수 사이의 상관관계를 알아보기 위한

시각화 도구로 적합하지 않은 것은?

① 산점도 ② 히트맵 ③ 트리맵 ④ 버블차트

 

정답 ③ 트리맵은 변수 값의 분포를 표현하는데 적합하다.

 

72.다음 중 비교시각화 방법이 아닌 것은?

① 히트맵 ② 스타차트 ③ 평행좌표계 ④ 트리맵

 

정답 ④

 

73. 일명 방사형 차트라고 하며, 중앙에서 외부링까지 이어지는

몇 개의 축을 그리 고, 전체 공간에서 하나의 변수마다

중앙으로부터 거리로 수치를 나타내는 시각화 도구는?

① 체르노프 페이스 ② 스타차트 ③ 산점도행렬 ④ 평행좌표계

정답 ②

 

74. 다음 중 인포그래픽에 대한 설명으로 옳지 않은 것은?

① 인포그래픽은 양적 정보디자인에 초점을 두고 있다.

② 인포그래픽이란 정보와 그래픽의 합성어이다.

③ 단순한 정보를 그래프화하여 나열하는 것이 아니라

수집한 정보를 분석하고 가 공하여 스토리텔링과

디자인을 더한 데이터라고 할 수 있다.

④ 설득형 메시지를 담을 수 있다.

 

정답 ① 인포그래픽은 양적 정보디자인에 초점을 맞추기보다는

다양한 정보를 종합해 정보 디자인의도에 따라 그래픽으로 전달하려는 경향이 강하다

 

75. 다음 중 데이터의 각 변수를 눈, 코, 입 등의 모양과 크기로 표현하는

비교시각 화 방법을 무엇이라 하는가?

① Catogram ② Treemap ③ Heatmap ④ Chernoff Face

정답 ④

 

76. 분석모형 모니터링의 대상이 아닌 것은?

① 분석모델관리

② 모델 성능 모니터링

③ 정기 또는 비정기적 학습 관리

④ 업무프로세스 변경

 

정답 ④ 보기 ④는 분석모형 리모델링 영역이다.

 

77. 분석모형 리모델링이 필요한 시점을 적절하지 않은 것은?

① 고객에게 적용하는 경우 고객의 행동패턴이 변화할 때

② 서비스 품목이 추가되어 주제 영역 도출이 필요한 경우

③ 법규 및 제도의 변동으로 데이터 전처리 규칙이 변경된 경우

④ 일, 주 단위 리모델링 등으로 주기적 리모델링을 실시한다

 

정답 ④ 주기적 리모델링은 분기, 반기, 연 단위로 수행한다. 일, 주단위 리모델링은 특수분 야를 제외하고 바람직하지 않다.

 

 

78.시각화의 종류와 방법이 잘못 연결된 것은?

① 시간시각화-막대그래프

② 공간시간화-등치선도

③ 분포시각화-도넛차트

④ 비교시각화-산점도행렬

정답 ④ 산점도행렬은 대표적 관계시각화 도구이다

 

79. 다음 중 정보 시각화 방법과 시각화 도구의 연결이 잘못된 것은?

① 시간시각화:막대그래프, 누적 막대그래프, 점그래프, 히스토그램

② 분포시각화:파이차트, 도넛차트, 트리맵

③ 관계시각화:스캐터 플롯, 버블차트

④ 비교시각화:히트맵, 체르노프 페이스, 스타차드, 평행좌표계, 다차원척도법

정답 ① 히스토그램은 관계시각화 도구이다.

 

80. 다음중 빅데이터 시각화 단계를 가장 바르게 나열한 것은?

① 정보시각화→정보구조화→정보시각표현

② 정보구조화→정보시각화→정보시각표현

③ 정보시각표현→정보시각화→정보구조화

④ 정보시각화→정보시각표현→정보구조화

정답 ②