[데이터분석기사_Domain4] 시험 대비 기출 공략(3회)
[데이터분석기사_Domain4] 빅데이터 결과해석 시험 대비 기출 공략(3회)
61. 다음 중 경사하강법이 아닌 것은?
① AdaGrad
② Adam
③ OPTICS
④ zomentum
[정답 ③ ]
62. 다음 중 분류 모형의 성능평가 지표로 적절하지 않은 것은?
① 정분류율
② 민감도
③ 평균오차제곱합
④ 특이도
[정답 ③ ]
63. 신경망의 과적합을 방지하는 방법이 아닌 것은?
① 데이터의 양을 늘린다.
② 은닉층의 수를 줄인다.
③ 매개변수의 수를 늘린다.
④ L1규제, L2규제와 같은 가중치 규제를 적용한다.
[정답 ③ ]
64. 아래에서 설명하는 시각화 분석으로 적절한 것은?
-다변량 데이터에 대해 변수들 사이의 연관성 및 패턴을 표현한다. -버블차트, 밀도차트 등을 활용한다. |
① 비교 시각화
② 분포 시각화
③ 시간 시각화
④ 관계 시각화
[정답 ④ ]
65. 특정 지역의 데이터 값을 표현하기 위해 지리적 형상 크기를 조절하여 지도의 면적이 왜곡하는 시각화 방법은 무엇인가?
① 히트맵
② 도트플롯
③ 등치선도
④ 카토그램
[정답 ④ ]
66. 완성된 회귀모형에 사용된 데이터의 설명과 모형의 해석을 할 때, 관련이 없는 것은?
① 결정계수
② t-통계량
③ 잔차 분석
④ Intercept의 추정값
[정답 ④ ]
67. 아래는 단순회귀분석을 수행한 결과 중 분산분석표이다.
설명으로 적절하지 않은 것은?
요인 | 제곱합 | 자유도 | 평균제곱 | F |
희귀 | 7.11 | (가) | (나) | (다) |
잔차 | 1.74 | 8 | 0.2175 | |
계 | 8.85 | (라) |
① (다)의 값으로 p-value를 확인할 수 있다.
② 결정계수는 7.11/8.85로 계산된다.
③ (나)는 표본분포에서의 표본분산과 비슷한 역할을 한다.
④ 총 관측치의 개수는 (라)이다.
[정답 ④ ]
68. 아래의 표는 1,000명을 무작위로 추출하여 성별과
심장병과의 관계를 연구를 위한 조사 결과이다.
카이제곱 통계량을 적절하게 계산한 것은 무엇인가?
심장병 증상이 나타남 | 심장병 증상이 나타나지 않음 | 계 | |
여성 | 200 | 350 | 550 |
남성 | 400 | 50 | 450 |
계 | 600 | 400 | 1000 |
[정답 ① ]
69. 아래에서 설명하는 방법은 무엇인가?
주어진 원천 데이터를 랜덤하게 두 분류로 분리하여 교차검정을 실시하는 방법이다. 하나는 모형의학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 테스트 데이터로 사용한다. |
① LOOCV
② 홀드아웃
③ k-fold validation
④ 붓스트랩
[정답 ② ]
70. 시각화 도구 중 시각화 플랫폼으로 적절하지 않은 것은?
① Power Pivot
② Tableau
③ Gephi
④ D3.js
[정답 ④ ]
71. 아래의 오분류표에서 정밀도(precision)과 재현율(recall)을 구하라.
예측 | 합 계 | |||
0 | 1 | |||
실제 | 0 | 45 | 5 | 50 |
1 | 15 | 35 | 50 | |
합계 | 60 | 40 | 100 |
① 정밀도 : 3/5, 재현율 : 3/7
② 정밀도 : 3/7, 재현율 : 3/5
③ 정밀도 : 3/5, 재현율 : 3/5
④ 정밀도 : 3/7, 재현율 : 3/7
[정답 ① ]
72. 다음 중 매개변수와 초매개변수에 대한 설명으로 적절하지 않은 것은?
① 매개변수는 모형을 구축할 때 임의로 조정이 가능한 변수이다.
② Learning Rate는 초매개변수이다.
③ 매개변수는 학습된 모델의 일부로 저장된다.
④ 매개변수는 데이터로부터 추정되거나 산출된다.
[정답 ① ]
73. 오분류표에서 실제값이 Negative인 관측치 중에 예측값을 Negative로
판단한 것을 무엇이라고 하는가?
① 정밀도 ② 지지도 ③ 민감도 ④ 특이도
[정답 ④ ]
74. 아래의 ROC Curve에 대한 설명으로 부적절한 것은?
① AUROC(Area Under ROC)는 곡선의 아래 면적을 의미한다.
② ROC Curve는 분류분석 성능을 평가하기 위한 그림이다.
③ 그래프의 중간선을 유지할 때, 가장 우수한 모형이다.
④ ROC 곡선이 크게 나타날수록 성능이 좋은 모형이라고 할 수 있다.
[정답 ③ ]
75. 다음은 1973년 미국 50개 주의 100,000명의 인구당 체포된 강력범죄수와
각 주마다 도시에거주하는 인구의 비율을 통해 주성분분석을 한 결과이다.
제 2 주성분까지 변수로 선택 시 전체데이터의 몇 %를 설명할 수 있을까?
> Us.prin<-princomp(USArrests,cor=TRUE) > summary(Us.prin) Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Standard deviation 1.5748783 0.9948694 0.5971291 0.41644938 Proportion of Variance 0.6200604 0.2474413 0.0891408 0.04335752 Cumulative Proportion 0.6200604 0.8675017 0.9566425 1.00000000 |
① 99.4% ② 86,8% ③ 62.0% ④ 24.7%
[정답 ② ]
76. 관계시각화에 대한 설명으로 적절한 것은?
① 지도를 통해 시점에 따른 경향, 차이 등을 확인할 수 있는 시각화 방법이다.
② 전체에서 부분 간 관계를 설명하는 시각화 방법이다.
③ 집단 간 상관관계를 확인하여 다른 수치의 변화 예측에 사용되는 시각화 방법이다.
④ 장기간에 걸쳐 나타나는 값의 변화나 경향을 추적하는데 사용한다.
[정답 ③ ]
77. 평균 절대 백분율 오차(MAPE)의 수식으로 적절한 것은?
[정답 ③ ]
78. 다음 중 빅데이터 분석 결과에 기반한 비즈니스 운영의
목적 설정과 관련이 없는 내용은 무엇인가?
① 고객에게 새로운 상품 추천
② 소요시간 단축
③ 제조공정에서의 불량품 발생 예측
④ 재택근무 직원의 감소
[정답 ④ ]
79.아래의 그림처럼 나타나는 분포에서 왜도의 부호와 평균,
중앙값, 최빈값 비교 결과로 적절한 것은?
① 왜도<0, 최빈값<중앙값<평균
② 왜도<0, 평균<중앙값<최빈값
③ 왜도>0, 평균 <중앙값<최빈값
④ 왜도>0, 최빈값<중앙값<평균
[정답 ④ ]
80. 모형 개발에 있어 예측값이 범주형일 때,
모니터링 평가 지표로 적절하지 않은 것은?
① F1-score
② Recall
③ Accuracy
④ RMSE
[정답 ④ ]