자격증( 금융 IT)

[데이터분석기사_Domain4] 시험 대비 기출 공략(3회)

웅키리루 2023. 3. 13. 19:55

[데이터분석기사_Domain4] 빅데이터 결과해석 시험 대비 기출 공략(3회)


61. 다음 중 경사하강법이 아닌 것은?
① AdaGrad
② Adam
③ OPTICS
④ zomentum

 

[정답 ③ ]

 

 

62. 다음 중 분류 모형의 성능평가 지표로 적절하지 않은 것은?
① 정분류율
② 민감도
③ 평균오차제곱합
④ 특이도

 

[정답 ③ ]

 


63. 신경망의 과적합을 방지하는 방법이 아닌 것은?
① 데이터의 양을 늘린다.
② 은닉층의 수를 줄인다.
③ 매개변수의 수를 늘린다.
④ L1규제, L2규제와 같은 가중치 규제를 적용한다.

[정답 ③ ]

 

 


64. 아래에서 설명하는 시각화 분석으로 적절한 것은?

-다변량 데이터에 대해 변수들 사이의 연관성 및 패턴을 표현한다. 
-버블차트, 밀도차트 등을 활용한다.

① 비교 시각화
② 분포 시각화
③ 시간 시각화
④ 관계 시각화

[정답 ④ ]

 


65. 특정 지역의 데이터 값을 표현하기 위해 지리적 형상 크기를 조절하여 지도의 면적이 왜곡하는 시각화 방법은 무엇인가?
① 히트맵
② 도트플롯
③ 등치선도
④ 카토그램

[정답 ④ ]

 

 

66. 완성된 회귀모형에 사용된 데이터의 설명과 모형의 해석을 할 때, 관련이 없는 것은?
① 결정계수 
② t-통계량
③ 잔차 분석
④ Intercept의 추정값

[정답 ④ ]

 


67. 아래는 단순회귀분석을 수행한 결과 중 분산분석표이다. 
설명으로 적절하지 않은 것은?

요인 제곱합 자유도 평균제곱 F
희귀 7.11 (가) (나) (다)
잔차 1.74 8 0.2175  
8.85 (라)    

① (다)의 값으로 p-value를 확인할 수 있다.
② 결정계수는 7.11/8.85로 계산된다. 
③ (나)는 표본분포에서의 표본분산과 비슷한 역할을 한다. 
④ 총 관측치의 개수는 (라)이다.

[정답 ④ ]

 


68. 아래의 표는 1,000명을 무작위로 추출하여 성별과 
심장병과의 관계를 연구를 위한 조사 결과이다.
카이제곱 통계량을 적절하게 계산한 것은 무엇인가?

  심장병 증상이 나타남 심장병 증상이 나타나지 않음
여성 200 350 550
남성 400 50 450
600 400 1000


[정답 ① ]

 

 

 

69. 아래에서 설명하는 방법은 무엇인가?

주어진 원천 데이터를 랜덤하게 두 분류로 분리하여 교차검정을 실시하는 방법이다. 하나는 모형의학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 테스트 데이터로 사용한다.

① LOOCV 
② 홀드아웃 
③ k-fold validation 
④ 붓스트랩

[정답 ② ]

 


70. 시각화 도구 중 시각화 플랫폼으로 적절하지 않은 것은?

① Power Pivot
② Tableau 
③ Gephi 
④ D3.js

 

[정답 ④ ]

 

 

71. 아래의 오분류표에서 정밀도(precision)과 재현율(recall)을 구하라.

  예측 합 계
0 1
실제 0 45 5 50
1 15 35 50
합계 60 40 100

① 정밀도 : 3/5, 재현율 : 3/7
② 정밀도 : 3/7, 재현율 : 3/5
③ 정밀도 : 3/5, 재현율 : 3/5
④ 정밀도 : 3/7, 재현율 : 3/7

[정답 ① ]

 


72. 다음 중 매개변수와 초매개변수에 대한 설명으로 적절하지 않은 것은?
① 매개변수는 모형을 구축할 때 임의로 조정이 가능한 변수이다.
② Learning Rate는 초매개변수이다.
③ 매개변수는 학습된 모델의 일부로 저장된다.
④ 매개변수는 데이터로부터 추정되거나 산출된다.

[정답 ① ]

 


73. 오분류표에서 실제값이 Negative인 관측치 중에 예측값을  Negative로 

판단한 것을 무엇이라고 하는가?
① 정밀도    ② 지지도   ③ 민감도   ④ 특이도

[정답 ④ ]

 

 


74. 아래의 ROC Curve에 대한 설명으로 부적절한 것은?

① AUROC(Area Under ROC)는 곡선의 아래 면적을 의미한다.
② ROC Curve는 분류분석 성능을 평가하기 위한 그림이다.
③ 그래프의 중간선을 유지할 때, 가장 우수한 모형이다.
④ ROC 곡선이 크게 나타날수록 성능이 좋은 모형이라고 할 수 있다.

[정답 ③ ]

 


75. 다음은 1973년 미국 50개 주의 100,000명의 인구당 체포된  강력범죄수와 

각 주마다 도시에거주하는 인구의 비율을 통해 주성분분석을 한 결과이다. 
 제 2 주성분까지 변수로 선택 시 전체데이터의 몇 %를 설명할 수 있을까?

> Us.prin<-princomp(USArrests,cor=TRUE) 
> summary(Us.prin) 

Importance of components: 
                                            Comp.1       Comp.2      Comp.3        Comp.4
Standard deviation         1.5748783   0.9948694  0.5971291  0.41644938
Proportion of Variance    0.6200604  0.2474413  0.0891408  0.04335752
Cumulative Proportion    0.6200604  0.8675017  0.9566425  1.00000000

① 99.4%      ② 86,8%        ③ 62.0%       ④ 24.7%

[정답 ② ]

 


76. 관계시각화에 대한 설명으로 적절한 것은?
① 지도를 통해 시점에 따른 경향, 차이 등을 확인할 수 있는 시각화 방법이다.
② 전체에서 부분 간 관계를 설명하는 시각화 방법이다. 
③ 집단 간 상관관계를 확인하여 다른 수치의 변화 예측에 사용되는 시각화 방법이다.
④ 장기간에 걸쳐 나타나는 값의 변화나 경향을 추적하는데 사용한다.

[정답 ③ ]

 


77. 평균 절대 백분율 오차(MAPE)의 수식으로 적절한 것은?

 

[정답 ③ ]

 

 

78. 다음 중 빅데이터 분석 결과에 기반한 비즈니스 운영의 

목적 설정과 관련이 없는 내용은 무엇인가?
① 고객에게 새로운 상품 추천
② 소요시간 단축
③ 제조공정에서의 불량품 발생 예측
④ 재택근무 직원의 감소

[정답 ④ ]

 

 

79.아래의 그림처럼 나타나는 분포에서 왜도의 부호와 평균, 

중앙값, 최빈값 비교 결과로 적절한 것은?

① 왜도<0, 최빈값<중앙값<평균
② 왜도<0, 평균<중앙값<최빈값
③ 왜도>0, 평균 <중앙값<최빈값
④ 왜도>0, 최빈값<중앙값<평균

[정답 ④ ]

 

 

80. 모형 개발에 있어 예측값이 범주형일 때, 

모니터링 평가 지표로 적절하지 않은 것은?
① F1-score 
② Recall 
③ Accuracy 
④ RMSE

 

[정답 ④ ]