본문 바로가기

자격증( 금융 IT)

[데이터분석기사_Domain3] 시험 대비 기출 공략(5회)

[데이터분석기사_Domain3] 빅데이터 모델링 시험 대비 기출 공략(5회)


41. 텍스트를 벡터로 바꾸는 방법으로 옳지 않은 것은?

④  pos tagging

- pos tagging : 품사 태깅은 형태소(의미를 가진 가장 작은 말의 단위)에

 대해 품사를 파악해 부착(tagging)하는 작업을 말한다.

- 텍스트 벡터화: 오토인코더(원핫인코더), 워드임베딩

 

42. 미래를 예측하는 모형으로 옳은 것은?

Predictive Analysis

 

43. 앙상블기법으로 표현할 때 베이스모델들의 독립성을

촉진시키는 방법으로 옳지않은 것은?

② test 데이터셋을 다양하게 한다.

 

- 앙상블 분석(Ensemble)

주어진 자료로부터 여러 개 학습 모형 만든 후 조합 하나의 최종 모형

약학습기(약분류기, Weak Learner): 무작위 선정보다 성공 확률 높은 (오차율 일정 이하(50% 이하)) 학습 규칙

강학습기(강분류기, Strong Learner): 약학습기(Weak Learner)로부터 만들어낸 강력한 학습 규칙

- 앙상블 학습

여러 분석 예측모형 결합 최종 하나의 예측모형 / 여러 모형의 평균 균형적 결과. 변동성 & 과적합

(1) 배깅: 데이터 복원 추출 샘플링, 모델링 후 결과 평균

(2) 부스팅: 순서대로 모델 진행. 이전 분류기의 학습 결과 다음 분류기의 학습 데이터 샘플 가중치 조정하여 학습

(3) 랜덤 포레스트: 배깅 적용 의사결정나무. 학습 데이터셋의 일부 추출하여 학습. 전체 변수의 부분집합 선택

 

44. 변수선택법으로 옳지 않은것은?

② 차수선택법

- 변수선택법: 전진선택법, 후진선택법, 단계적선택법

 

45. 주요인지분석에 대해 옳지 않은것은?

① 인자들같의 상관관계를 표현

② 특정현상에 영향을 미치는 중요한 인자

 

 

46.기온별 변화를 잘 나타낼 수 있는 것은?

② 시계열분석

 

47.모델정의 고려사항 중 틀린 설명은?

② 복잡한 모델이 단순한 모델보다 과적합관련

    옳은 설명을하고 항상 좋다

 

48. 연관규칙의 측정지표로써 A를 샀을 때 A와 항목 B를 동시에 포함하는

거래의 비율을 평가하는 지표는? 

② 신뢰도

 

49. 데드로그램 Y=4 일때 군집의 수?

② 2

 

50. 아래 표의 설명으로 옳은 것은?

  조기암 말기암 전체
생존 사망 생존 사망 생존 사망
A약 18 2 2 8 20 20
B약 7 3 9 21 16 24

① A약 암환자 생존율은 50%, B약 암환자 생존율은 40% (정답)

② 조기암 생존율은 A약보다  B약이 높다.

③ 말기암 생존율은 A약이 B약보다 높다.

A약이 B약보다 효과적이다.

 

56. 자료유형에 따라 사용된 통계분석으 방법으로 적절하지 않은 것은?

① T-검정은 수치형 종속변수와 2개 범주의 독립변수를 사용하여 분석하는 방법이다.

② 로직모형은 범주형 종소견수와 범주형 및 수치형 독립변수를 사용하여 분석하는 방법이다.

③ 카이제곱(X2)검정은 범주형 종속변수와 범주형 독립변수를 사용하여 분석하는 방법이다.

공분산분석(ANOVA)는 종속변수가 범주형, 독립변수가 연속형인 방법이다.

 

57. 순환신경망에서 발생하는 기울기 소실문제와 기울기 폭발문제에 대하여 올바른것은?

② 기울기 소실문제란 역전파 알고리즘으로 가중치를 갱신하면서 학습율이

    급하게 감소하여 학습률이 0에 수렴하는 문제이다.

 

58. 통계기반 분석모형에 대하여 옳은 것은?

③ 현황분석이란 현재의 분석결과를 이용하여 미래를 예측하는데 사용하는 방법이다.

 

59. 회귀분석모델에 대하여 옳은 것은?

② 독립변수가 1개 이상이로, 종속변수와의 관계가 2차 이상일 때 다항회귀모형이라 한다.

 

60. 중간값을 이용한 비모수검정에 대하여 틀린것은?

③ 만-휘트니 U검정이란 월콕슨의 순위합검정과 유사한 모수 양측검정이다.