[데이터분석기사_Domain3] 시험 대비 기출 공략(3회)
[데이터분석기사_Domain3] 빅데이터 모델링 시험 대비 기출 공략(3회)
41. 다음 중 심층신경망에 대한 설명으로 옳지 않은 것은?
① 심층신경망을 학습시킬 때, 모델이 복잡하고 커질수록
오버피팅 될 위험과 학습 시간이느려지는 단점이 있다.
② 공변량 변화(covariate shift)는 공변량(학습 데이터)의
분포가 테스트 데이터의 분포가다른 상황을 의미한다.
③ 심층신경망에서 활성화 함수로 비선형 함수를 사용한다.
④ 심층신경망 학습 시, 각 데이터에서 loss를 계산할 때
클래스가 적은 데이터에 작은 loss를 갖도록 하여 불균형 문제를 해결할 수 있다.
42. 인공신경망의 출력노드에 활성화 함수로 softmax를 적용했을 때,
결과로 적절하지 않은 것은?
① 3개 이상으로 분류하는 다중 클래스 분류에서 사용할 수 있다.
② 모든 노드의 출력값을 더하면 항상 1이다.
③ 출력값의 분산이 1이다.
④ 각 노드의 출력값을 해당 클래스에 속할 확률로 볼 수 있다.
43. 다음 중 분해 시계열의 요인으로 해당하지 않는 것은?
① 정상요인
② 추세요인
③ 계절요인
④ 불규칙요인
44. 중회귀분석을 수행할 때, 다중공선성에 대한 대책으로 적절하지 않은 것은?
① Ridge 회귀분석을 활용한다.
② 모든 변수를 각 변수의 중앙값으로 빼고 회귀분석을 진행한다.
③ 주성분 분석을 통해 설명력이 높은 변수를 선택한다.
④ 상관관계가 높은 독립변수 중 하나 혹은 일부를 제거한다.
45. 목표변수가 이산형일 때, 의사결정나무의 노드 분리 기준으로 사용할 수 없는 기준값은?
① 카이제곱 통계량
② 엔트로피 지수
③ F-통계량
④ 지니지수
46. 딥러닝에서 사용되는 활성화 함수에 대한 설명으로 적절하지 않은 것은?
① 시그모이드 함수를 사용하여 기울기 소실 문제를 줄일 수 있다.
② ReLU는 x<0인 값들에 대해 기울기가 0이기 때문에
뉴런이 죽을 수 있는 단점이 있다.
③ 은닉노드의 활성화함수는 비선형 함수이다.
④ Tanh 함수의 출력 범위는 -1에서 1사이로 나타난다.
47. 분석 모형 구축 시, 데이터 분할에 대한 설명으로 적절하지 않은 것은?
① 학습 데이터와 테스트 데이터는 일부가 일치해도 무방하다.
② 검증 데이터는 구축된 모형의 과대추정 또는 과소추정을 미세 조정하는데 활용한다.
③ 검증 데이터와 테스트 데이터는 같아도 무방하다.
④ 홀드아웃 방법은 데이터를 학습용 데이터, 시험용 데이터 2가지로 분리하여 사용하는 방법이다.
48. ARIMA 모형에 대한 설명으로 적절하지 않은 것은?
① 모수는 AR모형의 Lag를 의미하는 p, MA모형의 Lag를 의미하는 q, 차분 횟수인 d로총 3개이다.
② 과거 데이터가 지니고 있던 추세까지 반영하게 되어 Correlation을 집중적으로 고려한모델이다.
③ 현재값을 과거값과 과거 예측오차를 통해 설명한다.
④ 시계열 데이터의 정상성을 가정한다.
49. 로지스틱 회귀분석에 대한 설명으로 적절하지 않은 것은?
① 모형의 독립변수에는 범주형, 연속형 변수 모두 사용 가능하다.
② 오차항의 등분산성 가정이 만족되어야 한다.
③ 종속변수와 독립변수를 비선형 관계로 가정한다.
④ 독립변수의 개수가 2개 이상이 될 수 있다.
50. 비모수 추론에 대한 설명으로 적절하지 않은 것은?
① 순위척도 데이터에 적용할 수 있다.
② 모집단의 분포에 대한 가정이 필요하지 않다.
③ 비모수 추론에서 사용되는 통계량은 주로 평균을 사용한다.
④ 이상값의 영향을 덜 받는다.
51. 아래의 각 문제에 대한 적합한 분석 모형으로 짝지어진 것은?
A) 산업용 로봇팔의 운동 최적화 문제 B) 강아지 이미지를 입력하면 강아지에 대한 정보를 제공하는 문제 C) 주차장 요금정산을 위한 번호판 인식 시스템을 구성하는 문제 D) 영화 리뷰 글 또는 댓글의 긍/부정를 판단하는 문제 |
① A) 강화학습, B) 순환신경망 + 컨볼루션신경망, C) 컨볼루션신경망, D) 순환신경망
② A) 강화학습, B) 순환신경망, C) 순환신경망 + 컨볼루션신경망, D) 컨볼루션신경망
③ A) 컨볼루션신경망, B) 컨볼루션신경망, C) 강화학습, D) 순환신경망
④ A) 컨볼루션신경망, B) 강화학습, C) 순환신경망, D) 컨볼루션신경망
52. 아래의 거래 전표에서 연관규칙 '(바나나, 포도) → 자몽'의 지지도와 신뢰도를 구하시오.
{바나나, 포도, 자몽} {수박, 레몬} {바나나, 포도, 레몬, 자몽} {딸기, 수박, 포도, 레몬} {딸기, 수박, 레몬, 자몽} {바나나, 포도} |
① 지지도 : 67%, 신뢰도 : 50%
② 지지도 : 33%, 신뢰도: 50%
③ 지지도 : 67%, 신뢰도 : 67%
④ 지지도 : 33%, 신뢰도 : 67%
53. 다음 중 13명을 대상으로 약 복용 전후의 취침 시간을 측정하여
약이 취침시간에 영향을 미치는지를 검정할 때, 사용할 수 있는 비모수 검정법은 무엇인가?
① 윌콕슨 부호순위 검정
② 맨-휘트니 유 검정
③ 프리드만 검정
카이제곱 검정
54. 이전 분류기의 학습 결과를 기반으로 학습 데이터의 샘플 가중치를
조정하여 모델을 구축하는앙상블 방법은 무엇인가?
① 배깅
② 부스팅
③ 랜덤포레스트
④ 스태킹
55. 사회 연결망 분석 중 중심성 분석 방법에 속하지 않는 것은?
① 연결정도 중심성
② 관계 중심성
③ 근접 중심성
④ 아이겐벡터 중심성
56. 다음 중 머신러닝 모델 구축 절차로 적절한 것은?
① 분석 정의 데이터 수집 → 데이터 전처리 및 탐색 → 모델 선정 및 훈련→ 모델 성능 평가 및 적용
② 분석 정의 데이터 수집 → 모델 선정 및 훈련 → 데이터 전처리 및 탐색→ 모델 성능 평가 및 적용
③ 분석 정의 데이터 수집 → 데이터 전처리 및 탐색 → 모델 성능 평가 및 적용→ 모델 선정 및 훈련
④ 분석 정의 데이터 수집 → 모델 선정 및 훈련 → 모델 성능 평가 및 적용 → 데이터 전처리 및 탐색
57. 선형 회귀분석과 로지스틱 회귀분석에 대한 설명으로 적절하지 않은 것은?
① 선형 회귀분석은 종속변수가 연속형이고 로지스틱 회귀분석은
종속변수의 형태가 이산형일때 사용한다.
② 선형 회귀분석에서 최소제곱법을 통한 회귀계수의 추정값은 불편추정량이다.
③ 선형 회귀분석과 로지스틱 회귀분석 모두 오차항의 정규성을 가정한다.
④ 로지스틱 회귀분석의 종속 변수가 베르누이 분포를 따를 때,
회귀계수의 최우추정량은 뉴튼-랩슨 방법으로 구할 수 있다.
58. 서포트 벡터 머신에서 Radial Basis Function 커널 함수에 대한
설명으로 적절하지 않은 것은?
① 2개의 초매개변수가 있다.
② 가우시안 형태를 취하는 커널 함수이다.
③ gamma는 cross-validation으로 결정된다.
④ svm에서 일반적으로 사용되는 커널 함수이다.
59. 아래의 신경망 모형에서 은닉층과 출력층의 활성화함수로
항등함수(절편이 0, 기울기가 1인 선형 함수)를 사용할 때,
(x=1, y=2)의 출력값으로 옳은 것은?
![]() |
① 10 ② 11 ③ 12 ④ 13
60. 아래의 설명하는 (A)는 무엇에 대한 설명인가?
( A)는(은) 시계열의 시차값(lagged values) 사이의 선형관계를 측정한다. |
① 자기상관
② 지수평활
③ 백색잡음
④ 이동평균