자격증( 금융 IT)

[데이터분석기사_Domain1] 시험 대비 기출 공략(4회)

웅키리루 2023. 3. 13. 16:05

[데이터분석기사_Domain1] 시험 대비 기출 공략(4회)


1. HDFS에 대한 설명으로 옳은 것은?

① 복제의 횟수는 내부에서 결정된다.

② ETL, NTFA가 상위 프로그램이다.

③ GFS과 동일한 함수를 적용한다.

④ 네임노드는 삭제데이터 저장공간에 네임노드에 데이터를 같이 저장한다.

정답 ③

 

2. 인공지능학습에 대한 설명으로 옳지 않은 것은?

① 강인공지능은 범용으로 사용되기는 시기상조이다.

② 약인공지능은 제한된 기능을 뛰어넘어 발달된 인공지능이다.

③ 강인공지능이라고 불릴 만한 수준의 인공지능은 지금도 개발되지 않았다.

④ 훌륭한 알고리즘을 보유하였다면 학습을 생략해도 된다.

정답 ④

 

3. 분산파일 시스템에 대한 설명으로 옳지 않는 것은?

① 데이터베이스를 분산 저장한다.

② x86 서버의 CPU,RAM 등을 사용하므로 장비 증가에 따른 성능향상이 용이하 다.

③ 여러 컴퓨터를 하나의 서버 환경에 저장한다.

④ 네트워크를 통한 여러 파일을 관리 및 저장하는 개념이다.

정답 ③

분산 파일 시스템, 네트워크 파일 시스템은 컴퓨터 네트워크를 통해 공유하는 여러 호스트 컴퓨터의 파일에 접근할 수 있게 하는 파일 시스템이다.

 

4. 분석로드맵 설정 시 우선순위 고려해야할 사항 아닌 것은?

① 비즈니스 성과 및 ROI

② 시급성

③ 분석데이터 적용

④ 전략적 중요도

정답 ③ 분석데이터 적용 수준은 적용 우선순위 설정 고려요소이다.

 

5. 가트너가 정의한 빅데이터 처리 플랫폼 특징 중 3V에 속하지 않는 것은?

① Volume ② Velocity ③ Variety ④ Value

정답 ④

 

6. 빅데이터 분석기획 절차는?

① 프로젝트정의 -> 범위설정 -> 위험계획수립 -> 수행계획수립

② 프로젝트정의 -> 범위설정 -> 수행계획수립 -> 위험계획수립

③ 범위설정 -> 프로젝트정의 -> 수행계획수립 -> 위험계획수립

④ 범위설정 -> 프로젝트정의 -> 위험계획수립 -> 수행계획수립

정답 ③ 빅데이터 분석기획(Planning) 단계(Phase)의 태스크(Tasks)에 관한 문제이다.

 

7. 개인정보 비식별화 기술에 대한 설명 중 가장 적절하지 않은 것은?

① 총계처리 : 데이터의 총합 값으로 처리하여 개인 데이터의 값을 보이지 않도록 하는 기술

② 데이터 마스킹 : 개인 식별에 중요한 데이터 값을 삭제하는 기술

③ 가명처리 : 개인 식별에 중요한 데이터를 식별할 수 없는 다른 값으로 변경하는 기술

④ 범주화 : 데이터의 값을 범주의 값으로 변환하여 값을 변경하는 기술

정답 ② 데이터 값 삭제의 정의이다.

 

8. 개인정보 비동의시에도 사용 가능한 경우가 아닌 것은?

① 법령상 의무를 준수하기 위하여 불가피한 경우

② 계약의 체결 및 이행을 위하여 불가피하게 필요한 경우

③ 정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위하여 필요하다고 인 정되는 경우

④ 개인 편의 제공 시 합당한 이유가 있으면 가능하다.

정답 ④

 

9. 분석 시나리오를 작성을 해야 하는 이유로 가장 적절하지 않는 것은?

① 이해관계자 도출

② 업무 성과 판단

③ 최신 업무 형태 반영

④ 분석 목표 도출

정답 ③

 

10. 1제타바이트에 1byte의 아스키 코드를 넣으면 얼만큼 넣을 수 있는가?

① 2의 10승 ② 2의 30승 ③ 2의 50승 ④ 2의 70승

답 ④

킬로바이트:2의 10승

메가바이트:2의 20승

기가바이트:2의 30승

테라바이트:2의 40승

페타바이트:2의 50승

엑사바이트:2의 60승

제타바이트:2의 70승

요타바이트:2의 80승

 

11. 다음 중 인메모리 기반의 데이터 처리와 연관된 오픈소스 프로젝트는?

① 맵리듀스 ② 스파크 ③ 하이브 ④ 피그

정답 ②

 

12. 다음 중 데이터분석 모델링과 관련하여 수행하는 업무가 아닌 것은?

① 데이터 분할

② 데이터 모델링

③ 프로젝트 성과 분석 및 평가 보고

④ 모델 적용 및 운영방안

정답 ③ 프로젝트 성과 분석 및 평가보고는 평가 및 전개의 태스크 구성이다.

 

13. 다음 중 정형데이터와 비정형데이터와 관련된 것 중 옳은 것은?

① 동영상, 오디오 데이터는 정형 데이터에 속한다.

② 정형 데이터는 지정된 행과 열에 의해 데이터의 속성이 구별되는 스프레드시트 형태의 데이터이다.

③ 형태소는 정형데이터를 분석하기 위한 단위이다.

④ 비정형데이터는 잠재적 가치가 가장 낮다.

정답 ②

 

14. 다음 중 고품질데이터의 특성이 아닌 것은?

① 정확성(Accuracy)

② 적시성(Timeliness)

③ 불편의성(Uncompleteness)

④ 일관성(Consistency)

정답 ③ 데이터의 품질지표는 준비성, 완전성, 일관성, 정확성, 적시성, 보완성, 유용성

 

15. 다음 중 시스템의 전방에 위치하여 클라이언트로부터 다양한 서비스를 처리하고,

내부 시스템으로 전달하는 미들웨어는?

① API 게이트웨이

② 데이터베이스

③ PaaS

④ ESB(Enterprise Service Bus)

정답 ① 사용자는 메인 페이지를 보기 위해서 하나의 URL을 통해 서버에 요청을 보내지만

실제 사용자가 보게 되는 화면에는 다양한 종류의 서비스 결과가 있다.

 

16. 데이터 3법에 포함되는 것이 아닌 것은?

① 개인정보보호법

② 정보통신산업 진흥법

③ 정보통신망 이용촉진 및 정보보호 등에 관한 법률

④ 신용정보의 이용 및 보호에 관한 법률

정답 ②

 

17. 공공데이터에서 제공하는 파일의 형식이 아닌 것은?

① xml

② sql

③ json

④ csv

정답 ②

 

18. 데이터 저장소가 아닌 것은?

① Data Lake

② Data Warehouse

③ Data Mining

④ Data Dam

정답 ③

 

19. 데이터에 노이즈를 추가해 개인정보와 데이터분석을 모두 진행할 수 있는 방법 은?

① K-익명성

② 차등보호법

③ 가명화

④ L다양성

정답 ② 해설 개인정보 차등보호(업계 표준 용어)란

데이터에 수학적인 노이즈를 추가하는 기술을 말합니다.

 

20. 빅데이터 분산 저장기술 중 옳은 것은?

① 맵리듀스 ② 직렬화 ③ 가시화 ④ NOSQL

정답 ④ 비공유분산아키텍처 - 여러대의 서버(제한이 없음)로 클러스터를 만듦 -

서버를 추가하면 연산기능과 저장 기능이 서버의 대수에 비례하여 증가