[데이터분석기사_Domain1] 시험 대비 기출 공략(4회)
[데이터분석기사_Domain1] 시험 대비 기출 공략(4회)
1. HDFS에 대한 설명으로 옳은 것은?
① 복제의 횟수는 내부에서 결정된다.
② ETL, NTFA가 상위 프로그램이다.
③ GFS과 동일한 함수를 적용한다.
④ 네임노드는 삭제데이터 저장공간에 네임노드에 데이터를 같이 저장한다.
정답 ③
2. 인공지능학습에 대한 설명으로 옳지 않은 것은?
① 강인공지능은 범용으로 사용되기는 시기상조이다.
② 약인공지능은 제한된 기능을 뛰어넘어 발달된 인공지능이다.
③ 강인공지능이라고 불릴 만한 수준의 인공지능은 지금도 개발되지 않았다.
④ 훌륭한 알고리즘을 보유하였다면 학습을 생략해도 된다.
정답 ④
3. 분산파일 시스템에 대한 설명으로 옳지 않는 것은?
① 데이터베이스를 분산 저장한다.
② x86 서버의 CPU,RAM 등을 사용하므로 장비 증가에 따른 성능향상이 용이하 다.
③ 여러 컴퓨터를 하나의 서버 환경에 저장한다.
④ 네트워크를 통한 여러 파일을 관리 및 저장하는 개념이다.
정답 ③
분산 파일 시스템, 네트워크 파일 시스템은 컴퓨터 네트워크를 통해 공유하는 여러 호스트 컴퓨터의 파일에 접근할 수 있게 하는 파일 시스템이다.
4. 분석로드맵 설정 시 우선순위 고려해야할 사항 아닌 것은?
① 비즈니스 성과 및 ROI
② 시급성
③ 분석데이터 적용
④ 전략적 중요도
정답 ③ 분석데이터 적용 수준은 적용 우선순위 설정 고려요소이다.
5. 가트너가 정의한 빅데이터 처리 플랫폼 특징 중 3V에 속하지 않는 것은?
① Volume ② Velocity ③ Variety ④ Value
정답 ④
6. 빅데이터 분석기획 절차는?
① 프로젝트정의 -> 범위설정 -> 위험계획수립 -> 수행계획수립
② 프로젝트정의 -> 범위설정 -> 수행계획수립 -> 위험계획수립
③ 범위설정 -> 프로젝트정의 -> 수행계획수립 -> 위험계획수립
④ 범위설정 -> 프로젝트정의 -> 위험계획수립 -> 수행계획수립
정답 ③ 빅데이터 분석기획(Planning) 단계(Phase)의 태스크(Tasks)에 관한 문제이다.
7. 개인정보 비식별화 기술에 대한 설명 중 가장 적절하지 않은 것은?
① 총계처리 : 데이터의 총합 값으로 처리하여 개인 데이터의 값을 보이지 않도록 하는 기술
② 데이터 마스킹 : 개인 식별에 중요한 데이터 값을 삭제하는 기술
③ 가명처리 : 개인 식별에 중요한 데이터를 식별할 수 없는 다른 값으로 변경하는 기술
④ 범주화 : 데이터의 값을 범주의 값으로 변환하여 값을 변경하는 기술
정답 ② 데이터 값 삭제의 정의이다.
8. 개인정보 비동의시에도 사용 가능한 경우가 아닌 것은?
① 법령상 의무를 준수하기 위하여 불가피한 경우
② 계약의 체결 및 이행을 위하여 불가피하게 필요한 경우
③ 정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위하여 필요하다고 인 정되는 경우
④ 개인 편의 제공 시 합당한 이유가 있으면 가능하다.
정답 ④
9. 분석 시나리오를 작성을 해야 하는 이유로 가장 적절하지 않는 것은?
① 이해관계자 도출
② 업무 성과 판단
③ 최신 업무 형태 반영
④ 분석 목표 도출
정답 ③
10. 1제타바이트에 1byte의 아스키 코드를 넣으면 얼만큼 넣을 수 있는가?
① 2의 10승 ② 2의 30승 ③ 2의 50승 ④ 2의 70승
답 ④
킬로바이트:2의 10승
메가바이트:2의 20승
기가바이트:2의 30승
테라바이트:2의 40승
페타바이트:2의 50승
엑사바이트:2의 60승
제타바이트:2의 70승
요타바이트:2의 80승
11. 다음 중 인메모리 기반의 데이터 처리와 연관된 오픈소스 프로젝트는?
① 맵리듀스 ② 스파크 ③ 하이브 ④ 피그
정답 ②
12. 다음 중 데이터분석 모델링과 관련하여 수행하는 업무가 아닌 것은?
① 데이터 분할
② 데이터 모델링
③ 프로젝트 성과 분석 및 평가 보고
④ 모델 적용 및 운영방안
정답 ③ 프로젝트 성과 분석 및 평가보고는 평가 및 전개의 태스크 구성이다.
13. 다음 중 정형데이터와 비정형데이터와 관련된 것 중 옳은 것은?
① 동영상, 오디오 데이터는 정형 데이터에 속한다.
② 정형 데이터는 지정된 행과 열에 의해 데이터의 속성이 구별되는 스프레드시트 형태의 데이터이다.
③ 형태소는 정형데이터를 분석하기 위한 단위이다.
④ 비정형데이터는 잠재적 가치가 가장 낮다.
정답 ②
14. 다음 중 고품질데이터의 특성이 아닌 것은?
① 정확성(Accuracy)
② 적시성(Timeliness)
③ 불편의성(Uncompleteness)
④ 일관성(Consistency)
정답 ③ 데이터의 품질지표는 준비성, 완전성, 일관성, 정확성, 적시성, 보완성, 유용성
15. 다음 중 시스템의 전방에 위치하여 클라이언트로부터 다양한 서비스를 처리하고,
내부 시스템으로 전달하는 미들웨어는?
① API 게이트웨이
② 데이터베이스
③ PaaS
④ ESB(Enterprise Service Bus)
정답 ① 사용자는 메인 페이지를 보기 위해서 하나의 URL을 통해 서버에 요청을 보내지만
실제 사용자가 보게 되는 화면에는 다양한 종류의 서비스 결과가 있다.
16. 데이터 3법에 포함되는 것이 아닌 것은?
① 개인정보보호법
② 정보통신산업 진흥법
③ 정보통신망 이용촉진 및 정보보호 등에 관한 법률
④ 신용정보의 이용 및 보호에 관한 법률
정답 ②
17. 공공데이터에서 제공하는 파일의 형식이 아닌 것은?
① xml
② sql
③ json
④ csv
정답 ②
18. 데이터 저장소가 아닌 것은?
① Data Lake
② Data Warehouse
③ Data Mining
④ Data Dam
정답 ③
19. 데이터에 노이즈를 추가해 개인정보와 데이터분석을 모두 진행할 수 있는 방법 은?
① K-익명성
② 차등보호법
③ 가명화
④ L다양성
정답 ② 해설 개인정보 차등보호(업계 표준 용어)란
데이터에 수학적인 노이즈를 추가하는 기술을 말합니다.
20. 빅데이터 분산 저장기술 중 옳은 것은?
① 맵리듀스 ② 직렬화 ③ 가시화 ④ NOSQL
정답 ④ 비공유분산아키텍처 - 여러대의 서버(제한이 없음)로 클러스터를 만듦 -
서버를 추가하면 연산기능과 저장 기능이 서버의 대수에 비례하여 증가