카테고리 없음

[데이터분석기사_Domain1] 시험 대비 기출 공략(3회)

웅키리루 2023. 3. 13. 19:13

[데이터분석 기사_Domain1 빅데이터 분석 기획 (3회)


 

01. 다음 중 Hadoop ecosystem 중 HDFS에 저장되어 있는 데이터에 대해 ETL 작업을 지원하는 것은 무엇인가?
③ Oozie
② Sqoop
③ Pig
④ HBase


[정답 ① ]

 


02. 데이터 분석 기획 시 고려해야할 사항으로 적절하지 않은 것은?
① 분석 수행 시 발생하는 장애요소들에 대한 사전계획 수립
② 분석 분야 및 결론에 대한 사전 시나리오 확정
분석을 통해 가치가 창출될 수 있는 적절한 활용 방안과 유즈케이스 탐색 
④  분석의 기본인 가용 데이터에 대한 고려

[정답 ② ]

 


03. 데이터 웨어하우스 구축 시 데이터를 추출하여 목적에 맞게 변환, 정제하여 적재하는 기능을 담당하는 기술은 무엇인가?
① CDC(Change Data Capture)
② API(Application Programming Interface)
③ ETL(Extract Transform Load)
④ HDFS(Hadoop Distributed File System)

[정답 ③ ]

 


04. 가트너가 정의한 빅데이터의 특징인 3V에 속하지 않는 것은?
① 속도(Velocity)
② 규모(Volume)
③ 정확성(Veracity)
④ 다양성(Variety)

[정답 ③ ]


05. 분석 마스터 플랜에 대한 설명으로 적절한 것은?
① 분석 마스터 플랜은 중장기 마스터 플랜 수립과제 도출,
    우선순위 평가, 과제별 이행계획 수립 순으로 진행한다.
② ROI 관점에서 빅데이터 핵심 특징을 확인하면 투자비용 요소에는 
    Volume, Veracity, Velocity가 있으며,  비즈니스 효과 요소로는 Variety가 있다.
③ 데이터 분석 체계의 특징은 데이터 수집, 확보, 분석 
    및 모델링 전체를 반복하면서 진행하는 것이다.
④ 데이터 기반 구축을 위해서는 분석 과제를 대상으로 전략적 중요도, 
   비즈니스 성과 및 ROI를 우선 순위로 고려하지만,  실행 용이성은 고려 대상이 아니다.

[정답 ① ]

 


06. 빅데이터 분석 방법론의 데이터 분석 단계에서 
수행하는 업무로 적절하지 않은 것은?
① 데이터 수집 및 저장 후 적합성 점검
② 모델 평가 후 모델 검증
③ 텍스트 데이터 확인 및 추출 후 텍스트 데이터 분석
④ 탐색적 데이터 분석 후 데이터 시각화

[정답 ① ]


07.다음 중 데이터 사이언티스트의 능력을 여러 데이터 
전문가의 업무와 비교해 차이를 설명한 것 중거리가 먼 것은?
① 문제를 해결할 수 있는 모델로 변환한 비즈니스 문제를 IT와 
소프트웨어 개발 역량으로 체계적이고 자동화된 방식으로 분석, 해결할 수 있는 능력
② IT와 소프트웨어 개발 역량으로 비즈니스 문제를 해결하기 위한 
데이터 수집, 가공, 분석 단계와 절차를 설계하고 구현할 수 있는 능력
③ 비즈니스 문제를 새롭게 정의하고 이 문제를 
풀 수 있는 모델로 바꿀 수 있는 능력
④ 데이터 가공 과정을 소프트웨어로 자동화하여 
필요로 하는 데이터를 만드는 시스템을 개발하는 능력

[정답 ④ ] 

 


08. 다음 중 개인정보보호법에서 확인할 수 있는 개인정보 보호 원칙이 아닌 것은?
① 개인정보 처리자는 개인정보의 처리 목적에 필요한 범위에서 
적합하게 개인정보를 처리하여야 하며,  그 목적 외의 용도로 활용하여서는 아니 된다.
④ 개인정보 처리자는 개인정보의 처리 방법 및 종류 등에 따라 정보주체의 권리가

침해받을 가능성과 그 위험 정도를 고려하여 개인정보를 안전하게 관리하여야 한다.
③개인정보 처리자는 개인정보 처리 방침 등 개인정보의 처리에 관한 사항을

공개하여야만 하며, 필요에 따라서 열람청구권 등 정보주체에게 제공을 허용한다.
⑨ 개인정보 처리자는 정보주체의 사생활 침해를 최소화하는 방법으로 

개인정보를 처리하여야 한다.

[정답 ③ ]


09. 기존의 기계학습 알고리즘과 비교해 빅데이터 기반의 인공지능 기술의 장점으로 적절하지 않은 것은?
① 컴퓨터 및 저장 기술의 발전으로 대규모 데이터를 효율적으로 처리할 수 있다.
② 시각, 청각과 같은 특정 영역에서 인간 수준 또는 그 이상을 구현할 수 있다.
③ 다른 영역의 문제로의 지식을 확장할 수 있다.
④ 사람이 문제 영역에 대해 경험한 Insight를 활용해 필요한 특징을 직접 설정할 수 있다.

[정답 ④ ] 


10. 다음 중 빅데이터 분석 절차 5단계 중 아래의 보기에서 설명하는 단계는?

데이터 분석을 통한 개선사항을 도출하기 위하여 분석하고자 
하는 과제 현황을 파악하고 분석하여 이를 통한 개선과제를 정의한다.

① 도메인 이슈 도출
② 빅데이터 분석 결과 시각화
③ 분석 목표 수립
④ 프로젝트 계획 수립


[정답 ① ]

 


11. 2018년 5월 25일에 시행된 EU의 개인정보보호법으로 정보주체 권리와

기업의 책임성 강화, 그리고 개인정보 역외 이전 등을 주요 내용으로하는 법령은 무엇인가
③ Data Protection 
② Regulation Data Protection Directive
③ Data Protection Directive
④ General Data Protection Regulation

[정답 ④ ] 


12. 재현 데이터(Synthetic Data)에 대한 설명으로 적절한 것은?
① 재현 데이터를 생성할 때, 데이터가 갖는 통계적 특성을 유지하는 것에 초점을 둔다. 
② 재현 데이터는 식별자 기반 처리를 거친 자료에 비해서 감춰진 정보가 많다.  
③ 재현 데이터는 임의로 생성한 데이터이지만 개인정보보호 관련 법규의 

규제로부터 자유롭지 못하다.
④ 재현 데이터 중 부분 재현 데이터는 공개하려는 변수들 중 일부만 

선택하여 재현데이터로 대체한 데이터를 의미한다.

[정답 ③ ]


13. 빅데이터 저장 기술 중 키 값을 이용하여 데이터를 간단하게 저장하는

 방법으로 Cassandra, HBase와 같은 비정형, 반정형 데이터 처리에 유용한 기술은?
① 분산 파일 시스템
② 병렬 DBMS
③ 클라우드 파일 저장 시스템
④ NoSQL

[정답 ④ ] 

 


14. 다음 중 빅데이터 분석 절차의 순서로 적절한 것은?
① 분석 기획 → 데이터 준비 → 데이터 분석 → 시스템 구현  →  평가 및 전개
② 분석 기획 → 데이터 준비 → 시스템 구현 →  데이터 분석 → 평가 및 전개
③ 분석 기획 → 데이터 준비 → 데이터 분석 → 평가 및 전개 → 시스템 구현
④ 분석 기획 → 데이터 모델링 → 데이터 준비 → 데이터 분석 → 평가 및 전개

[정답 ① ]

 


15. 분석 문제 정의 단계에 대한 설명으로 가장 적절하지 않은 것은?
① 데이터 분석을 통해 달성하고자 하는 목표를 고려한다.
② 문제 정의의 주체로 개인과 조직을 나누어 고려한다.
③ 데이터의 크기와 종류(정형, 반정형, 비정형) 등을 고려한다.
④ 분석 주기는 분석 단계에서 결정될 수 있어 이 단계에서는 고려하지 않는다.

[정답 ④ ] 

 


16. 데이터웨어하우스는 기업 내의 의사결정지원 어플리케이션에 정보 기반을 제공하는 

하나의 통합된 데이터 저장 공간을 말한다. 다음 중 데이터웨어하우스의 고유한 특성이 아닌 것은?
① 데이터웨어하우스에서는 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요하다.
② 데이터웨어하우스의 데이터들은 전사적 차원에서 일괄된 형식으로 정의된다.
③ 데이터웨어하우스에서 관리하는 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다.
④ 데이터웨어하우스에서는 특정 주제에 따라 데이터들이 분류, 저장, 관리된다.

[정답 ④ ] 

 


17. 아래에서 설명하는 (가) 용어는 무엇인가?

A 기업이 보유하고 있는 이용자들의 개인정보를 B 기업에게 제공하기 위해서는 
이용자들의 동의를받아야했다. 하지만, 
( 가 )를 통하여 B 기업이 직접 이용자에게 
동의를 받아 
A 기업이 보유한 개인정보 제공을 요청할 수 있다.

① 마이 데이터
② 개인정보보호 포털
③ 기업간 정보교환
④ 개인정보 동의 간소화

[정답 ① ]


18. 다음 중 민감정보에 해당하지 않는 것은?
① 사상·신념
② 주민등록번호
③ 건강 정보
④ 정치적 견해

[정답 ② ]

 


19. 데이터 비식별화 기술 중 식별자 처리를 통한 식별 방지 기술로 옳지 않은 것은?
① 가명처리(Pseudonymisation)
② 데이터 삭제(Reduction)
③ 데이터 마스킹(Suppression)
④ 데이터 값 대치(Substitute)

[정답 ④ ] 

 


20. 데이터 품질의 유형 중 정확성, 객관성, 진정성 등 데이터 자체의 우수성을 나타내는 것은?
① 내재적 품질(Intrinsic)
② 접근성 품질(Accessibility)
③ 상황적 품질(Contextual)
④ 표현적 품질(Representational)


[정답 ① ]