교육원소개
교육과정
국비지원센터
학습지원센터
학습유의사항
학습매뉴얼
|
|
|
| 강좌구성 |
20시간 (20강) |
| 수강기간 |
4주 + 복습기간 제공 |
| 수료기준 | 진도 80% 이상 + 종합 60점 이상, 시험 2회 , 과제 1회 상세보기 |
| 교육비 | 87,780원 |
| 실결제금액 | 교육원 문의 |
과정 소개
IT 대기업, 소셜 미디어 서비스 등에서 빅데이터 분석 및 처리에 하둡(Apache Hadoop)을 앞다투어 사용하고 있습니다. 하둡은 대량의 자료를 적은 비용으로 수집 및 가공처리할 수 있도록 만들어진 자바(Java) 언어 기반의 프레임워크로, 대규모 데이터 세트를 분산 저장하고 처리해 줍니다.학습 대상
하둡 프로그래밍를 처음 접하시는 학습자
학습내용의 용어, 수행방법 등에 대한 기본기를 탄탄히 다지고 싶으신 학습자
이론 내용을 실무와 함께 습득하고 싶으신 학습자
학습 목표
빅데이터 용어에 대한 이해를 시작으로 HDFS, YARN 을 통한 하둡(Hadoop)의 Map Reduce 연산의 구현으로 빅 데이터를 다루는 과정을 직접 체험한다.
빅데이터 테크놀로지 (Big Data Technology) 중 데이터 수집/가공분야를 이해하게 되며, 이 과정이 결국은 빅데이터 분석가가 될 수 있다.

| 차시 | 내용 |
|---|---|
| 1차시 | Hadoop, HDFS 그리고 YARN |
| 2차시 | Linux 설치 및 환경설정 |
| 3차시 | Hadoop 설치 |
| 4차시 | Hadoop 실행 및 HDFS 명령어 |
| 5차시 | Map Reduce를 이용한 Word count 구현 1 |
| 6차시 | Map Reduce를 이용한 Word count 구현 2 |
| 7차시 | CDC COVID-19 데이터를 이용한 월별 확진자 통계 1 |
| 8차시 | CDC COVID-19 데이터를 이용한 월별 확진자 통계 2 |
| 9차시 | CDC COVID-19 데이터를 이용한 연령별 확진자 통계 |
| 10차시 | 사용자 정의 옵션 사용 1 |
| 11차시 | 사용자 정의 옵션 사용 2 |
| 12차시 | 사용자 정의 카운터 구현 1 |
| 13차시 | 사용자 정의 카운터 구현 2 |
| 14차시 | MultipleOutputs 구현 |
| 15차시 | 사용자 정렬 구현 1 |
| 16차시 | 사용자 정렬 구현 2 |
| 17차시 | HIve 소개 및 설치 |
| 18차시 | HiveQL을 이용한 Map Reduce 연산 1 |
| 19차시 | HiveQL을 이용한 Map Reduce 연산 2 |
| 20차시 | Hive Java Client |
| 평가항목 | 진도율 | 시험 | 과제 | 진행단계평가 | 수료기준 |
|---|---|---|---|---|---|
| 평가비율 | - | 70% | 20% | 10% | - |
| 수료조건 | 80% 이상 | 0점 이상 | 0점 이상 | 0점 이상 | 60점 이상 |