4차 산업혁명 연계 빅데이터 기초·고급
주요내용
교육시간
운영시기
커리큘럼
회차 | 교육 주요 내용 | 교육 세부 내용 | 실습 |
---|---|---|---|
1 |
데이터사이언스 범위 |
빅데이터, 인공지능, 머신러닝, 데이터 사이언스 | 아나콘다 설치 |
데이터 사이언스 응용 |
새오할, 마케팅, 안전, 에너지, 교통 | 파이썬 실행환경 설정 |
|
파이썬 실행 |
쥬피터 노트북 | 쥬피터 노트북 사용법/Colab |
|
2 |
파이썬 기초문법 |
파이썬 기본변수, 리스트, 딕셔너리 | Int, float, Boolean, str |
파이썬 프로그래밍 |
파이썬 프로그램 구조 | If, for, def |
|
numpy |
랜덤 넘버 | Ndarray |
|
pandas |
데이터 프레임, 인덱스 | 행/열 추가 삭제 |
|
3 |
데이터 시각화 |
박스플롯 히스토그램 , 막대그래프 |
Seaborn |
데이터 프레임 연습 |
데이터 프레인생성 Series,sort |
결측치처리 |
|
데이터 처리 |
리스트 연습 딕셔너리 연습 |
폴더관리 데이터 다운로드 |
|
날짜 데이터 |
Datetime | 항공운항 데이터 |
|
4 |
웹 크롤링 |
웹데이터 / Urllib | 기상청 데이터 부동산 데이터 |
웹 지도 데이터 |
JSON / Folium | 스타벅스 매장지도 |
|
베이즈 이론 |
베이즈이론 개념 | 이름으로 성별 예측 |
|
베이즈 이론 응용 |
텍스트 처리 | 스팸 메시지 예측 |
회차 | 교육 주요 내용 | 교육 세부 내용 | 실습 |
---|---|---|---|
1 |
머신러닝 범위 |
지도학습, 비지도학습 / 강화학습 | 환경 설정 |
최적화 알고리즘 |
모델튜닝 / 과소, 과대적합 | 최적화기 비교 |
|
분류회귀 |
협업필터링 | kNN 실습 |
|
로지스틱회귀 |
로짓 / 이진분류 | 이진분류성능 |
|
2 |
앙상블알고리즘 |
랜덤포레스트 / 그레디언트부스팅 | 결정트리성능비교 |
서포트벡터머신 |
서포트벡터이해 / 분류분석 | SVM 실습 |
|
분류성능 |
컨퓨전메트릭스 / ROC, AUC | ROC, AUC 실습 |
|
회귀예측 |
손실함수 / 성능평가지표 | 회귀모델 실습 |
|
3 |
모델최적화 |
최적화, 랜덤탐색 일반화, 교차검증 |
하이퍼파라미터튜닝 |
비지도학습 |
비지도학습의 분류 스케일링, 변환 |
스케일링 실습 |
|
4 |
클러스터링 고급 |
클러스터링 적용범위 로그변환, 역수변환 |
붓꽃데이터 분류 |
KMeans, DBSCAN |
|||
클러스터링 평가 |
차원축소, PCA / 시각화고급 | t-SNE, PCA 실습 |
|
다항로지스틱회귀 | 베이즈 알고리즘 구현 |
회차 | 교육 주요 내용 | 교육 세부 내용 | 실습 |
---|---|---|---|
1 |
데이터분석 유형 |
예측, 설명, 추천, 지도학습, 비지도학습 | 파이선환경 설정 |
데이터분석 프로세스 |
문제의 정의, 전략, 모델링 | 파이선환경 설정 |
|
탐색적 분석 |
데이터 타입, 막대그래프, 산포도 | 전력판매데이터 분석 |
|
통계적 분석 |
데이터 특성, 히스토그램, 상관 매트릭스, 리트맵 | 주택가격 예측, 시각화 |
|
2 |
데이터 전처리 |
결측치, 틀린값, 이상치 처리 | 전처리 실습 |
스케일링 |
표준, minmax, robust 스케일링 | 스케일링 실습 |
|
데이터 변환 |
범주형 변환, 로그변환, 역수변환 | 범주형 변환, 정규분포 |
|
유사도와 거리 |
유클리디언거리, 코사인유사도, 자카드거리 | 거리 계산 |
|
3 |
클러스터링 |
거리기반클러스터링, KMeans 밀도기반클러스터링 |
전력사용 클러스터링 DBSCAN 실습 |
선형회귀 |
선형모델, 경사하강알고리즘 MSE |
붓꽃 예제 성별에 따른 몸무게 예측 |
|
4 |
선형분류 분류 손실함수 |
선형 분류 모델, 결정 경계 크로스엔트로피, 결정경계 |
유방암 발병 예측 |
로지스틱회 |
Sigmoid, 다항 로지스틱스, softmax 전체 과정 복습 |
회차 | 교육 주요 내용 | 교육 세부 내용 | 실습 |
---|---|---|---|
1 |
딥러닝과 AI |
딥러닝과 AI 특징 딥러닝 성공요인 |
아나콘다,쥬피터설치 |
딥러닝도구 |
텐서플로우, 케라스 카페, 파이토치 |
텐서플로우, 케라스설치 |
|
다중퍼셉트론 |
다중퍼셉트론(MLP) 원리 이해 | MLP구축 |
|
CNN원리 |
딥러닝구조, 계층, 유닛 딥러닝활성화 함수 |
CNN 기본 모델 구축 |
|
2 |
CNN구현 |
CNN기본 모델 | 필기체 숫자 인식 |
이미지 인식 |
이미지 인식 원리 | 강아지와 고양이 분류 |
|
CNN성능향상 |
두롭아웃, 배치 정규화 | 드롭아웃실습 |
|
전이 학습 |
이미지넷학습모델 전이학습 | VGG-16모델 전이학습 |
|
3 |
데이터 확장 |
데이터 Augmentation | 이미지인식 성능 향상 |
객체 인식 |
다수의 이미지 객체 인식 | YOLO3 |
|
자연어 처리 |
NLP 프로세서 소개 | 자연어 처리 실습 |
|
RNN원리 |
RNN 동작 원리 | 단층 RNN 구축 |
|
4 |
LSTM |
LSTM원리 소개 | LSTM, GRU 구축 |
시계열분석 |
RNN을 이용한 시계열 예측 | 에너지 사용량 예측 |
|
단어 임베딩 |
임베딩직접 구축 및 활용 | 임베딩생성 실습 |
담당부서 | 취창업지원실 | 연락처 | 051-410-5288, 5289 |
---|