국립한국해양대학교 LINC 3.0 사업단

산학연연계교육

홈으로 산학연연계교육 4차 산업혁명 연계 빅데이터 기초/고급 프로그램

4차 산업혁명 연계 빅데이터 기초·고급

주요내용

4차 산업혁명 시대 핵심 인재인 인공지능(AI)과 빅데이터 능력을 갖춘 전문인재 양성
정부의 4IR 핵심인력 양성계획에 따라 ‘AI기반 데이터사이언티스트’양성 적극추진
M1(데이터 프로그래밍), M2(데이터 프로세스&분석), M3(머신러닝), M4(딥러닝)

교육시간

과정별 대면 또는 ZOOM : 각 4일, 총 28시간

운영시기

6월 ~ 12월

커리큘럼

M1(데이터 프로그래밍)
회차 교육 주요 내용 교육 세부 내용 실습
1
데이터사이언스 범위
빅데이터, 인공지능, 머신러닝, 데이터 사이언스
아나콘다 설치
데이터 사이언스 응용
새오할, 마케팅, 안전, 에너지, 교통
파이썬 실행환경 설정
파이썬 실행
쥬피터 노트북
쥬피터 노트북 사용법/Colab
2
파이썬 기초문법
파이썬 기본변수, 리스트, 딕셔너리
Int, float, Boolean, str
파이썬 프로그래밍
파이썬 프로그램 구조
If, for, def
numpy
랜덤 넘버
Ndarray
pandas
데이터 프레임, 인덱스
행/열 추가 삭제
3
데이터 시각화
박스플롯
히스토그램 , 막대그래프
Seaborn
데이터 프레임 연습
데이터 프레인생성
Series,sort
결측치처리
데이터 처리
리스트 연습
딕셔너리 연습
폴더관리
데이터 다운로드
날짜 데이터
Datetime
항공운항 데이터
4
웹 크롤링
웹데이터 / Urllib
기상청 데이터
부동산 데이터
웹 지도 데이터
JSON / Folium
스타벅스 매장지도
베이즈 이론
베이즈이론 개념
이름으로 성별 예측
베이즈 이론 응용
텍스트 처리
스팸 메시지 예측
M3(머신러닝)
회차 교육 주요 내용 교육 세부 내용 실습
1
머신러닝 범위
지도학습, 비지도학습 / 강화학습
환경 설정
최적화 알고리즘
모델튜닝 / 과소, 과대적합
최적화기 비교
분류회귀
협업필터링
kNN 실습
로지스틱회귀
로짓 / 이진분류
이진분류성능
2
앙상블알고리즘
랜덤포레스트 / 그레디언트부스팅
결정트리성능비교
서포트벡터머신
서포트벡터이해 / 분류분석
SVM 실습
분류성능
컨퓨전메트릭스 / ROC, AUC
ROC, AUC 실습
회귀예측
손실함수 / 성능평가지표
회귀모델 실습
3
모델최적화
최적화, 랜덤탐색
일반화, 교차검증
하이퍼파라미터튜닝
비지도학습
비지도학습의 분류
스케일링, 변환
스케일링 실습
4
클러스터링 고급
클러스터링 적용범위
로그변환, 역수변환
붓꽃데이터 분류
KMeans, DBSCAN
클러스터링 평가
차원축소, PCA / 시각화고급
t-SNE, PCA 실습
다항로지스틱회귀
베이즈 알고리즘 구현
M2(데이터 프로세스&분석)
회차 교육 주요 내용 교육 세부 내용 실습
1
데이터분석 유형
예측, 설명, 추천, 지도학습, 비지도학습
파이선환경 설정
데이터분석 프로세스
문제의 정의, 전략, 모델링
파이선환경 설정
탐색적 분석
데이터 타입, 막대그래프, 산포도
전력판매데이터 분석
통계적 분석
데이터 특성, 히스토그램, 상관 매트릭스, 리트맵
주택가격 예측, 시각화
2
데이터 전처리
결측치, 틀린값, 이상치 처리
전처리 실습
스케일링
표준, minmax, robust 스케일링
스케일링 실습
데이터 변환
범주형 변환, 로그변환, 역수변환
범주형 변환, 정규분포
유사도와 거리
유클리디언거리, 코사인유사도, 자카드거리
거리 계산
3
클러스터링
거리기반클러스터링, KMeans
밀도기반클러스터링
전력사용 클러스터링
DBSCAN 실습
선형회귀
선형모델, 경사하강알고리즘
MSE
붓꽃 예제
성별에 따른 몸무게 예측
4
선형분류
분류 손실함수
선형 분류 모델, 결정 경계
크로스엔트로피, 결정경계
유방암 발병 예측
로지스틱회
Sigmoid, 다항 로지스틱스, softmax
전체 과정 복습
M4(딥러닝)
회차 교육 주요 내용 교육 세부 내용 실습
1
딥러닝과 AI
딥러닝과 AI 특징
딥러닝 성공요인
아나콘다,쥬피터설치
딥러닝도구
텐서플로우, 케라스
카페, 파이토치
텐서플로우, 케라스설치
다중퍼셉트론
다중퍼셉트론(MLP) 원리 이해
MLP구축
CNN원리
딥러닝구조, 계층, 유닛
딥러닝활성화 함수
CNN 기본 모델 구축
2
CNN구현
CNN기본 모델
필기체 숫자 인식
이미지 인식
이미지 인식 원리
강아지와 고양이 분류
CNN성능향상
두롭아웃, 배치 정규화
드롭아웃실습
전이 학습
이미지넷학습모델 전이학습
VGG-16모델 전이학습
3
데이터 확장
데이터 Augmentation
이미지인식 성능 향상
객체 인식
다수의 이미지 객체 인식
YOLO3
자연어 처리
NLP 프로세서 소개
자연어 처리 실습
RNN원리
RNN 동작 원리
단층 RNN 구축
4
LSTM
LSTM원리 소개
LSTM, GRU 구축
시계열분석
RNN을 이용한 시계열 예측
에너지 사용량 예측
단어 임베딩
임베딩직접 구축 및 활용
임베딩생성 실습
담당부서 취창업지원실 연락처 051-410-5288, 5289
(49112)부산광역시 영도구 태종로 727(동삼동) 국립한국해양대학교 산학허브관 3층 302호
TEL 051-410-5297 / 5299 FAX 051-405-5517
ⓒ 국립한국해양대학교 LINC 3.0 사업단 | [관리자]