빅데이터 알고리즘을 위한 커리큘럼은 아래와 같습니다.
- over-fitting and under-fitting
- bias/variance trade-off
- ERM(Empirical Risk Minimization) principle
- 상관분석(correlation)
- 회귀분석(선형회귀, 로지스틱 회귀)
- 능형회귀(ridge regression)과 lasso(regularization)
- prediction algorithm 평가(evaluating) 및 비교(comparing)
- Ensemble method(sampling, bagging, Random foresting, boosting)
- Density estimation(Parzen windows, Kernel density estimation)
- KNN(K-Nearest Neighbors)
- Discriminant Analysis (LDA, QDA)
- Model selection(Cp, BIC, Adjusted R square, Cross-validation)
- kernel methods
- K-mean clustering
- hierarchical clustering
- Dimensionality reduction and Principal Component Analysis(PCA)
- information Retrieval
- Bayes theorem and Bayesian learning
위의 순서는 편의상 번호를 매겨본 것이고 위의 순서대로 배워야 하는 법은 없습니다.
그리고 모든 강의는 위의 순서를 따르지 않을 것이며, 강의가 진행될때마다 위의 내용들중 어느것이 적용되는지
알려드리고자 합니다.
강의는 기본적으로 R과 파이썬의 실습예제를 한번씩 해보는 것으로 진행될 것이며,
그 결과도 함께 같이 적어놓으려고 합니다.
또한 강의가 진행되다가 위의 내용 중에 빠진 것이 있다면 집어넣고
필요없다고 생각하는 경우에는 빼는 경우도 있을 것입니다
'라이언의 빅데이터 강좌' 카테고리의 다른 글
004 데이터분석 시작전 검정 방법 선택 전략 (첫번째) (0) | 2017.04.16 |
---|---|
003 t-검정과 가설 검증 (2) | 2017.04.16 |
002 선형회귀 및 Polynomial regression 고찰 with Python (1) | 2017.02.05 |
001 교차 검증 (cross validation)의 예제 R 코드 (5) | 2017.01.22 |
빅데이터를 전공하지 않은 비전공자를 위한 강의를 만들어볼까 합니다. (3) | 2017.01.22 |