개요
machine learning is…
종류
- Supervised learning
- Unsupervised learning
- Reinforcement learning
흐름
- 데이터 수집
- 데이터 가공
- 데이터 학습
- test
- good job
참고자료
- SVM에 대한 자세한 내용 (참고:평면의 방정식)
- SVM 강의 (19분까지는 margin을 수학적으로 구하는 방법, 그 이후로는 초평면을 찾는 과정)
- 머신러닝의 모델 성능에 대한 지표로 accuracy, precision, recall, f1-score, support 가 사용된다.
TERMS:
- True Positive(TP) : True라고 예측하고 True 결과값을 얻음 (맞음)
ex) 스팸으로 예측하여(T) 스팸함에 넣었는데 진짜로 스팸이었다(T)- False Positive(FP) : True라고 예측하고 False 결과값을 얻음 (틀림)
ex) 스팸으로 예측하여(T) 스팸함에 넣엇는데 스팸이 아니었다(F)- True Negative(TN) : False라고 예측하고 False 결과값을 얻음 (맞음)
ex) 스팸이 아니라고 예측하여(F) 받은 메일함에 넣엇는데 스팸이 아니었다(F)- False Negative(FN) : False라고 예측하고 True 결과값을 얻음 (틀림)
ex) 스팸이 아니라고 예측하여(F) 받은 메일함에 넣엇는데 스팸이었다(T)
- Accuracy(정확도)
- TP+TN / TP+TN+FP+FN
(올바른 판단 횟수) / (판단 총 횟수)
→ 전체 판단 중 얼마나 정확하게 맞추었는가
- TP+TN / TP+TN+FP+FN
- Precicion(정밀도)
- TP / TP+FP
(실제 True 횟수) / (True라고 판단한 횟수)
→ True로 분류했는데 그 것이 진짜로 True인가?
- TP / TP+FP
- Recall(재현율)
- TP / TP+FN
(True 횟수) / (올바른 판단 횟수)
→ 바르게 판단한 케이스 중 진짜 True인 case를 얼마나 정확히 맞추었는가?
- TP / TP+FN
- F1-score
- 정밀도와 재현율의 가중치가 같은 조화평균
참고자료 필독
- 정밀도와 재현율의 가중치가 같은 조화평균