일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 백준
- 백트래킹
- 모각코
- DFS
- programmers
- Planned
- MyPlaylist
- DP
- 알고리즘
- 소프트웨어공학
- 그리디알고리즘
- SQL
- django
- 종합설계
- codetree
- 장고
- BFS
- minimum spanning tree
- B대면노래방
- Kruskal
- 마라마라빔
- 최소스패닝트리
- 데이터베이스
- 프로그래머스
- 동적계획법
- 실습
- 파이썬
- 함밥
- 코드트리
- Bellman-Ford
Archives
- Today
- Total
Leta Learns
결정 트리. 의사 결정 나무. 본문
결정 트리. 의사 결정 나무
: 예/아니오 질문을 이어나가면서 학습하는 모델. (like 스무고개)
여러가지 규칙을 순차적으로 적용하면서 독립 변수 공간을 분할하는 분류 모형.
- 여러가지 독립 변수들 중 하나의 독립 변수를 선택하고 그 독립 변수에 대한 기준값을 정한다.
- 전체 학습 데이터 집합(부모 노드)을 해당 독립 변수의 값이 기준값보다 작은 데이터 그룹(자식 노드1)과 기준값보다 큰 데이터 그룹(자식 노드2)로 나눈다.
- 2번 단계를 반복하여 계속 하위의 자식 노드를 만든다.
- 자식 노드에 한 가지 클래스의 데이터만 존재하게 될 때 더 이상 자식 노드를 나누지 않고 중지하여 결과를 도출.
불순도
label이 여러가지면 불순도 높아짐.
label이 적을수록 불순도 낮아짐.
의사결정나무 장단점
: 만들어진 모델을 쉽게 시각화할 수 있어서 비전문가도 이해하기 쉬움.
데이터의 정규화나 표준화 같은 전처리 과정 불필요.
과대적합 경향이 있어 일반화 성능이 좋지 않음.
'데이터 분석을 위한 통계 & R 언어' 카테고리의 다른 글
R 데이터 개수 확인하는 함수 (0) | 2021.11.19 |
---|---|
서포트 벡터 머신 Support Vector Machines (0) | 2021.11.18 |
앙상블 기법 (Ensemble) (0) | 2021.11.18 |
나이브 베이즈 분류기 (0) | 2021.11.18 |
정규화 회귀 / 단순 선형 회귀 헷갈린 부분 정리 (0) | 2021.11.06 |
Comments