[t:/]$ 지식_

범주형 데이터

2017/03/21

http://blog.naver.com/jjy0501/220961872950

즐겨읽는 고든님의 블로그.

얼마전에 머신러닝 공부를 조금 하다가.. (...-_-..) 지금은 다른 일 하느라 좀 쉬고 있는데, 연속형 변수를 범주형으로 바꾸는 방법은 내가 살펴본 바에 따르면 이런 것 같은데.. Jeong-Yoon Lee 박사님 맞나요?

  1. 디시젼 트리(랜덤 포레스트, 부스팅 트리 등..)에 데이터를 넣고 결과를 보면 엔트로피 등의 계산값에 따라 연속형 변수를 범주형으로 쪼갤때 의미있는 조건(결정 경계)을 구할 수 있다. 이 조건을 결정 함수로 사용하여 범주형으로 전환할 수 있다.
  2. SVM을 돌려서 결정 경계를 찾는다.
  3. 대상 변수를 하나만 찍어놓고 돌린다면 부스팅 트리의 분기 마다 나오는 조건이 중구난방일 수 있으므로 그냥 직접 엔트로피를 계산하는 방법도 있겠다...

... 잘 모르겠다 ...









[t:/] is not "technology - root". dawnsea, rss