DATOR


Oracle의 순환전개를 활용한 Decision Tree 구현사례. 1 SQL


데이터마이닝 기법중에 의사결정나무(Decision Tree)라는 것이 있습니다. 나무 뒤집어 놓은 형태로 생겼고 가지에서 분개되는 것처럼 노드에서 특정 항목의 값을 기준으로 분류하는 것입니다. 여기서 의사결정나무에 대해서 깊이 논하지는 않겠습니다. 이 글의 목적은 Oracle에서 이를 구현할 수 있도록 데이터 모델을 설계하고 PL/SQL이나 통계프로그램, 절차형 프로그래밍 하는 것이 아닌 SQL로 원하는 결과를 도출하는 것이 목표이기 때문입니다. 의사결정나무에 대해서 더 궁금하신분들은 네이버에 '의사결정나무', 'Decision Tree'를 검색하거나 http://blog.naver.com/coooolwater?Redirect=Log&logNo=104882753 로 들어가 보시기 바랍니다. (※ 선행학습이 필요하다는 의미겠죠?)

 

 

제가 구현사례에서 보여드릴 내용은 아래와 같습니다.

 

1) 예제로 사용할 의사결정나무

2) 위 예제를 수용할 수 있는 데이터 모델

3) 데이터 모델에 대한 설명과 실제 데이터 인스턴스

4) 이를 구현하는 SQL과 원리

5) 구현할 때 발생할 수 있는 성능 문제와 이에 대한 리뷰

6) 아직 존재하는 제약사항과 풀어나아가야 할 점

7) 다른 분야에 응용

 

PS. 약 4년전 이것저것 상상하면서 그렸던 데이터 모델과 SQL이 이제서야 정리가 된것 같습니다. 실제 써먹어야지, 구현해봐야지, 남들에게 보여줘야지 생각만 했었는데 기회가 없었는지, 제가 노력이 부족했었던것 같습니다. 약 3개에서 4개정도 묶어서 개시할 생각입니다. 그리고 이번 것은 순수 창작물(?)이니 관심있게 봐주시면 감사하겠습니다 ^^

TAG

Leave Comments


profile우리는 하나님을 믿는다. 다른 모든 것들은 데이터로 검증해야 한다. 

Recent Trackback