DATOR


물리적 트랜잭션 단위와 논리적 트랜잭션의 단위 2 statistical analysis


제가 인터넷에 찾아보니 '시차 연관성 규칙' 이라는 내용이 있더군요.

 

'시차 연관성 규칙'과는 약간은 다른 개념입니다.

 

'시차 연관성 규칙'은 하나의 제품을 구매하고 나서 다음 시점에 구매할 상품을 예측하는 것입니다.

 

즉, 카메라 본체를 구매하고 나서 카메라 렌즈를 구입할 확률이라는 것입니다.

 

상식선에서 판단해보면 카메라 렌즈를 구입하고 카메라 본체를 구매하는 것보다는 더 많은 연관성을 가진다는 것으로 해석하면 되겠습니다.

 

'시차 연관성 규칙'도 같이 구매할 상품의 확률과 다음 구매할 상품을 예측하기 때문에 중요한 마이닝 규칙이기 때문에 다음에 다루겠습니다.

 

 


실제 하나의 주문으로만 트랜잭션으로 묶는다면 한 고객은 동일일시에만 주문한 내역이 하나의 트랜잭션입니다.

 

그렇습니다. 물리적 트랜잭션이라는 것은 업무처리 관점에서 보는 것으로 사람이 평소에 생각하는 주문단위를 하나의 주문으로 보는 것입니다.

 

그런데 온라인 쇼핑몰에서도 거래단위로 트랜잭션을 본다면 연관성을 찾을수 있을까요?

 

온라인 거래에서는 전체 거래중 단일품목 주문이 상당히 많습니다.

 

그렇다면 업무처리적인 관점에서의 트랜잭션으로만 볼것이 아니라 좀 더 확장을 시켜서 트랜잭션을 봐야 합니다.

 

그러면 어떠한 방법으로 트랜잭션을 확장시켜야 할까요?

 

물론 다양한 방법이 있겠지만 제가 아는 만큼 나열해보겠습니다.

 

 

 1. 거래기준으로 트랜잭션 묶음.

 

 2. 특정기간안에 이루어진 거래

 

 3. 특정고객의 전체구매이력

 

트랜잭션확장의 예.jpg

 

2번의 경우는 이를 확장시키는 것에 대해서 고려할 사항이 많습니다.

 

고객을 세분화하여 대상 고객간의 평균구매간격으로 봐야할지, 아니면 전체 고객을 대상으로 평균구매간격으로 봐야할지와 기간을 확장하게 되면서 물품간에는 연관성이 긴 시간을 가지고 나타나는 제품이 있는 반면 짧은 기간안에 나타나는 제품도 있습니다.

 

이는 연관성 규칙을 얼마나 세분화할지, 아니면 넒은 범위에서 분석할지를 나타내는 것이기 때문에 정해진 값으로 하는 것이 아니라 반복적인 분석을 해야만 좋은 결과를 볼수 있습니다.

TAG

Leave Comments


profile우리는 하나님을 믿는다. 다른 모든 것들은 데이터로 검증해야 한다. 

Recent Trackback