fengxiangpiao 发表于 2013-1-30 00:47:57

关于数据挖掘关联规则的Oracle 实 现

<span style="" class="Apple-style-span"><span style="font-size: 14px; line-height: 21px; text-align: left;" class="Apple-style-span">呵呵,前几天拿到了数据挖掘基础教程一书,感觉部分算法是基于统计学的原理的,而统计学是可以通过 Oracle 来实现。
其次是为了观看德国 vs 西班牙的世界杯比赛,来了一点小小的兴致,动手写点小脚本。不过本文只是为了实现而实现的,没有做 任何优化,有兴趣的话,大家可以玩一玩。
 
关于数据挖掘关联规则的材料,可以参见:
http://baike.baidu.com/view/1076817.htm?fr=ala0_1
关联规则是形如 X → Y 的蕴涵式,
其中且, X 和 Y 分别称为关联规则的先导 (antecedent 或 left-hand-side, LHS) 和后继 (consequent 或 right-hand-side, RHS) 。
关联规则在 D 中的支持度 (support) 是 D 中事务同时包含 X 、 Y 的百分比,即概率; =X^Y/D
置信度 (confidence) 是包含 X 的事务中同时又包含 Y 的百分比,即条件概率。   =(X^Y)/X
关联规则是有趣的,如果满足最小支持度阈值和最小置信度阈值。
若给定最小支持度α = n ,最小置信度β = m ,则分别通过以上的 X^Y/D 和 (X^Y)/X ,可获知是否存在关联
 
使用的原始数据
  http://space.itpub.net/attachments/2010/07/6517_201007081232143.jpg
 
         反范式后的数据
  http://space.itpub.net/attachments/2010/07/6517_201007081232142.jpg
 
         待统计项
  http://space.itpub.net/attachments/2010/07/6517_201007081232141.jpg
 
-- 创建各个购买单元项视图
<div style="padding-top: 1pt; padding-right: 4pt; padding-bottom: 1pt; padding-left: 4pt; background-image: none; background-color: #d9d9d9; background-position: 0% 0%;">create view distinct_trans as select distinct tranobject from purchase;
页: [1]
查看完整版本: 关于数据挖掘关联规则的Oracle 实 现