如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
会计学1关联(guānlián)规则可信度:在属性集A出现的前提下,B出现的概率P(B|A)支持(zhīchí)度:属性集A,B同时出现的概率P(A∧B)期望可信度:属性集B出现的概率P(B)作用度:可信度对期望可信度的比值P(B|A)/P(B)可信度是对关联规则准确度的衡量,支持度是对关联规则重要性的衡量。显然,支持度越(dùyuè)大,关联规则越重要。有些关联规则可信度虽然很高,但支持度却很低,说明该关联规则实用的机会很小,因此也不重要。作用度描述属性集A的出现对属性集B的出现有多大影响。作用度越(dùyuè)大,说明属性集B受属性集A的影响越大。一般情况,有用的关联规则的作用度都应大于1,只有关联规则的可信度大于期望可信度,才说明A的出现对B的出现有促进作用,也说明了它们之间某种程度的相关性,如果作用度不大于1,则此关联规则就没有意义。2关联规则(guīzé)算法(Apriori算法)2.2Apriori算法(suànfǎ)第一步:找频繁(pínfán)项集第二步:由频繁项集产生期望(qīwàng)规则(一)Apriori算法在学生成绩分析中的应用(yìngyòng)研究1研究(yánjiū)对象2数据(shùjù)预处理图1原始数据表2.2数据(shùjù)转换3研究(yánjiū)方法4结果(jiēguǒ)与分析规则(guīzé)5说明《数据库原理》成绩在80~90分之间,《计算机网络》也在80~90分之间的支持度为58.4%,置信度为76.5%,规则(guīzé)6说明《高级语言程序设计》在80~90分之间,《计算机网络》也在80~90分之间的支持度为56.9%,置信度为83.4%,这两个规则(guīzé)虽然可信度和置信度都较高,但实际究竟有无关联需要深入探讨。规则(guīzé)2说明《计算机基础》成绩在70~80分之间,《工科高数》在80~90分之间的支持度为55.8%,置信度为87.2%,虽然可信度和置信度都达到了要求,但根据实际经验,两者并无直接关联,实际工作中可以不予考虑。其他规则(guīzé)同样如此,需要决策者根据实际情况具体研究,有分析地借鉴参考。5结语(jiéyǔ)Apriori算法(suànfǎ)的应用/选择有且只有一个相同元素的两个2_项频繁集进行连接,生成3_项候选集是{I1,I2,I3},{I1,I2,I5},{I1,I3,I5},{I2,I3,I4},{I2,I3,I5},{I2,I4,I5},{I1,I2,I4},如果一个项集是频繁的,则它的所有(suǒyǒu)子集也是频繁的。所以只考虑{I1,I2,I3},{I1,I2,I5}.生成4_项候选(hòuxuǎn)集是{I1,I2,I3,I5},而{I2,I3,I5}不是频繁集,所以不存在4_项频繁集.从两个最大频繁集{I1,I2,I3}和{I1,I2,I5},可推出侯选关联规则,再从侯选关联规则中选出大于最小可信度的关联规则即为期望的规则.同理,从六个2_项频繁集可推出侯选关联规则(guīzé),再从侯选关联规则(guīzé)中选出大于最小可信度的关联规则(guīzé)即为期望的规则(guīzé).SQLServer2005:最低支持:此参数是关联规则的最小支持,低于此值的对象组将会被过滤;最小项集大小:项集的对象数低于此值将会被过滤;最小概率:此参数是关联规则的最小可信度,低于此值的规则将会被过滤;最低重要性:此参数是关联规则的作用度,通过对数的方式(fāngshì)来取得,大于零,指标越大,规则越显著,小于零,指标越小.