您所在位置: 网站首页 / 文档列表 / 数据结构与算法 / 文档详情
基于weka的数据分类和聚类分析实验报告.doc 立即下载
上传人:王子****青蛙 上传时间:2024-09-09 格式:DOC 页数:11 大小:1.5MB 金币:6 举报 版权申诉
预览加载中,请您耐心等待几秒...

基于weka的数据分类和聚类分析实验报告.doc

基于weka的数据分类和聚类分析实验报告.doc

预览

免费试读已结束,剩余 1 页请下载文档后查看

6 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于weka得数据分类分析实验报告1实验基本内容本实验得基本内容就是通过使用weka中得三种常见分类与聚类方法(决策树J48、KNN与k—means)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试与评价,找出各个模型最优得参数值,并对三个模型进行全面评价比较,得到一个最好得分类模型以及该模型所有设置得最优参数。最后使用这些参数以及训练集与校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。2数据得准备及预处理2、1格式转换方法(1)打开“data02、xls”另存为CSV类型,得到“data02、csv”.(2)在WEKA中提供了一个“ArffViewer”模块,打开一个“data02、csv"进行浏览,然后另存为ARFF文件,得到“data02、arff”。。3、实验过程及结果截图3、1决策树分类(1)决策树分类用“Explorer"打开数据“data02、arff”,然后切换到“Classify”.点击“Choose",选择算法“trees—J48”,再在“Testoptions"选择“Cross-validation(Flods=10)”,点击“Start”,开始运行。系统默认trees—J48决策树算法中minNumObj=2,得到如下结果===Summary===CorrectlyClassifiedInstances2388、4615%IncorrectlyClassifiedInstances311、5385%Kappastatistic0、7636Meanabsoluteerror0、141Rootmeansquarederror0、3255Relativeabsoluteerror30、7368%Rootrelativesquarederror68、0307%TotalNumberofInstances26===DetailedAccuracyByClass===TPRateFPRatePrecisionRecallF-MeasureROCAreaClass0、824010、8240、9030、892N10、1760、7510、8570、892YWeightedAvg、0、8850、0610、9130、8850、8870、892===ConfusionMatrix===ab<-—classifiedas143|a=N09|b=Y使用不同得参数准确率比较:minNumObj2345CorrectlyClassifiedInstances23(88、4615%)22(84、6154%)23(88、4615%)23(88、4615%)由上表,可知minNumObj为2时,准确率最高。根据测试数集,利用准确率最高得模型得到得结果:分析说明:在用J48对数据集进行分类时采用了10折交叉验证(Folds=10)来选择与评估模型,其中属性值有两个Y,N。一部分结果如下:CorrectlyClassifiedInstances2388、4615%IncorrectlyClassifiedInstances311、5385%===ConfusionMatrix===ab<--classifiedas143|a=N09|b=Y这个矩阵就是说,原来就是“Y”得实例,有14个被正确得预测为“Y”,有3个错误得预测成了“N”。原本就是“NO”得实例有0个被正确得预测成为“Y",有9个正确得预测成了“N”。“14+3+0+9=26"就是实例得总数,而(14+9)/26=0、884615正好就是正确分类得实例所占比例.这个矩阵对角线上得数字越大,说明预测得越好。(2)K最近邻分类算法用“Explorer"打开数据“data02、arff",然后切换到“Classify”.点击“Choose”,选择算法“lazy-IBk”,再在“Testoptions”选择“Cross—validation(Flods=10)”,点击“Start”,开始运行。训练结果:系统默认lazy—IBkK最近邻分类算法中KNN=1,得到如下结果===Summary===CorrectlyClassifiedInstances2076、9231%IncorrectlyClassifiedInstances623、0769%Kappastatistic0、4902Meanabsoluteerror0、252Rootmeansquarederror0、4626Relativeabsoluteerror54、9136%Rootrelativesquarederror96、694%TotalNumberofInsta
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

基于weka的数据分类和聚类分析实验报告

文档大小:1.5MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用

手机号注册 用户名注册
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
登录
手机号登录 微信扫码登录
微信扫一扫登录 账号密码登录

首次登录需关注“豆柴文库”公众号

新用户注册
VIP会员(1亿+VIP文档免费下)
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用