您所在位置: 网站首页 / 文档列表 / 数据挖掘与模式识别 / 文档详情
数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年.pdf 立即下载
上传人:17****27 上传时间:2024-09-05 格式:PDF 页数:74 大小:11.2MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年.pdf

数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年.pdf

预览

免费试读已结束,剩余 64 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()答案:关联规则发现2.下列有关SVM说法不正确的是()答案:SVM因为使用了核函数,因此它没有过拟合的风险3.影响聚类算法效果的主要原因有:()答案:特征选取_聚类准则_模式相似性测度4.7、朴素贝叶斯分类器不存在数据平滑问题。()答案:错误5.决策树中包含一下哪些结点答案:内部结点(internalnode)_叶结点(leafnode)_根结点(rootnode)6.标称类型数据的可以利用的数学计算为:答案:众数7.一般,k-NN最近邻方法在(的情况下效果较好)答案:样本较少但典型性好8.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出、P(Y=0)=0.65。剩余的比赛队1胜出、P(Y=1)=0.35。队0获胜的比赛中只有30%在队1的主场、P(X=1|Y=0)=0.3,而队1获胜的比赛中75%是主场获胜、P(X=1|Y=1)=0.75。则队1在主场获胜的概率即P(Y=1|X=1)为:()答案:0.579.一组数据的最小值为12,000,最大值为98,000,利用最小最大规范化将数据规范到[0,1],则73,000规范化的值为:()答案:0.71610.以下哪个分类方法可以较好地避免样本的不平衡问题:()答案:KNN11.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,下列哪些不属于这种聚类类型答案:层次聚类_模糊聚类_非互斥聚类12.数据点密度分布不均会影响K-means聚类的效果。答案:正确13.数据集成需要解决模式集成、实体识别、数据冲突检测等问题答案:正确14.决策树模型中应处理连续型属性数据的方法之一为:根据信息增益选择阈值进行离散化。答案:正确15.数据库中某属性缺失值比较多时,数据清理可以采用忽略元组的方法。答案:错误16.在关联规则中,有三个重要的指标,支持度(support),可信度(confident),作用度(lift),则对于规则X->Y的三个指标说法错误的是(N表示所有的样本item数目):()答案:lift=freq(X,Y)/freq(Y)17.逻辑回归为什么是一个分类算法而不是回归算法?()答案:是由于激活函数sigmod把回归问题转化成了二分类问题18.Apriori算法的计算复杂度受()影响答案:支持度阀值19.下列哪个神经网络结构会发生权重共享()答案:选项A和B20.下列说法错误的是()答案:K-means算法能够解决有离群点的聚类问题21.在训练Lasso回归模型时,训练数据集有N个特征(X1,X2,…,XN)。在模型调优阶段的数据预处理时,无意将某个特征XX扩大了20倍,然后用相同的正则化参数对Lasso回归进行修正。那么,下列说法正确的是?()答案:特征XX很可能还包含在模型之中22.下面哪种情况会影响K-means聚类的效果?()答案:数据中有异常点存在_数据点呈非凸形状分布_数据点密度分布不均23.哪些情况下必须停止树的增长:()答案:当前数据子集为空_没有更多可用属性_当前数据子集的标签一致24.5.利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()ID项集1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可乐答案:啤酒、面包_啤酒、牛奶25.以下几种模型方法属于判别式模型的有()?答案:条件随机场模型_区分度训练26.K-Means算法中的初始中心点,错误的描述是答案:27.贝叶斯分类器是一种()答案:是一种概率预测模型_基于贝叶斯公式的分类器28.下面关于贝叶斯分类器说法正确的是()答案:可以用极大似然估计法解贝叶斯分类器_贝叶斯的思想是“由因推果”29.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。()答案:错误30.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。()答案:
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年

文档大小:11.2MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用

手机号注册 用户名注册
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
登录
手机号登录 微信扫码登录
微信扫一扫登录 账号密码登录

首次登录需关注“豆柴文库”公众号

新用户注册
VIP会员(1亿+VIP文档免费下)
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用