您所在位置: 网站首页 / 文档列表 / 统计学 / 文档详情
多元统计分析建模.ppt 立即下载
上传人:天马****23 上传时间:2024-09-06 格式:PPT 页数:46 大小:2.2MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

多元统计分析建模.ppt

多元统计分析建模.ppt

预览

免费试读已结束,剩余 36 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

目录Box-Cox变换是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况。比如在使用线性回归的时候,由于残差不符合正态分布而不满足建模的条件,这时候要对响应变量进行变换,把数据变成正态的。在MATLAB中,上述变换的命令如下:[t,l]=boxcox(x)其中x是原始数据(列向量),t是变换以后的数据,l是变换公式中参数的数值QQ图的作用用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于正态分布。把已知分布的分位数标在纵轴上,样本分位数标在横轴上,从图形上可以了解到分布的信息。图形是直线说明是正态分布。图形中有一段是直线,在两端存在弧度,说明峰度的情况。图形是曲线图,说明不对称。如果Q-Q图是直线,当该直线成45度角并穿过原点时,说明分布与给定的正态分布完全一样。如果是成45度角但不穿过原点,说明均值与给定的正态分布不同,如果是直线但不是45度角,说明均值与方差都与给定的分布不同。如果Q-Q图中间部分是直线,但是右边在直线下面,左边在直线上面,说明分布的峰度大于3,反之说明峰度小于3.从图上可以看出散点并不聚集在直线上,因此流域成灾面积(原始数据)不服从正态分布,这一点也可以通过jbtest检验来证实.但是通过变换以后的图形如图2所示,显然数据服从正态分布.下面以人均粮食支出x1为例,进行正态检验。例2做出x1,x3的散点图,可否区别开?[y3,t3]=boxcox(a(:,3));[y1,t1]=boxcox(a(:,1));plot(y3,'+'),holdon,plot(y1,'or'),legend('y3','y1')2.其他变换公式模糊交集与模糊并集二例3.2007年安徽省各地市工业企业效益指标如下表所示,请利用模糊C均值聚类方法分为三类。b=[39.63,…];%输入数据作为一个矩阵[center,U,fcn]=fcm(b,3);%模糊C均值聚类U=0.80820.00410.00220.00030.01220.01030.00710.00800.00100.11540.94790.02480.00470.58270.31440.95790.85230.01610.07640.04800.97300.99500.40510.67530.03510.13960.98290.98610.00640.88960.00470.70690.01170.04670.01050.00910.14820.07520.09870.20460.09440.84570.08720.00480.84540.03530.89660.08850.89390.10760.9023表4.2001-2005年灾情数据主成分分析1.主成分的基本思想求l1使var(Y1)取最大值,由此l1所确定的随机变量Y1称为随机变量的第一主成分.一般地,求第i个主成分Yi,则要求其系数及主成分满足以下条件:①无量纲化地区解:首先输入数据A=[data];%data即表中数据R=corrcoef(A);w=sum(d)/sum(sum(d));%计算贡献率F=[A-ones(17,1)*mean(A)]*v(:,5);%计算主成分得分[F1,I1]=sort(F,'descend');%I1给出各名次的序号[F2,I2]=sort(I1);%I2给出各市排名地区3.因子载荷矩阵典型相关分析图4.7典型相关分析示意图1.总体典型变量的定义根据典型相关的思想,分别考虑X,Y的线性组合在约束条件a1T11a1=b1T22b1=1下,求一般地,若前k-1对典型变量还不足以反映X,Y之间的相关性,还可构造第k对线性组合:2.总体典型变量与典型相关系数的计算3.典型相关分析的Matlab实现③计算典型相关向量检验程序如下:例4.选取1980-2008年安徽省人均粮食总产量(吨/人)、人均农业总产值(亿元/万人)、,人均粮食播种面积(千公顷/万人)、人均农业机械总动力(千瓦/人)、单位面积化肥施用(万吨/千公顷)、人均受灾面积(千公顷/万人)以及农业生产资料价格指数指标,分别记为:x1,x2,x3,y1,y2,y3,y4年份我们采用模糊C均值聚类方法进行分类%典型相关分析程序R=cov(b);p=3;q=m-p;X=b(:,1:p);Y=b(:,p+1:m);[A,B,r,U,V,stats]=canoncorr(X,Y);练习:(1)根据模糊C均值聚类的中心坐标,分析安徽省三个不同时间段粮食生产状况。(2)根据典型相关分析程序输出的结果,写出典型相关系数与典型相关变量,分析(人均粮食总产量,人均农业总产值,人均粮食播种面积)
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

多元统计分析建模

文档大小:2.2MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用

手机号注册 用户名注册
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
登录
手机号登录 微信扫码登录
微信扫一扫登录 账号密码登录

首次登录需关注“豆柴文库”公众号

新用户注册
VIP会员(1亿+VIP文档免费下)
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用