您所在位置: 网站首页 / 文档列表 / 统计学 / 文档详情
第讲SAS的描述性统计学习教案.pptx 立即下载
上传人:王子****青蛙 上传时间:2024-09-05 格式:PPTX 页数:72 大小:3.5MB 金币:6 举报 版权申诉
预览加载中,请您耐心等待几秒...

第讲SAS的描述性统计学习教案.pptx

第讲SAS的描述性统计学习教案.pptx

预览

免费试读已结束,剩余 62 页请下载文档后查看

6 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

会计学一、统计学的基本概念1.总体与样本总体(population):总体是指所研究对象的全体组成的集合。样本(sample):样本是指从总体中抽取的部分对象(个体)组成的集合。样本中包含(bāohán)个体的个数称为样本容量。容量为n的样本常用n个随机变量X1,X2,…,Xn表示,其观测值(样本数据)则表示为x1,...,xn,为简单起见,有时不加区别。2.参数(cānshù)与统计量参数(cānshù)(parameter):参数(cānshù)是用来描述总体特征的概括性值。如总体平均值(μ)、总体方差(2)、总体比例(π)等。统计量(statistics):统计量是用来描述样本特征的概括性值。如样本均值()、样本方差(s2)、样本比例(P)等。二、表示数据位置的统计(tǒngjì)量如果要用简单的数字来概括一组观测数据x1,...,xn,可以使用“位置统计(tǒngjì)量”来作为数据的总体代表,常见的位置统计(tǒngjì)量有:均值、中位数、分位数、众数等。1.均值(Mean)均值是所有观测值的平均值,是描述数据取值中心位置的一个度量:2.中位数(Median或Med)中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点是它不受个别极端数据的影响(yǐngxiǎng),具有稳健性。中位数的计算方法是:首先将数据从小到大排序为:x(1),...,x(n),然后计算3.众数(Mode)观测值中出现(chūxiàn)最多的数称为众数。众数用得不如均值和中位数普遍。在属性变量分析中,常需考虑频数,因此众数用得多些。4.百分位数(Percentile)分位数也是描述数据分布和位置的统计量。0.5分位数就是中位数,0.75分位数和0.25分位数又分别称为上、下四分位数,并分别记为Q3和Q1。三、表示数据分散(fēnsàn)程度的统计量1.极差(Range)与半极差(Interquartilerange)极差就是数据中的最大值和最小值之间的差:极差=max{xi}–min{xi}上、下四分位数之差Q3–Q1称为四分位极差或半极差,它描述了中间半数观测值的散布情况。2.方差(Variance或Var)方差是由各观测值到均值距离的平方和除以观测量减1:3.标准差(Standarddeviation或StdDev)方差的开方称为标准差:标准差的量纲与原变量一致。4.变异系数(CoefficientofVariation或CV)变异系数是将标准差表示为均值的百分数,是观测(guāncè)数据分散性的一个度量,它在比较用不同单位测量的数据的分散性时是有用的:四、表示数据分布形状的统计量偏度和峰度是描述数据分布形状的指标。1.偏度(skewness)偏度是刻画数据对称(duìchèn)性的指标。偏度的计算公式为:在SAS中:●关于均值对称(duìchèn)的数据其偏度为0;●左侧更为分散的数据,其偏度为负,称为左偏;●右侧更为分散的数据,其偏度为正,称为右偏。2.峰度(kurtosis)峰度描述数据向分布尾端散布的趋势。峰度的计算公式为:利用峰度研究数据分布的形状是以正态分布为标准(假定正态分布的方差与所研究分布的方差相等)比较两端极端数据的分布情况,若●近似于标准正态分布,则峰度接近于零;●尾部较正态分布更分散(fēnsàn),则峰度为正,称为轻尾;●尾部较正态分布更集中,则峰度为负,称为厚尾。五、其它统计(tǒngjì)量1.均值的标准误(StdErrorMean或StdMean或Stderror)2.校正平方和(Correctedsumofsquares)3.未校正(jiàozhèng)平方和(Uncorrectedsumofsquares)4.k阶原点矩其中A1即为均值。5.k阶中心矩第二节在SAS中计算统计(tǒngjì)量用INSIGHT计算统计(tǒngjì)量用“分析家”计算统计(tǒngjì)量编程实现描述性统计(tǒngjì)一、用INSIGHT计算统计量INSIGHT可以非常方便地计算各种统计量。1.实例数据【例2-1】表2-1为两个(liǎnɡɡè)不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。将表2-1中数据通过Excel导入到SAS数据集TT中,4个变量名分别为:ID、R_ID、Income和Outgo,相应的标签名为家庭编号、地区编号、家庭总收入和家庭总支出。家庭编号2.在INSIGHT中打开数据(shùjù)集在菜单中选择“Solution(解决方案)”→“Analysis(分析)”→“InteractiveDa
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

第讲SAS的描述性统计学习教案

文档大小:3.5MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用

手机号注册 用户名注册
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
登录
手机号登录 微信扫码登录
微信扫一扫登录 账号密码登录

首次登录需关注“豆柴文库”公众号

新用户注册
VIP会员(1亿+VIP文档免费下)
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用