如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
2.统计整理2.1统计数据的预处理2.2统计分组2.3次数分布的图示2.1统计数据的预处理2.1.1统计数据的审核▲对直接数据(primarydata)审核—完整性审核♥该调查的单位是否都调查了;♥该调查的项目是否都调查了♥每一项目的答案是否完整—准确性审核♥检查数据内容是否符合实际;♥检查数据是否有错误,计算是否正确—准确性审核的方法▷逻辑检查法:对列名或顺序尺度数据的检查;▷计算检查法:对间隔或比例尺度数据的检查;▲对间接数据(secondarydata)审核—适用性审核♥原数据的来源♥原数据的口径♥原数据的收集背景—时效性审核♥数据有没有滞后♥有无同类最新数据2.1.2统计数据的筛选♥将不符合要求的数据或有明显错误的数据予以纠正或剔除,或对缺失的数据进行估计♥将符合特定要求的数据挑选出来。2.1.3统计数据的排序♥递增排序♥递减排序*排序的目的-发现数据的趋势特征或解决问题的线索;-有利于对数据的检查纠错;-为数据的归类分组提供依据2.2统计分组将全部统计数据按照某一或某些特征分别列入不同的组内。2.2.1统计分组的作用:-区分事物的类型;-研究事物的内部结构;-分析事物之间的相互依存关系。2.2.2统计分组的步骤:—选择分组标志—确定分组界限—编制次数分布表—选择分组标志▷对列名尺度数据与顺序尺度数据的分组-例:见表1、表2、表3表1某班第一次作业成绩分布表单位:人人均国民总收入(美元)表21990年第四次人口普查江苏省人口结构状况分布表单位:万人注:表中数据均来自《江苏统计》(2000)增刊,。表3全国及江苏人口普查总数单位:万人年份全国江苏比重(%)60193.804125.226.8572307.034450.466.15100391.396052.116.03113051.056705.685.932000*126743.00……▷对间隔尺度数据与比例尺度数据的分组.单变量值分组—见表4.组距分组—见表5、6♥确定组数(通常5-15组)♥确定组距♥确定组限♥根据分组将数据整理成次数分布表表4南京审计学院某班学生年龄分布年龄人数比重向上累计(人)(%)比重(%)次数(人)18366319153036182030609648212410050合计50100--表4南京审计学院某班学生年龄分布表例:下列数据是南京审计学院2001级某专业(1)、(2)班学生,课程《概率论与数理统计》的期末考试成绩:—(1)班:8、22、70、83、68、86、63、58、53、65、79、79、84、71、78、84、69、85、81、72、56、62、58、72、69、75、70、95、58、84、79、36、80、78、86、90、61、6、45、52、61、64、54—(2):88、69、84、92、89、82、84、85、52、74、82、91、80、78、95、20、80、26、78、93、71、77、94、62、81、53、68、77、85、76、84、47、79、74、78、84、65、91、88要求:-对两个班学生成绩分别编制次数分布表;-对两个班学生成绩分别绘制茎叶图-对两个班学生成绩用一个公共的茎绘制成茎叶图表5(1)班《概率论与数理统计》成绩统计分数人数比重向上累积(分)(人)(%)人数(人)比重(%)90以上24.743100.080-90920.94195.370-801125.63276.460-70920.92148.855-6049.31227.955以下818.6818.6合计43100.0--(1)班成绩分布茎叶表表6(2)《概率论与数理统计》成绩统计分数人数比重向下累积(分)(人)(%)人数(人)比重(%)90以上615.4615.380-901435.92051.370-801025.63076.960-70410.33487.255-6000.03487.255以下512.839100.0合计39100.0--(2)班成绩分布茎叶表树茎树叶树叶片数20623471523262589471446778889108001224444558891491123456(1)、(2)班成绩分布茎叶表关于组距分组的几个概念-组限(classlimit)-开口组(openedclass):有上限没有下限或有下限没有上限的组-闭口组(closedclass):既有上限又有下限的组-组距(classinterval)=上限–下限(开口组用相邻组组距估计)-组中值(mid