统计图表培训讲义 68页

  • 527.50 KB
  • 2023-01-18 11:44:37 发布

统计图表培训讲义

  • 68页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
统计图表第二章 各种科学研究的结果大多以数据的形式出现,这些直接获得的数据称为原始数据或观测数据,他们纷乱无章,只有经过整理分析才能从中提取出有用的信息构成规律性的知识。 第一节数据的初步整理第二节次数分布表第三节次数分布图第四节其他类型的统计图表 第一节数据的初步整理一、数据排序二、统计分组三、统计表四、统计图 统计图和统计表是两种是对数据进行简化的两种最简单的方式。把统计指标和被说明的事物之间的关系用表格的形式表示就是统计表。〔简明,清晰,准确〕统计图是依据数字资料,应用点、线、画、面、体、色等描绘而成。〔具体形象〕 一、数据排序数据排序〔order〕就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。排列后会使数据之间的某种关系有所显示。数据排序是整理数据最简单的方法。排序方法:升序和降序。 不同数据的排序〔一〕字符型数据汉字按拼音或笔画;英文按字母顺序。〔二〕数值型数据排序后可以划分等级,确定名次。等级的划分要看数据及其所反映的事物本身的性质和研究目的而定。如智商、身高、跑步时间、错误次数等。 二、统计分组所谓统计分组〔grouping〕,就是根据被研究对象的特征,将所得数据划分到各个组别中去。〔一〕统计分组前的准备〔二〕统计分组应注意的问题〔三〕分组的标志 〔一〕统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的根底上。〔如果有充分的理由证明某个数据是受到了过失的影响,可考虑将此数据删除,否那么不能随意删除。对于一些变异性较大的数据,要遵循三个标准差的准那么。〕 〔二〕统计分组应注意的问题1、分组要以被研究对象的本质特征为根底。〔如:智力测验的结果,可按言语智力、操作智力和总的智力分数分类。〕2、分类标志要明确,要能包括所有的数据。 〔三〕分组的标志两种分组:性质类别主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。〔按性别分为男女,按年龄分为老年、中年和青年〕数量类别这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。 三、统计表根本内容表号标题标目数字表注表2.4高一班成绩表 1、线条原那么:越少越好。根本线辅助线顶线横线纵线合计线底线常见错线封口线斜线多余横线×××× 2、标题和表号1〕标题:表的名称要求:简明扼要表B高一班成绩表2〕表号:表的顺序表示方法数字法符号法 3、标目作用:说明统计数字意义纵标目横标目纵标目的总标目横标目总标目标目位置横标目纵标目 原那么阿拉伯数字数位对齐不留空格不带单位或%〔放在标目中〕4、数字意义:统计表的根本语言。空格处理暂缺或未记录:…无数字:—0或极小数:0 5、表注表注表中内容的说明底线下如:﹡表中数据来源于例2-1 标目表号标题(名称)数字心理学研究常用三线表的形式 四、统计图制图要求图形类型 统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。 统计图的根本内容〔一〕制图的根本要求1、图题和图号图题:图的名称要求简明扼要,字体最大图号:图的序号图题和图号之间要空一个汉字与统计表不同,统计图的标题置于图的正下方 等距,左→右,小→大等距,0起点,下→上纵轴:频数,百分频数。图轴横轴〔基线〕:图目内容。2、图目和图轴图目:基线上观察对象的内容类别名称时间成绩统计量等 图形主要内容线条最粗图例图形内容的说明12108642030405060708090100成绩次数 其他图注:补充说明;图轴比例:纵横之比,3:5; 尺度线基线图目图形图2-1某班参加课外学艺人数统计图图号图题图例 第二节次数分布表一.简单次数分布表二.分组次数分布表的编制 次数分布〔frequencydistribution〕显示初步整理后一组数据的分布情况,如:同一观测值出现的次数,每一个分数区间内包含的观测分数的个数,主要表示数据在各个分组区间内的散布情况。 一、简单次数分布表简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。男生26女生24合计50性别n表3高一班成绩表比较适用于按类别分的计数资料 二、分组次数分布表表的编制当一列连续性测量数据的数据个数很多,分数的分布范围又比较大时,就适合使用分组次数分布表了。分组次数分布表〔groupedfrequencytable):当数据量很大时,应把所有的数据先划分为假设干分组区间,然后将数据按其数值大小划归到相应的组别中,分别统计各个组别包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。 〔一〕次数分布表的编制1、求全距(range):全部数据的距离,即极差。Rg=Xmax-Xmin2、定组数〔k〕——分组的个数。和组距(interval)〔i〕——每组包含的数据单位。经验法k:一般10~20;最正确10~16;i:2、3、5、10、20…Rg=98-62=36 计算法:总体正态时K=1.87(N-1)2/5K=1.87(100-1)2/5=11.75≈12i=R/K或i=R+1/ki=36/12=3如何掌握分组的标准? 3、定组限——每组的起止点,也叫分组区间。组限有表述组限和精确组限两种。一组组距为10的分组数据,它们的表述组限为:10~19,20~29,30~39,40~49;它们的精确组限〔实际组限〕为:9.5~19.499,19.5~29.499,29.5~39.499等。组限的三种表达方式:10~19[9.5~19.5〕10~在呈现表格时,一般用表述组限,但对数据进行归类时,一定要按实际组限。 4、登记频数〔frequency〕某事件在某类的数目。方法:选举唱票法。5、次数分布表 计算组中值〔mid-point〕:每组的中点值。次数分布表,第一列为分组区间,第二列为各分组区间的组中值,第三列为次数。 〔二〕分组次数分布表的意义与缺点意义:可将一堆杂乱无序的数据排列成序。缺点:⑴原始数据不见了,根据组中值计算出的平均值和用原始数据计算出的平均值是有出入的。这个误差,我们称为“归组效应〞。〔次数分布表假定各区间的数据分布是均匀的,但实际上并不一定均匀。⑵同一组数据,分组的组距越大,分组越少,误差越大。 三、相对次数分布表96-293-390-487-884-1181-1778-1975-1472-1069-766-363-160-1分组f∑1001.00100.02.03.04.08.11.17.19.14.10.07.03.01.01P234811171914107311P%相对次数是各组的次数f与总次数N的比值。 分组次数分布表与相对次数分布表它们各有不同的用途,既可以单独使用也可以联合使用。当我们主要对各组的绝对次数感兴趣时,我们编制分组次数分布表,如果侧重于各组次数的相比照例结构时,可编制相对次数分布表。 四、累加次数分布表CF〔cumulativefrequency〕意义:上限以下,下限以上方法:向上累加,向下累加 五、双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。有联系的两列变量:同一组被试中每个被试两门学业成绩分数,同一组被试在两种实验条件下获得的结果。 六、不等距次数分布表一般次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别、年龄分组等,假设按等距分组不能确切地反映实际情况,这时可采取不等距分组的方法。 第三节次数分布图次数直方图次数多边图累加次数分布图 一、直方图〔histogram〕直方图是由假设干宽度相等、高度不一的直方长条紧密排列在同一基线上构成的图形。纵轴表示数据的次数f,横轴表示各分组区间的上下限,有时也用组中值表示。纵轴的刻度通常从零开始,横轴的刻度可以从任何适宜的数字开始,但应与数据的分布范围和组距有关。直方长条的宽度直接受组距大小的影响,底边的两端点分别为精确上下限,直方长条的高度由各组的次数决定。 直方图长条的面积表示连续性随机变量次数的分布。直方图下的面积与总次数相等,所以一个直方长条的面积大小与每组的次数分布大小是等价的。如果将总面积定为1,那么,直方图中每一个直方长条的面积就是该直方长条表示的分组内的次数与总次数的比值。 二、次数多边图〔frequencypolygon〕次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图形。直角坐标系的纵坐标表示数据的次数,横坐标表示每个组的组中值。以每个组的次数为纵坐标标点,以相应的组中值为横坐标标点,画出各个点并连接起来,就成为一条折线。为构成闭合多边形和计算面积,可将折线两端分别增加前一组和后一组的组中值点。 12108642030405060708090100成绩次数 次数多边图和直方图都是以面积来表示连续性数据的次数分布,但次数多边图对次数的轮廓显示的更好,组与组之间的次数过渡是连续和直接的。当一批数据个数足够多时,随着分组间距的不断变小,绘制成的次数多边图会越来越连续和光滑,假设分为无数组,就形成一条极其光滑的曲线,这种曲线在统计上称为次数分布曲线。 将简单次数换成相对次数,就可以画出相对次数多边图。优点是可以在一个图上比较多组次数分布〔总次数不同,但组距相同,那么可在一个图里表示两个或两个以上不同总数的次数分布〕。 三.累加次数分布图累加直方图横坐标分组区间,纵坐标是累加次数。可以看出某上限以下的次数或者某下限以上的次数。累加曲线图先同上,标出各交点,再连接各交点。 累加曲线的形状正偏态曲线的上支长于下支,说明大数端各组次数偏少且组数较多,各组次数变化小。负偏态曲线的下支长于上支,说明小数端各组次数偏少且组数较多,各组次数变化小正态曲线上下支相当,说明次数分布的大数端与小数端的分组数目及各组的次数相当,变化也相当。 第四节其他类型的统计图表一、其他常用的统计表类型二、其他常用的统计图的类别 简单表:横标目或纵标目未分组,只列知名称、地点时序或统计指标名称。数值25.037.5赫兹2.8mm178.6ns指标名称人数闪光融合错觉量反响时表2某运动队队员几项心理指标测试结果一、其他常用的统计表类型 分组表标目按一个分类标志分组,也叫单向表。男生26女生24合计50性别n表3高一班成绩表 表4不同年级控制组和实验组成绩的人数分布复合表横标目按两个或两个以上分组标志进行多层分组二年级控制组22153033实验组358525组别优良中差四控制组23134816实验组3329335六控制组25203520实验组36243010 二、其他常用的统计图的类别除了次数分布图,心理与教育统计中常用的统计图还有条形图、线性图、圆形图、散点图等等。条形图圆形图线性图散点图 1、条形图〔barchart)条形图,也叫直条图,主要用于表示离散型的数据资料,即计数资料。它以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图的一个轴为分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据。 简单条形图 分组条形图 分组条形图 分段条形图 绘制条形图要注意以下几点:⑴尺度必须从零点开始,要等距分点。一般不断开,不得已断开时需要在折断处标明。⑵条宽与间隔的比例要适当。宽度与数量大小无关,过宽与过窄影响美观。各直条的宽窄要一致,各条形间的间隔要一致,一般为直条宽度的0.5-1倍比较适宜。⑶直条的排列顺序根据具体情况来定。〔按时间、数量多少、固有序列〕相比较的数目不宜太多。⑷条形的底端和顶端尽量少用数据标签,如数值、系列名称。⑸在分组和分段这种复式条形图中,互相比较的长条拼在一起,不留空隙。各组内的长条排列次序必须一致,以便比较。 条形图与直方图的区别〔1〕描述的数据不同。计数数据;连续性数据。〔2〕表示数据多少的方式不同。长短或上下表示数据的多少和大小;用面积表示。〔3〕坐标轴上标尺分点意义不同。分类轴;刻度值。〔4〕间隔有间隔,但无意义;无任何间隙。 2、圆形图〔circlegraph〕也叫饼图,主要用于描述间断性的资料,目的是显示各局部在总体中所占的比重,资料多以百分数来表示。一般以圆的上方,即时钟的指针在12时的位置的半径为基线。绘制方法求各局部的%求角度数:角度=%×360°圆→扇形各局部从基线按顺时针方向由大而小排列各扇区用线条分开,各扇形内注明简要文字及%,如果不在图中注,也可以在图例中说明。 3.线形图〔linegraph)更多用于连续性资料,可表示两个变量之间的函数关系,或描述某种现象在时间上的开展趋势,或一种现象随另一种现象变化的情况。在心理学中应用较多。 2468101214X1412108642••••••••••4.散点图描述两个变量相关关系的图形 条形图圆形图直方图次数多边图散点图形状离散变量连续变量