统计表和统计图 73页

  • 1.88 MB
  • 2023-01-18 11:44:33 发布

统计表和统计图

  • 73页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
第二章定量资料的统计描述流行病与卫生统计学教研室乔慧教授 第五节统计表和统计图学习目的和要求学习重点学习难点教学方法授课时数根本内容 本章要求:重点掌握:1.统计表的结构、制表原那么及要求;2.常用的统计图有哪些?它们分别适用于什么资料类型?熟悉理解:统计表和统计图的概念及其作用 1.统计表的正确编制;2.根据资料的性质和分析目的选择最适宜的统计图。重点及难点 本节教学时数1学时 统计分析统计描述统计推断用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述。统计表和统计图是描述资料特征、呈现统计分析结果的重要工具,广泛应用于资料的收集、整理以及研究结果的比照分析。 〔一〕概念:在研究报告和科研论文中,常将统计分析的指标及其结果用表格的形式列出,称为统计表。1防止繁杂的文字表达2使数据条理化,便于计算3便于事物间的比较分析和理解作用:〔二〕一、统计表 〔三〕统计表的结构从外形上看统计表由标题、标目〔包括横标目、纵标目〕、线条、数字及必要的文字说明和备注五局部构成。其形式如下表所示: 顶线底线 表5-1某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病 1、标题位于统计表的上方中央;标题要注明资料收集的时间和地点;标题内容简明扼要,不能过于简单,也不能过于繁琐,而且要与表中内容相符,通常要求标题不超过20个字。 2、标目横标目:位于表的左侧,用来说明各横行数字的涵义,相当于“主语〞纵标目:说明各纵栏数字的涵义,相当于“谓语〞 表4-1某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病 表4-2某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594.03 3.线条包括三条根本线:顶线、底线、纵标目分割线,所以有时我们把统计表也称为“三线表〞;表格中如有合计也用横线隔开;如果在表中有总标目,在总标目和纵标目之间用短横线隔开;表的左上角不宜有斜线,表内不应有竖线,统计表的左右两那么也不应有边线。 4、数字准确无误,用阿拉伯数字表示;同一指标的小数位数要一致,上下要对齐;表内不留空格,数字暂缺或未记录用“…〞表示,无数字用“—〞表示,数字假设是“0〞,那么应填写“0〞;有相对数时,将对应的绝对数也同时列出,以便读者了解和核算。 5、备注表格一般不列备注或其他文字说明,如果需要对某个数字或指标加以说明,可以在数字或指标右上方用“*〞之类的符号标注,并在统计表的下方用文字加以说明。 从内容上看,每张表都有主语和谓语。主语指被研究的事物,一般置于表的左侧〔横标目〕;谓语指说明主语的各项指标,一般置于表的右侧〔纵标目〕,主语和谓语结合起来构成一个完整的句子。 〔四〕统计表的种类简单表:由一组横标目和一组纵标目组成复合表:由一组横标目和两组及以上纵标目结合起来作为“主语〞 将疾病种类、性别和时间结合起来分组,可以反映不同疾病、不同性别以及不同年代的患病率 〔五〕编制统计表的本卷须知简明扼要,重点突出,即一张表只包括一个中心内容,表达一个主题合理安排主语和谓语的位置表线是否过多过密表内数据要认真核对、准确可靠统计表制作是否良好,可以从以上几方面检查: 某医院用麦芽根糖浆治疗慢性肝炎161例,疗效资料如表4-6,指出其缺点并加以改进。表4-6麦芽根糖浆治疗慢性肝炎疗效观察 表4-6存在的问题:1.标题过于简单;2.主谓安排不合理;3.标目组合重复;4.表内出现斜线和竖线; 表4-7某年某医院麦芽根糖浆治疗慢性肝炎的疗效观察 表4-8流行病学有关的主要因素?某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表4-8所示,检查此表编制是否适宜,如不适宜,请指出并修改。 表4-8存在问题:标题不够明确,而且未注明时间、地点。发病季节、年龄和职业三项指标无可比性,放在一起,内容繁杂。标目设计不合理,“人数〞、“%〞屡次重复,不便于比较分析。表内文字和线条过多。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。 表4-9某地1974年钩端螺旋体病患者发病季节分布 表4-10某地1974年钩端螺旋体病患者发病年龄分布 表4-11某地1974年钩端螺旋体病患者发病职业分布 第二节统计图〔statisticalchart〕〔一〕概念:是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种形式。〔二〕作用:统计图比统计表更能直观地表达资料的特征,在科研论文中常被采用。 〔三〕常用统计图:描述定量变量的统计图:直方图、累计频率分布图、箱式图描述定性变量的统计图:百分条图、圆图、线图、统计地图即可描述定量变量又可描述定性变量的统计图:直条图 〔四〕绘制统计图的根本要求1.根据资料的性质和分析的目的选择适当的图形。 2.每一张统计图都要有标题,简明扼要地说明图形要表达的主要内容,必要时应注明资料收集的时间和地点。标题一般位于图的下方。图12005年某地96名妇女产前检查次数分布 3.涉及坐标系的统计图〔条图、散点图、线图和直方图〕要等距说明尺度。条图和直方图纵坐标从0开始。纵横坐标长度的比例一般为5﹕7。线图散点图直方图条图 4.比较不同事物时,宜选用不同的线条或颜色表示,并附图例加以说明。图例 〔五〕常用统计图的绘制方法及本卷须知1、条图〔barchart〕:适用于性质相似而不连续的资料。用等宽直条的长短表示相互独立的各项指标数值大小。可以分为单式条图和复式条图。 1〕单式条图只有一个统计指标,一个分组因素。如图4-1。其中统计指标是三甲医院数,因素指的是不同省市。纵坐标的尺度必须从0开始,否那么会改变各比照组间的比例关系。 2〕复式条图有一个统计指标,两个及以上分组因素。如图4-2,按年龄分老中青三组,每组有两个直条,分别代表男女。无论男女,随着年龄的增大,高血压的患病率增高,各个年龄段男性的患病率均高于女性,但是男女之间患病率的差距随年龄的增加而减小 绘制条图时应注意:1.纵轴表示各个工程相应的数据要等距,而且尺度必须从0开始,否那么会改变各比照组间的比例关系。2.宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽。注意:复式条图中组内各直条排列次序要前后一致,同一组内直条间不留间隙,并加以图例。 2、百分条图(percentbargraph)百分条图:适用于构成比资料。特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。用矩形长条的面积表示事物全部,而用其中各段表示各构成局部。图8两种脱落牙再植效果的比较 绘制百分条图时应注意以下几点:1.将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。2.绘制一直条,长度与标尺一致,以直条的长度表示数量的百分比。3.将直条全长按构成比分为几段,在图上标出各局部构成比的数值,并用图例说明各局部的名称。4.两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,一般为直条宽度的一半。百分条图特别适合作多个构成比的比较 图4-420世纪70年代和80年代某地常见恶性肿瘤发病构成比较图4-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,肺癌明显增加,鼻咽癌和肝癌构成减少 3、圆图(piechart)圆图:是一种构成图,适用于构成比资料。恶性肿瘤、心脏病和呼吸系统疾病为前三位死因。 绘制圆图时注意以下几点:1〕扇形内要注明简要文字和百分比。2〕两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成局部排列次序要一致。 图9某地不同时期居民死因的百分比构成图 图3某地1950--1966年伤寒与结核病死亡率〔1/10万〕变化情况适用于连续性变量的资料。用线段的升降来表示统计指标的变化趋势,如某事物在时间上的开展变化,或某现象随另一现象变迁的情况。4、普通线图linechart 绘制线图时应注意以下几点:1〕横轴代表分组标志,纵轴代表统计指标。横轴和纵轴都是算术尺度横轴和纵轴的刻度都可以不从“0〞开始。2〕相邻两点用直线连接,也就是说线图应按实际数字绘制成折线,而不能任意修改为光滑曲线。3〕同一图内不应绘制太多的曲线,一般不宜超过4-5条。假设有几根线,应用不同颜色或不同图线表示,并附图例说明。4〕在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。 表4-10某地居民1950---1966年伤寒与结核病死亡率〔1/10万〕 图3某地1950--1966年伤寒与结核病死亡率〔1/10万〕变化情况伤寒和结核病的死亡率均逐年下降,伤寒的死亡率低于结核病 5、半对数线图〔semi-logarithmiclinechart) 用来比较两种或多种事物的相对变化速度。在比较几组数据变化速度,特别是两组数据相差悬殊时,宜选用半对数线图。绘制半对数线图时应注意:横轴用算数尺度表示各分组标志,纵轴用对数尺度表示指标数值的大小。 图4某地1950--1966年伤寒与结核病死亡率〔1/10万〕变化情况 图4-7某地1950--1966年伤寒与结核病死亡率〔1/10万〕变化情况普通线图发现两条折线坡度相差悬殊,结核病死亡率折线下降幅度大。这是比照前后死亡率绝对差值得到的印象半对数线图得到伤寒死亡率下降较快的印象,这是对前后死亡率比值得到的印象算术尺度对数尺度,说明的是事物开展的速度 图4-8为利用20对父子身高的绘制的散点图,从散点的趋势中可以看出,父亲身高和儿子身高之间有关联。一般来说,父亲个子高,儿子的个子也较高。6、散点图(scatterdiagram)以点的密集程度和趋势来表示两种现象的相关关系。适用于双变量资料,主要用于相关回归分析。 7、直方图(histogram)适用于连续变量的频数分布资料。常用横轴表示变量〔即被观察对象〕,纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。 绘制直方图应注意以下几点:1.纵轴的刻度必须从“0〞开始,而横轴的刻度可按实际范围制定。2.作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。3.各直条之间不留空隙,可用直线分隔,也可不绘制分隔直线。 8、统计地图(statisticalmap)统计地图主要用于表示某种现象在地域空间上的分布,根据不同地方某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特征,为进一步研究提供线索。图72003年广东省某急性传染病发病数的地理分布 9、箱式图〔boxplot)适用于描述连续型变量的分布特征,一般选用5个描述统计量〔最小值、P25、中位数、P75、最大值〕来绘制。由P25和P75构成箱式图的“箱体〞局部,P25和扣除异常值以外的最小值之间、P75和扣除异常值以外的最大值之间分别构成“箱子〞的上下两条“触须〞。异常值又称离群值,指大于1.5倍四分位数间距的数值,在图中常用圆圈“○〞表示。大于3倍四分位数间距的数值称为极端值,在图中常用星号“﹡〞表示。箱式图分简单〔图4-11〕和复式〔图4-12〕两种。 图4-121985年某省农村120例6~7岁正常男童胸围〔cm〕测量值中位数四分位间距异常值 图4-13某年某地300名中、青年居民收缩压〔mmHg〕分布情况变量分布有偏中年组收缩压高于青年组 常用统计图的比较 欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用〔D〕A普通线图B直方图C条图D半对数线图2.调查某地6-15岁学生近视情况,需描述近视学生的年龄分布可选用〔D〕A普通线图B百分条图C条图D直方图3.比较某地在两个年份几种传染病的发病率可用〔B〕A百分条图B复式条图C线图D直方图练习题 4.表示7岁男孩体重与胸围的关系,宜绘制〔C〕A条图B复式条图C散点图D线图5.关于统计图的制作,正确的表达是〔C〕A统计图的标题放在图的上方B线图中的线条越多越好C条图的纵轴必须从零开始D直方图的组距不必相等 6.表示某地区某年各种死因的构成比,可绘制〔B〕A条图B圆图C直方图D统计地图7.关于统计表的制作,不正确的表达是〔C〕A统计表的标题放在表的上方B统计表包含的内容越多越好C统计表中的数字按小数点位对齐D统计表一般用纵标目和横标目说明数字的意义和单位 思考题:1、统计表和统计图的作用?2、统计表的制表原那么和要求?3、常用的统计图有那些?各适用于什么类型的资料? 谢谢!