晁灵_统计表与统计图 75页

  • 3.43 MB
  • 2023-01-18 11:43:57 发布

晁灵_统计表与统计图

  • 75页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
统计表与统计图晁灵新乡医学院公共卫生学院流行病与卫生统计学教研室 统计表〔statisticaltable〕和统计图〔statisticalchart〕是统计描述的重要工具。医学科学研究资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计图表可以对于数据进行概括、比照或做直观的表达。统计表和统计图不仅便于阅读,而且便于分析比较。 第一节统计表概念:将统计指标用表格的形式列出,称为统计表〔statisticaltable〕。广义的统计表包括调查表、登记表、整理表、计算表及表达最后结果的统计表在内。狭义的统计表是指表达统计结果的统计表。作用:防止繁杂的文字表达便于计算便于事物间的比较分析 例某外科医生统计了32例老年胆道感染死亡病例的死亡相关因素32例胆道感染死亡病例中,有顽固性休克的31例,占所有死亡病例的91.17%;有急性肺衰者30例,占所有死亡病例的88.23%;有急性肾衰者9例,占所有死亡病例的26.47%;有胆源性败血症者10例,占所有死亡病例的29.41%;有急性肝衰的3例,占所有死亡病例的8.82%;有低血钾者20例,占所有死亡病例的58.82%;有代谢性酸中毒者18例,占所有死亡患者的52.95%;多发性肝衰者1例,占所有死亡病例的2.94%。 死亡相关因素例数占死亡人数百分比(%)顽固性休克3191.17急性肺衰3088.23低血钾2058.82代谢性酸中毒1852.94胆源性败血症1029.41急性肾衰926.47急性肝衰38.12多发性肝衰12.94表332例老年胆道感染死亡病例死亡相关因素 一、统计表的结构 从外形上看,统计表由标题、标目〔包括横标目、纵标目〕、线条、数字及和备注5局部构成。其根本格式如表:疾病病例数百分比(%)指定传染病(包括性病)﹡39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00表4-1某地区2004年婚前检查检出疾病情况﹡指定传染病指我国法定的甲、乙、丙三类传染病横标目标题纵标目顶线底线隔线 1.标题:概括说明表的中心内容,要求用词简练、确切。必要时注明资料的时间、地点,写在表的上端中央。注意:防止标题过于简略或过于繁杂,有的甚至不写标题。2.标目:要求文字简明,有单位的标目要注明单位。横标目位于表的左侧,说明各横行数字的含义。纵标目位于表的右侧,向下说明各纵行数字的含义。注意:防止标目过多,层次不清。 3.线条:只需要顶线、底线及纵标目下面与合计上面的横线。注意:线条不宜过多,表的左上角不宜有斜线,表内不能有纵线。4.数字:表内数字一律用阿拉伯数字表示,同一个指标的数字精确度应当一致,表内不宜有空格,数字暂缺或未纪录用“…〞表示,无数字用“—〞表示,数字为0,那么填写0。5.备注:表格一般不列备注或其他文字说明,如有特殊情况需要说明时可用“*〞标出,将文字说明写在表格的下面。 表4-2某地区40岁以上男女居民常见慢性病的患病率〔%〕疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.85胆结石5.885.166.856.46冠心病6.705.894.594.03 从内容上看,每张表都有主语和谓语。主语指被研究的事物,如表4-2中的疾病分组,一般置于表的左侧;谓语指说明主语的各项统计指标,如表4-2中的“男性〞和“女性〞,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表4-2可读成高血脂症患病率男性2004年为33.65、2006年为28.61,女性2004年为34.50、2006年为25.92。 二、统计表的种类根据说明事物的主要标志〔主语〕的复杂程度,统计表可以分成简单表和复合表。1.简单表:只有一种主要标志,即主语按一个标志分组。如表4-12.复合表:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将局部主语放在表的上方与谓语配合起来。如表4-3 表4-3某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析 三、编制统计表应注意的事项1.简明扼要,重点突出即一张表只包括一个中心内容,表达一个主题。2.主谓清楚,层次清楚。即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。简单表只有一个分组标志,一般作为横标目,而纵标目就是统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的那么安排在纵标目上。3.数据准确、可靠。 常见不良统计表统计表过大、内容过多标目设置不合理,导致统计表内容表述混乱线条过多,如出现不必要的竖线、斜线等数字区有空项,同一指标小数位不同、末对齐将备注列于统计表中统计表根本结构中要素缺失 表4-4不同心理分值的冠心病危险因素水平比较 问题将太多的内容放在一个表里,特别是将两种不同类型资料〔计量资料和计数资料〕的统计量放在同一表中。互不相容的内容分别占了不同的列,导致表中有许多空格。纵横标目倒置。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。 处理方法:将该表资料分别制成两个统计表某年某地居民不同心理分值的冠心病危险因素水平比较(X±S) 某年某地居民不同心理分值的冠心病危险因素水平比较 第二节统计图概念:利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料和指标。作用:它将研究对象的特征、内部构成、相互关系、比照情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。医学中常用的统计图有:直条图、百分条图、圆图、普通线图、半对数线图、直方图、箱式图、散点图、统计地图。还有在数据探索性分析中应用的茎叶图、残差图、箱式图,序贯分析的检验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。 一、绘制统计图的根本要求 统计图通常由标题、标目、刻度、图域和图例5局部组成。1.标题:简明扼要地说明资料的内容、时间和地点.一般写在图的下方中央。2.图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条〔实线、虚线、点线〕或颜色表示。图域的高:宽比例习惯上为5:7。 3.标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。4.图例:在比照关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横轴与标题之间。5.刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距说明。 图4-8某工厂职工1994年、1998年四项生理指标异常检出率检出率〔%〕标目图例标题 二、常用统计图的绘制方法及本卷须知 绘制统计图时要根据资料的性质和分析的目的选择适当的图形。1.直条图 直条图〔barchart〕:适用于性质相似而不连续的资料。用等宽的直条的长短来表示各独立指标数值大小和它们之间的比照关系。指标既可以是绝对数,也可以是相对数。为便于比较,被比较的指标一般按大小顺序排列。 条图 条图 表4-10某省某工厂1994、1998年四项检测指标异常检出率检测指标1994年1998年受检人数异常人数检出率(%)受检人数异常人数检出率(%)血压心率TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75:TTT〔麝香草酚浊度试验〕,:GPT〔谷丙转氨酶〕。(丁建生等.中国卫生统计1999;16(3):166)条图 图4-11某工厂职工1994年、1998年四项生理指标异常检出率检出率〔%〕 误差条图:用条图或线图表示均数的根底上,在图中附上标准差的范围。如图。图4-12四种营养素喂养小白鼠三周后所增体重〔克〕 4.绘制条图本卷须知⑴横轴:表示各种被研究的事物或特征.纵轴表示各种被研究事物的相应指标的数值。(2)纵轴的刻度必须从“0〞开始,否那么会改变各比照组间的比例关系。(3)各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条的宽度相等或为直条宽度的一半。(4)复式条图中同一组内的直条间不留间隙 2.百分条图:适用于构成比资料。用矩形长条的面积表示事物全部,而用其中各段表示各构成局部。绘制百分条图时应注意以下几点:将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。将直条全长按构成比分为几段,在图上标出各局部构成比的数值,并用图例说明各局部的名称。两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,一般为直条宽度的一半。 图4-132003年某省各类卫生技术人员构成情况〔%〕单式 百分条图 百分条图图4-14上海市某区居民脑血管病死亡季节分布 3.圆图:是一种构成图,适用于构成比资料。注意以下几点:先绘圆,将构成比乘以3.60,即得各构成局部所占的圆心角的度数。以相当于时钟的9点或12点的位置为起点依次排列各个扇形。扇形内要注明简要文字和百分比。两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成局部排列次序要一致。 图4-152003年某省主要死因构成情况〔%〕恶性肿瘤其他消化系统疾病损伤与中毒呼吸系统疾病脑血管病心脏病 圆图和百分比条图区别圆图(piechart)是以圆形总面积作为100%,将其分割成假设干个扇面表示事物内部各构成局部所占的比例。百分比条图(percentbarchart)是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分比条图适合描述分类变量的构成比资料。 例某年某地进行婴儿死亡原因的调查,根据城市婴儿死因的构成资料绘制成图10-2。从图10-2可见出生窒息是婴儿死亡的首位死因,出生窒息、早产和肺炎头三位死因占总死亡的60.3%,是婴儿死亡防治的重点。 图4-16某年某地城市婴儿死因构成比 例10-6图10-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,鼻咽癌和肝癌构成减少,肺癌明显增加。百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。 图4-1720世纪70年代和80年代某地7常见恶性肿瘤发病构成比较 4.线图〔LineGraph〕用线段的上升和下降来表示某事物在时间上的开展变化或某现象随另一种现象变迁的情况,适用于连续性资料。横轴常用以表示某事物的连续变量,纵轴多表示率、频数或均数。纵轴采用算术尺度,从0开始。如果图形最低点与零点差距很大,那么可在纵轴基部作折断口,使线段高度降低,以求美观。横轴可以不从零开始。如果以组段为单位,坐标点应标在该组段的中点或起点。同一图内不宜有太多线条,以免混淆不清。 5.半对数线图 〔SemilogarithmicLiniGraph〕半对数线图用于表示事物的开展速度〔相比照〕。它是将线图绘制在半对数坐标纸上,其纵轴用对数尺度,横轴仍用算术尺度。常用于比较两组相对数的比值相差较大的动态数列,或欲表示的数值相差悬殊时。半对数图的纵坐标没有0点。起点为…,0.1,1,10,…,等。从0.1~1,1~10,10~100等各单元距离相同,但同一单元内尺度不等距,可根据需要标出相应的尺度。 时间伤寒结核病19503618019522516019542114019561612519585103196037819621.56819640.85219660.338表4-18某地1950-1966伤寒与结核病死亡率〔1/10万〕 〔b)〔a)某地1950年-1966年伤寒与结核病死亡率〔1/10万〕(a)纵轴为算术尺度;(b)纵轴为对数尺度。下降幅度:结核病死亡率:180-38=142伤寒死亡率:36-0.3=35.7下降速度:结核病死亡率:180/38=4.65伤寒死亡率:36/0.3=120 注意:在普通线图中,结核病死亡率折线的坡度比伤寒死亡率折线下降的陡峭,只能说明两种疾病的死亡率逐年变化幅度不同,不能错认为结核病死亡率的下降速度比伤寒死亡率的下降速度快。在半对数线图中就不会出现这种错觉。在比较事物间的变化速度时,应选择半对数线图。 例调查某地1997年~2001年两种与性传播有关疾病—艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。 1997~2001年某地艾滋病和梅毒发病率的变化趋势(a)纵轴为算术尺度;(b)纵轴为对数尺度。年份〔a)年份〔b)3.766.270.00690.0468 普通线图显示梅毒的增长幅度较大(3.76~6.27/10万)。半对数线图那么显示艾滋病的增长速度更快〔0.0069~0.0468/10万〕,约7倍。 绝对差与相比照的比较图4-绝对差示意图(算术格纸)数值时间图4-相对比示意图(半对数格纸)数值时间 6.散点图用于双变量资料,表示两种现象之间的相互关系。体重(kg),x肺活量(),YL十名女中学生体重与肺活量散点图 7.直方图〔histogram〕适用于连续变量的频数分布资料。常用横轴表示变量〔即被观察对象〕,纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。 绘制直方图应注意以下几点:纵轴的刻度必须从“0〞开始,而横轴的刻度可按实际范围制定。作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。如果各组段的组距不同,必须换算成等距后才能作图。 表×年×市流行性乙型脑炎患者的年龄分布年龄组(岁)人数每岁患者人数0~1~2~3~4~5~6~7~8~9~10~20~30~40~50~339112322111486361311413391123221114863.61.31.10.40.1合计175—7.直方图〔Histogram〕 图8-10流行性乙型脑炎患者的年龄分布7.直方图〔Histogram〕 8.统计地图〔statisticalmap〕表示某现象的数量在地域上的分布,可用不同的点、线、颜色等在地图上表现出来。四川省部分县男性居民食管癌死亡率地图 2003年广东省某急性传染病发病数的地理分布图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区 9.箱式图〔boxplot〕用于比较两组或多组数据的直观比较分析,描述其分布特征。一般选用5个描述统计量〔最小值、P25、中位数、P75、最大值〕来绘制。显然箱子越长,数据变异程度越大。中间横线在箱子中点说明分布对称,否那么不对称。 根据资料类型及分析目的选用图形 思考题统计图与统计表有什么联系与区别?常用的统计图有哪些?各适用于什么类型资料?哪些统计图的纵轴尺度必须从0开始,举例说明其原因?