• 1000.42 KB
  • 2023-01-18 11:43:58 发布

对样本数据的频数分析__统计图表的制作抽样调查课

  • 75页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
5对样本数据的频数分析──统计图表的制作 第一节一个单项选择题或填空题的频数分析5.1.1频数分析的题形与数据录入单项选择题〔只能选择一种〕、多项选择题以及主观题。主观选择题的一些处理方式与多项选择题的一些处理方式有些相似之处。数据录入只需要把相应的选择的选项所代表的数据录入,对填空题,要把意思相同或相似的归为一组,并按顺序把这些归纳的组项进行编号,再录入。 第二节多个单项选择题交叉分组下的频数分析5.2.1数据录入根据最终的编号数来设置变量,有多少个编号就设置多少个变量,在录入数据时,被选择的项就用“1〞来表示,没有选择的项就不填写。两分法 5.2.2实例某种商品消费者情况的媒体调查1.您的性别是A男B女2.您的学历是A高中以下B大专C大本D硕士生E博士或博士以上3.您获取商品的信息来源于A电视广告B报纸广告C杂志广告D播送广告E其它分析:很显然,第一、二个问题都是单项选择题,而第三个问题那么是不定项选择题,假设我们调查了20份调查问卷,调查数据可见数据库,其中在第三个问题中,除了已有的选项外,有了被调查者还在其它的上面填写了网上宣传、商家〔或厂家〕的现场促销、亲朋好友的推荐、推销员的推销〕。 首先编码:a.对于第一个题目的选项,设置一个变量,用数据1表示男、用数据0表示女,b.对于第二个问题,设置一个变量,用1表示高中以下、用2表示大专、用3表示大本、用4表示硕士、用5表示博士或博士以上,对于第三个问题,c.设置8个变量〔分别对应电视广告、报纸广告、杂志广告、播送广告、网上宣传、商家〔或厂家〕的现场促销、亲朋好友的推荐、推销员的推销,这里直接用中文表示它们〕,只要有选择,就在相应的数据库上用1表示,没有选择那么不选择〔或0〕。其次,具体调查数据见以下的数据库 单项的频数分析根据上面的数据库,翻开相应的界面,并把性别的这个变量移到右边Variable(s)下面,结果如以下图所示: 按OK,得到以下的分析结果 也可以charts….-ChartType-Piecharts-Continue-OK做饼图,很显然,由SPSS软件生成的图形与由Excel软件生成的图形是根本一致的,但由于用Excel软件生成的图形较容易调节,而且也比较美观,所以一般不由SPSS直接生成,而是借用Excel来完成。 多项选择题非交叉分析方法与单项选择题一个样,每个选项处理一次,然后把所有选项的处理结果合并起来作出一个表格。进入Frequencies的界面,并把把第三题的所有选项都选进右边的变量栏里,按OK按钮,得出如下结果 信息来源调查表单位:%来源电视报纸杂志广播网络商厂促销朋友推销员百分比6545503045504555 更加美观的结果,Excel来画柱状图: 性别和学历的交叉分析 操作流程:同时把性别和学历变量分别移到Row(s)〔表示行〕和Column(s)〔表示列〕下面-----中间子菜单Cells-----取消Counts下的按钮,并在Percentages下选择Total按钮-----Continue按钮回主菜单-----OK 第三节多项选择题的频数分析——多响应变量分析3.1多项选择题的数据编码和变量设置a.多重二分法〔multipledichotomymethod〕,多项选择题的每一个选项看作一个0-1变量,0代表没有被选中,1代表被选中。b.选择项较多,而被调查者最多只选择其中少数几项时,输入数据时容易出错,采取多重分类法〔multiplecategorymethod〕变量个数等于同时选中的选项个数的最大值。每个变量的选项都和多项选择题的选项相同。每个变量代表全体被调查者的一次选择,即记录的是被选中的选项的代码〔相当于先定义列向量,分别表示第一选项、第二选项,….,再赋n个值,每个变量的值填入n个答复者的多项选择题编号〕。 例您购车时,哪些因素会影响你的购车决策。〔允许选择3个答案,而且要求被调查者按主次顺序选出答案,如521,即价格最重要,其次是款式,再次是性能。〕1、性能2-款式3-油耗4-品牌5-价格6-颜色7-其他1.多重分类法编码表〔该表格转置后看,更科学〕变量名变量标签编码方案b1第一选项1-性能2-款式3-油耗4-品牌5-价格6-颜色7-其他b2第二选项1-性能2-款式3-油耗4-品牌5-价格6-颜色7-其他b3第三选项1-性能2-款式3-油耗4-品牌5-价格6-颜色7-其他假设某人同时选择价格、款式、和性能,那么变量b1=5b2=2,b3=1。 2.定义多项选择题的变量集合两种不同的进入方式Analyze-﹥MultipleResponse或者Analyze-﹥Tables-﹥MultipleResponseTablesVariablesinSet:假设按多重二分法编码,将SetDefinition框中的变量放入VariablesinSet框,在VariablesAreCodedAs中选择dichotomies,在Countedvalue右侧框中输入1。假设按多重分类法编码,将SetDefinition框中的变量放入VariablesinSet框,在VariablesAreCodedAs中选择categories,还需要设定取值范围,使在该范围内的记录值纳入分析。一般的取值范围是该多项选择题选项的最大和最小代码〔最小与最大编码数字〕。 3.定义多重反响分析的变量集的名称、名称标签在Name框是输入多项选择题变量集的名称〔英文〕,在Lable框是多项选择题变量集定以一个名称标签〔相应的中文名字〕。此例“GCJCYXYS〞--“购车决策影响因素〞。4.单击Add钮,将定义完成的“变量集〞填加到“多项选择集〞(MultipleResponsesets)中5.单击Close完成多项选择题变量集的定义在SPSS的MultipleResponse,最多可以定义20个多项选择题变量集〔所以,一次问卷调查一般不要超过20个的多项选择题〕。 3.2多项选择题的分析过程频数分析和列联表分析3.2.1生成多项选择题的频数分析表步骤:Analyze-﹥MultipleResponse-﹥Freqencies-﹥MultResponseSets-﹥将分析对象〔本例如购车决策影响因素$GCJCYXYS〕选入右边的Table(s)for框,其他默认,-﹥OK 对170名受访者的调查结果的分析例如购车决策影响因素多项选择题的频数分析表Categorylabel(购车决策影响因素)CodeCountPercengtageofResponses(%)PercengtageofCases(%)性能1499.628.8款式26512.738.2油耗310420.461.2品牌49218.054.1价格515029.488.2颜色6407.823.5其他7102.05.9Totalresponses510100.0300.0 3.2.2多项选择题的列联表分析过程〔Crosstabs〕,产生多重交叉列联表列联表分析可以通过两种不同的方式进入:1、从菜单Analyze-﹥MultipleResponse-﹥Crosstabs进入。2、从菜单Analyze-﹥Tables-﹥MultipleResponseTables进入。列的处理:在MultResponseSets框中,显示已经定义好得多项选择题变量集,把要分析的变量集〔点击标签〕选入Colums框。行的处理:把另外一个选择题的变量放入Rows框,并定义该变量值的范围〔DefineRanges-﹥定义最小值和定义最大值〕-﹥Option子对话框的选择〔一般选择其默认状况〕-﹥OK。 例如sex*$JCSXCrosstabulation$JCSXSEX决策影响因素Total1-性能2-款式3-油耗4-品牌5-价格6-颜色7-其他性别男Count34163533492558%withinsex58.6%27.6%60.3%56.9%84.5%3.4%8.6%女Count15516859101385112%withinsex13.4%45.5%60.7%52.7%90.2%33.9%4.5%TotalCount4967103921504010170 多项选择题答案的排序分析要求被调查者按主次顺序选出假设干答案,此种情况,多项选择题的数据编码和变量设置只能采取multiplecategorymethod。分析结果假设想得到每个选项的交叉列联表,有三种方法:1.从菜单Analyze-﹥MultipleResponse-﹥Crosstabs进入,此时需要把行变量放入Rows框,单击DefineRanges钮,定义最小值与大值,把代表第一重要、第二重要、...,的变量放入Columns框,单击OK钮即可。2.从菜单Analyze-﹥DescriptiveStatistics-﹥Crosstabs进入,把行变量放入Rows框,把代表第一重要、第二重要、...,的变量放入Columns框,单击OK钮即可。3.从菜单Analyze-﹥Tables-﹥MultipleResponseTables进入,把行变量放入Rows框,把代表第一重要变量选入Columns框,单击OK钮得到第一个列联表,然后分别把代表第一重要变量换成第二,第三,...,得到第二个列联表、第三个列联表。注意不能把代表第一重要、第二重要、...,的变量同时选入Columns框。 第四节利用Graphs制作统计图4.1.1SPSS图形功能概述1.SPSS创立图形的一般过程SPSS图形菜单制作图形可分为三个过程:〔1〕建立数据文件,在数据窗口录入数据,或是从其它数据文件中读取数据。〔2〕利用SPSS的Graphs模块或其他过程生成图形。〔3〕修饰生成的图形,新生成的图形往往不符合统计图要素,例如图形题目、标尺的单位等,对其做些调整修饰。 4.1.1SPSS图形功能概述2.图形生成与数据文件结构统计图形的生成与数据文件的结构和类型紧密相关。数据文件结构往往决定着生成图形的类型,即使来自同一资料,整理成不同结构的数据文件,也会生成不同的统计图形 4.1.1SPSS图形功能概述3.图形生成与数据的度量尺度在定义变量时,要在Measure栏中设置其度量尺度(也称为测量水平),其在数据分析中的作用不是很明显,但在用图表生成器(ChartBuilder)绘制图形或绘制交互式图形时却很重要,如果测量水平设置不正确将会影响图形的绘制。例如,在绘制复式条形图时需选择分类变量,分类变量的测量水平只能是名义尺度或定序尺度,对应的变量是数值型或字符型,用数字代表分类〔如,0代表男性,1代表女性〕,当不是这两种测量水平之一时,将不能作为分类变量使用。 4.1.1SPSS图形功能概述4.Graphs各菜单的功能〔1〕图表生成器(ChartBuilder)图表生成器是SPSS14.0forWindows及其以后版本中新添的绘制图形的特色功能,它是由早期版本中Graphs菜单中的Gallery过程开展形成的。其界面如图3.1所示。变量列表框画布区域图形类型选择框 3.1SPSS图形功能概述4.Graphs各菜单的功能〔2〕传统模式创立图形(LegacyChart)利用传统模式创立图形(LegacyChart)是直接生成SPSS图形的主要方式。和交互模式不同的是传统图形的生成模式是以对话框设置的方式创立的,这一点和前面的统计分析功能的对话框操作类似。操作时需要在各级对话框中选择图形的变量,设置变量产生的图形类型和参数以及其他的选项,例如对缺失值的处理等。 4.1.1SPSS图形功能概述4.Graphs各菜单的功能〔3〕交互模式创立图形(Interactive)交互图形是利用SPSS的交互操作方式创立的图形,当生成根本图形以后,还需要对图形做进一步的设置和编辑,以便得到效果满意且具有较高质量的图形。在图形输出窗口中,可以利用图形的交互式功能选择图形的组成元素并编辑和修改它们的属性,例如颜色、填充模式、图形的标题以及位置等。图形的交互操作提高了创立图形的质量,交互式的特点也使得创立图形的灵活性更大。 4.1.2各种统计图的创立1.条形图〔1〕条形图的功能条形图(BarCharts)描述定类或定序变量的分布,用宽度相等直条的高度来表示非连续性资料的数据大小,用于性质相似的数据进行比较。 4.1.2各种统计图的创立1.条形图〔2〕条形图的类型简单条形图(Simple)复合条形图(Clustered)堆栈条形图(Stacked)〔1〕Summariesforgroupsofcases此选项为默认选项。表示统计量按个案分组方式组织,即将根据分组变量对所有个案进行分组,然后根据分组后的个案数据创立条形图〔2〕Summariesofseparatevariable变量分组模式,表示将为每个变量创立条形图〔3〕Valuesofindividualcases个案模式,表示将为分组变量中的每一个个案生成一个条形图,条带的长度表示观测值的大小。当数据文件中包含大量个案时,不适宜用个案模式条形图来描述 4.1.2各种统计图的创立1.条形图〔3〕条形图的生成以复式条形图的生成为例进行说明选择Graph→LegacyDialogs→Bar,弹出上一页图3-2所示的“BarCharts〞对话框,图形类型选择Clustered,条形图模式选择Summariesforgroupsofcases,单击Define按钮弹出如图3-3所示的对话框。图3-3 4.1.2各种统计图的创立1.条形图〔3〕条形图的生成以复式条形图的生成为例进行说明确定分类变量选择复合分类变量确定直条表示(BarsRepresent)的方式和统计量变量列表 4.1.2各种统计图的创立1.条形图〔3〕条形图的生成生成的图形结果如图 4.1.2各种统计图的创立2.线图〔1〕线图的功能线图〔LineCharts〕是用线条的上下波动的形式,来反映连续性的相对资料的变化趋势。它主要用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。 4.1.2各种统计图的创立2.线图〔2〕线图的类型简单线图〔SimpleLineChart〕:用一条折线表示某个现象的变化趋势;多重线图〔MultipleLineChart〕:用多条折线同时表示多种现象的变动趋势;垂直线图〔Drop-lineLineChart〕:反映某些现象在同一时期内差距的统计图。 3.2各种统计图的创立2.线图〔2〕线图的类型 4.1.2各种统计图的创立2.线图〔3〕线图的生成以多重线图的生成为例进行说明选择Graph→LegacyDialogs→Line,弹出上页图3-5所示的LineCharts〔线图〕对话框,选择Multiple〔多重线图〕,DatainChartAre选项组中选择“Summariesofgroupsofcases〞〔个案分组模式〕,单击Define按钮弹出如图3-6所示的对话框。 4.1.2各种统计图的创立2.线图〔3〕线图的生成以多重线图的生成为例进行说明选择分类变量确定折线表示〔LineRepresent〕的方式和统计量 4.1.2各种统计图的创立2.线图〔3〕线图的生成以多重线图的生成为例进行说明生成的图形如下图 4.1.2各种统计图的创立3.饼图〔1〕饼图的功能饼图〔PieCharts〕也称作圆图,是用圆的整体面积代表被研究对象的总体,按各构成局部的比重把圆面积分成假设干个扇形,用以表示对象的局部对总体的比例关系的统计图。 4.1.2各种统计图的创立3.饼图〔2〕饼图的类型Summariesforgroupsofcases个案分组模式;Summariesofseparatevariables变量分组模式;Valuesofindividualcases个案模式。 4.1.2各种统计图的创立3.饼图〔3〕饼图的生成选择分类变量,即定义饼图的分片确定分片代表的含义 4.1.2各种统计图的创立3.饼图〔3〕饼图的生成 4.1.2各种统计图的创立4.上下图〔1〕上下图的功能上下图〔High-LowCharts〕是一种说明某种现象在单位时间内变化情况的统计图,它适合描述每小时、每天、每周等时间内不断波动的市场信息资料。例如股票、商品价格等,上下图既说明某些现象在短时间内的变化,也说明它们长期的变化趋势。 4.1.2各种统计图的创立4.上下图〔2〕上下图的类型〔1〕SimpleHigh-low-close简单上下图。该图利用小方框表示某段时间内的最终数值,用小方框上下的触须表示该段时间内取值的最大值和最小值。这种图形适合用于股票、期货和外汇金融等,它说明每天的最高价格、最低价格和收盘时的价格;〔2〕Clusterhigh-low-close分组上下图。与简单上下图类似,但是它可以同时描述两种或两种以上证券或期货的价格情况;〔3〕Simpleragebar简单极差图。这种图形用长条的长度代表每个时间段最高值与最低值之差;〔4〕Clusteredrangebar分组极差图。与简单极差图类似,但是可以描述两个或两个以上证券或金融的情况〔5〕Differencearea差异区域图。这种图形利用不同的曲线表示同一段时间内的两种不同情况,并且用阴影填充曲线之间的区域。 4.1.2各种统计图的创立4.上下图〔3〕上下图的生成以简单上下图的生成为例进行说明 4.1.2各种统计图的创立4.上下图〔3〕上下图的生成以简单上下图的生成为例进行说明生成的上下图如3-12所示 4.1.2各种统计图的创立5.箱图〔1〕箱图的功能箱图〔Boxplot〕又称为箱线图,它是一种用来描述数据分布的统计图形,它可以用来表示观测数据的中位数、4分位数和极值等描述性统计量,从视觉的角度观测变量值的分布情况。 4.1.2各种统计图的创立5.箱图〔2〕箱图的类型简单箱图复合箱图 4.1.2各种统计图的创立5.箱图〔3〕箱图的生成以简单箱图为例进行说明在选择Simple〔简单箱图〕类型,选择“Summariesofgroupsofcases〞个案分组模式,单击Define按钮,弹出如图的对话框设置:选择分类变量确定绘制箱图的变量 3.2各种统计图的创立5.箱图〔3〕箱图的生成以简单箱图为例进行说明生成的箱图如图3-15所示说明:〔1〕图中每个箱形的含义是:从开始的线段到矩形框包含了1/4的观测数据,从矩形框的低端到矩形框中间的线段包含1/4的观测数据,从这条线到矩形框结束又包含1/4的观测数据,从矩形框结束到顶端的线段包含1/4的观测数据。〔2〕恰有一半的数据位于箱形所在的区域。〔3〕当最小或最大的观测值距箱形的距离比箱形本身的长度要大好几倍时,箱图中箱形外的线并不一定是从最小的观测值开始并到最大的观测值结束。在这种情况下两端用点标上观测值即可,这种值被称为离群值,也就是非正常值。 4.1.2各种统计图的创立6.误差条图〔1〕误差条图的功能误差条图〔ErrorBar〕是一种描述数据总体离散情况分布的统计图形,可以反映数据的离差情况,并且描绘正态分布资料的描述性指标,如均值、标准差,并由此求得参数数值范围、总体均值的置信区间等。 4.1.2各种统计图的创立6.误差条图〔2〕误差条图的类型Simple简单误差条图。对分类轴变量的每个类型生成一个分布误差条形图;Clustered复合误差条图。对分类轴上的变量的每一类型生成一簇误差条形图,每一簇中误差条形图将区分变量显示。 4.1.2各种统计图的创立6.误差条图〔3〕误差条图的生成选择Simple〔简单误差条图〕类型,选择“Summariesofgroupsofcases〞个案分组模式,单击Define按钮,弹出如图的对话框。 4.1.2各种统计图的创立6.误差条图〔3〕误差条图的生成选择分类变量确定绘制误差条图的变量确定误差条图中条带的含义 4.1.2各种统计图的创立6.误差条图〔3〕误差条图的生成生成的误差条图如所示从图中可以观察到各科成绩在置信度为95%的成绩置信区间的误差条图。图中的圆点表示平均数,上下两条横线表示置信区间的上下限和标准误差。 4.1.2各种统计图的创立7.金字塔图〔1〕金字塔图的功能金字塔图〔PopulationPyramid〕,也称人口金字塔图,利用图形直观描述分类变量中不同分类的某种属性在各个区间取值的频数。例如,医疗机构对某种药物进行比照试验,得到服药和没服药的人员的体重数据,我们可以将两类人员体重分布的频数分裂表示成长条状,然后依次罗列在一条坐标纵轴上,形成一塔图形。利用金字塔图可以直观地表示出某种属性的人员的变化规律。 4.1.2各种统计图的创立7.金字塔图〔2〕金字塔图的生成选择Graph→LegacyDialogs→PopulationPyramid,弹出如下图的“DefinePopulationPyramid〞对话框〔1〕选择分类变量和属性变量分类变量是作为拆分金字塔的变量,属性变量是描述分类变量属性的变量〔2〕确定计算频数的方式在“Count〞选项组中确定计算频数的方式,有两个选项:①Computecountsfromdata利用数据计算频数值,此选项为默认选项;②Getcountsfromvariable利用其他变量获得频数值。选择该项,表示频数值保存在某一变量中。 4.1.2各种统计图的创立7.金字塔图〔2〕金字塔图的生成生成的金字塔图形如下图 4.1.2各种统计图的创立8.散点图〔1〕散点图的功能散点图又称散布图或相关图,它是以点的分布反映变量之间相关情况的统计图形,根据图中各点分布走向和密集程度,判定变量之间协变关系的类型。具体创立过程是利用在二维或三维空间中绘制出两个或三个变量确定的点,然后通过这些点的分布特征来显示数据分布特征。 4.1.2各种统计图的创立8.散点图〔1〕散点图的功能散点图又称散布图或相关图,它是以点的分布反映变量之间相关情况的统计图形,根据图中各点分布走向和密集程度,判定变量之间协变关系的类型。具体创立过程是利用在二维或三维空间中绘制出两个或三个变量确定的点,然后通过这些点的分布特征来显示数据分布特征。 4.1.2各种统计图的创立8.散点图〔2〕散点图的类型SimpleScatter简单散点图。描述两个变量之间的关系;OverlayScatter重叠散点图。利用将两幅简单散点图叠加到一张图上的形式同时描述多个变量之间的两两关系;MatrixScatter矩阵散点图。利用类似矩阵的形式,在一张图上同时描述多个变量之间的两两关系;3-DScatter三维散点图。描述三个变量之间的相互关系;SimpleDot简单圆点图。描述一个变量在各个值的分布情况。 4.1.2各种统计图的创立8.散点图〔3〕散点图的生成以重叠散点图的生成为例进行说明确定重叠散点图的配对变量 4.1.2各种统计图的创立8.散点图〔3〕散点图的生成以重叠散点图的生成为例进行说明重叠散点图 第五节统计图的编辑与利用参见第4节 Excel绘制图形有如下重要特点:①功能强大。Excel97、Excel2000、Excel2002均提供了14种标准图表类型,每种图表类型中含有2—7种子图表类型;还有20种自定义图表类型可以套用。②修饰后的图形美观好看。用户可以对图表区、绘图区、数据系列、坐标轴〔标题〕、图例、图表标题的格式,如文字的颜色、字体、大小,图背景图案、颜色等等进行修改调整,使图表爽心悦目。第六节利用Excel绘制统计图 ③图与数据关系密切,具有“即改即可见〞的效果。当图和数据放在一张工作表上时,改变产生图的数据,其图形将发生相应变化;将鼠标放在图中某数据点上,在鼠标下方将弹出一个文本框给出数据点的具体数值;用鼠标单击绘图区中的“数据系列〞标志,其图所属数据单元格将被彩色框线围住,便于用户查看图形的数据引用位置。④图形中也可实现统计功能。在“数据系列〞点击右键可以向散点图、线图、条图等添加趋势线,并可给出趋势线的方程与决定系数。具体例子略