- 1.95 MB
- 2023-01-18 11:44:00 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
第二讲描述统计与统计图表的制作
本章内容第一节描述性统计一、频数分析二、描述统计三、探索分析四、Means过程及应用第二节统计图表的制作
数据分析数据中包含大量的信息,以致我们无法全部理解数据的含义。因此,必须用一些方法从数据中提取重要信息并转化成便于使用的形式,这就是数据分析。数据分析通常包含以下三种活动中的一种或多种:1、为数据做一个图〔graph〕;2、为数据制一个表〔table〕;3、从数据中计算〔compute〕出一些东西。
集中量数和差异量数一组变量的次数分布至少有两方面的根本特征:中心位置和离散程度。描述数据集中趋势的统计量称为集中量数。集中量数包括:平均数、中数、众数等。描述数据间彼此差异程度的统计量称为差异量数。差异量数包括:全距、四分位距、平均差、方差、标准差等。
偏度与峰度偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量。偏度为0表示对称;大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值;小于0表示负偏差大(左偏)。峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峰度为0表示与正态分布峰度相同;大于0表示比正态分布缓,平峰;小于0表示比正态分布陡,尖峰。
一、频数分析Analyze→DescriptiveStatistics→Frequencies
百分位数集中量数离散量数数据分布
输出的直方图中带有正态分布曲线
负偏态分布比标准正态分布的峰值略高
二、描述统计Analyze→DescriptiveStatistics→Descriptives将原始分数转换为Z分数
标准得分标准得分是用某一观测值减均值所得的差除以标准差所得的值。不同变量一般有不同的平均数和标准差。在统计上,均值和标准差不同时,一个变量的值不能与另一个变量值相比较。思考:如何比较葡萄和西瓜的大小?
三、探索分析—探索数据中是否存在极值Analyze→DescriptiveStatistics→Explore因变量分组变量标识变量
输出5个最大值,5个最小值
表3-4-1高、低两种焦虑水平组被试人数表
表3-4-2两组被试数学成绩的描述统计表
表3-4-3最大值、最小值统计表
图3-4-7高焦虑组数学成绩茎叶图比方数据78,茎表示为7,叶表示为8,茎宽为10,78=〔7+8×0.1〕×10
图3-4-9两组被试数学成绩的箱图分组变量因变量75%50%25%排除异常值、极值后数据的最大值排除异常值、极值后数据的最小值异常值
三、Means过程及应用—分组计算描述统计量Analyze→CompareMeans→Means因变量(连续性变量)点击next实现分层自变量(分类变量)
表3-5-1被试摘要表
表3-5-2四组被试数学成绩描述统计表
缺失值的处理〔Transform→ReplaceMissingValues〕
第二节统计图表的制作一、条形图(barchart)二、线图(linegraph)三、面积图(arear)四、饼图(circlegraphorpie)五、直方图(histogram)六、概率图〔P-P图和Q-Q图〕
一、条形图〔Graphs→LegacyDialogs→bar〕
双击图表的任意位置,均可对图表做出修改
比较两个班级数学成绩高于80分的男女生数量
二、线图〔Graphs→LegacyDialogs→Line〕
三、面积图〔Graphs→LegacyDialogs→Area〕
四、饼图〔Graphs→LegacyDialogs→Pie〕
五、直方图Graphs→LegacyDialogs→Histogram
六、概率图〔P-P图和Q-Q图〕---检验数据分布Analyse→DescriptiveStatistics→P-PPlots
Analyse→DescriptiveStatistics→Q-QPlots