• 2.21 MB
  • 2023-01-18 11:44:38 发布

统计图表_数据的数字特征和用样本估计总体(PPT84页)

  • 84页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
第二节统计图表、数据的数字特征和用样本估计总体 4.会用样本的频率分布估计总体分布,会用样本的根本数字特征估计总体的根本数字特征,理解用样本估计总体的思想.5.会用随机抽样的根本方法和样本估计总体的思想解决一些简单的实际问题. 1.(2021·四川理,1)有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18[27.5,31.5) 11[31.5,35.5)12[35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是(  ) 2.假设某校高一年级8个班参加合唱比赛的得分如茎叶图所示,那么这组数据的中位数和平均数分别是(  ) A.91.5和91.5     B.91.5和92C.91和91.5D.92和92[答案]A 3.(文)(2021·山东文)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )A.92,2B.92,2.8C.93,2D.93,2.8[答案] B (理)如图,是2021年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )A.84,4.84  B.84,1.6C.85,1.6D.85,4[答案] C 4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样的方法抽出200人作进一步调查,其中低于1500元的称为低收入者,高于3000元的称为高收入者,那么应在低收入者和高收入者中分别抽取的人数是(  ) [答案]C[解析]由图可知,低收入者的频率是0.0002×500=0.1,故应在低收入者中抽取200×0.1=20人;高收入者的频率是(0.0003+0.0001)×500=0.2,故应在高收入者中抽取200×0.2=40人. 5.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如右图所示,那么在抽样的100根中,有________根棉花纤维的长度小于20mm.[答案] 30 [解析] 此题主要考查频率分布直方图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.由题意知,棉花纤维的长度小于20mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20mm的有0.3×100=30(根). 6.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g):492 496 494 495 498 497 501 502 504 496497 503 506 508 507 492 496 500 501 499根据用频率分布估计总体分布的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g之间的概率约为________.[答案]0.25 7.为了了解高一女生的体能情况,我校抽取局部学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为1:2:87:4:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)假设次数在120以上(含120次)为优秀,试估计该学校全体高一学生的优秀率是多少? 频率分布直方图 (1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率. [解析](1)样本频率分布表如下:寿命(h)频数频率100~200200.10200~300300.15300~400800.40400~500400.20500~600300.15合计2001 (2)频率分布直方图 (3)由频率分布表可以看出,寿命在100h~400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h~400h的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35. [点评] 解决总体分布估计问题的一般程序为:当总体中所取不同的数值较少时,常用条形图表示相应样本的频率分布,否那么常用频率分布直方图表示相应样本的频率分布,具体步骤为: 组别频数频率145.5~149.510.02149.5~153.540.08153.5~157.5200.40157.5~161.5150.30161.5~165.580.16165.5~169.5mn合计MN (3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1,由此可以估计样本数据落在某个区间的频率或概率或者总体的数字特征. 茎叶图 [点评] 从茎叶图可看出,甲车间产品重量主要集中在98~103之间,而乙车间产品重量分布那么较分散,故不计算方差也可直观作出判断:甲车间产品较稳定. 用样本分布估计总体的分布 (1)把上述数据分组,列出频率分布表;(2)根据(1)的结果画频率分布直方图和频率分布折线图;(3)结合上面的描述,分析该年度香皂销售的分布情况. [解析](1)频率分布表如下: [点评](1)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(2)用样本的频率分布可以估计相应的概率分布. 分组[500,900)[900,1100)[1100,1300)[1300,1500)[1500,1700)[1700,1900)[1900,+∞)频数4812120822319316542频率 (1)将各组的频率填入表中;(2)根据上述统计结果,计算灯管使用寿命缺乏1500小时的频率. [解析] (1)(2)由(1)可得0.048+0.121+0.208+0.233=0.6,所以灯管使用寿命缺乏1500小时的频率为0.6.分组[500,900)[900,1100)[1100,1300)[1300,1500)[1500,1700)[1700,1900)[1900,+∞)频数4812120822319316542频率0.0480.1210.2080.2230.1930.1650.042 用样本的数字特征估计总体的数字特征 [点评](1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小. (2)由s>s可知乙的成绩较稳定.从折线图看,甲成绩根本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩那么无明显提高. 1.不要把直方图错画为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度.连续随机变量在某一点上是没有频率的. 2.用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计. 3.几种表示频率分布的方法的优点与缺乏;(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地说明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了. (3)频率折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据数较多时,茎叶图显得不太方便了. 4.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.