高等统计学考题人大精简版

发布时间:2020-09-09 来源: 实习报告 点击:

 高等统计学考题人大精简版 题 一、多项选择题(每题 4 分,一共 20 分,每题要求:选择正确答案,对选择或未选答案进行简要而清晰的原因解释。将答案填写在答题纸上,填写在试题上无效。得分规则:选对得 并对答案解释合理,得 4 分;没有对未选答案解释最多得 2 分;漏选得 1 分,选错可参考得 解释酌情给分;不选得 0 分)

 1 .有关样本的分布,以下陈述正确的是:ABC A. 如果样本 X 1 ,…,X n 独立同分布来自 Gamma 分布, ???niiXnX11在大样本下有近似的正态分布; 【对。满足中央极限定理条件】

 B.如果样本 X 1 ,…,X n 独立同分布来自 N(2, ? ?), ???niiXnX11在大样本情况下有精确分布 N( n / ,2? ?); 【对。独立同分布正态随机变量的均值仍是正态分布,方差值符合中央极限定理】

 C.如果样本 X 1 ,…,X n 独立同分布来自 N(2, ? ?),即使样本量不大, ???niiXnX11也服从正态分布; 【对。独立同分布正态随机变量的均值仍是正态分布】

 D.如果样本 X 1 ,…,X n 来自任意分布,在大样本情况下,由 X 1 ,…,X n 组成的数据有近似的正态分布; 【错。如果 X 1 ,…,X n 强相关,则不成立;即使 i.i.d 情况下也不是任意的数据组成方式都是正态分布】

  2 .有关检验的 p 值,下面说法正确的是:C

 A. 一般为[0,0.1]之间的一个很小的概率; 【错。p 值是计算得出的概率,取值 0-1 之间】

 B. 接受备择假设的最小显著性水平; 【错。接受备择假设说法不准确】

 C. 如果 p 值小于显著性水平,则拒绝零假设;

 【对。符合假设检验规则】

 D. 样本统计量的分布函数。

 【错。p 值根据检验统计量分布函数计算得出】

 卷 (卷 3 )5.有关检验的 p 值,下面说法正确的是:CD A. 一般为[0,0.1]之间一个较小的概率; 【错。检验结果不拒绝原假设的情况下,p 值较大】

 B. 接受备择假设的最小显著性水平; 【错。接受备择假设说法不准确】

 C. 如果 p 值小于显著性水平,则拒绝零假设;

 【对。符合假设检验规则】

 D. 样本统计量的尾概率。

 【对。可认为 p 值是原假设为真时小于等于实际观测结果的概率】

 3 .请问以下哪些方法可以用来判断数据可能背离正态分布:

 A. Q-Q 图上,如果数据和基线之间几乎吻合; 【错。正态 qq 图数据和基线之间几乎吻合说明数据接近正态分布】

 B. Kolmogrov-Smirnov 正态检验中的统计量所对应的 p 值小于 0.05; 【对。ks 正态检验原假设是两个数据分布一致或者数据符合正态分布,p 值小于 0.05拒绝原假设】

 C.对数据直方图做光滑后没有发现数据有很大的发散趋势; 【错。发散趋势不能决定分布形态】

 D.2? 拟合优度检验,统计量的值偏小。

 【错。2? 拟合优度检验可以检验分布是否正态,原假设为观测服从给定概率值的多项分布,统计量的值偏小不拒绝原假设】

 4 .若抽样误差为 5,总体标准差为 40,如果样本量足够大,正态分布的 0.975 分位数近似为 2,要估计总体均值的 95%的置信区间所需要的样本量大概为:

 A

 156;B 256;C 356 ; d) 456. 因 ???−????√??~??(0,1),那么 2 =540/√?? ,求解 n=256

 5 .关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:D

 A.单边检验拒绝,双边检验一定拒绝;【错,】

 B.双边检验接受,一定有一个单边检验是拒绝的;【错】

 C.单边检验拒绝,双边检验一定拒绝。【错】

 D.双边检验拒绝,一定有一个单边检验是拒绝的;【对】

 画图解释

  6 .某汽车生产厂家为增加某型号汽车的销售量,采用促销手段,促销一个月后,分别收集了 8 个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C 销售点代号:1 2 3 4 5 6

  7

 8 促销前(辆): 90 83 105 97 110 78

 55

 123

 促销后(辆): 97 80 110 93 123 84

 57

 110

 A. 两样本 Z 检验 B. 两样本 t 检验 C. 单一样本 t 检验 D. 单一样本 Z 检验 本问题是配对样本之间的比较,小样本,方差未知,采用单一样本的 t 检验,其他都不符合。

 7 .在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是该统计量随着样本量的增大,它与它估计的总体参数越来越近,这种评价标准称为:

 A.无偏性

 B.有效性

 C. 一致性

  D.充分性 无偏性指估计量的期望与总体参数相等 充分性指估计量包含了参数的全部信息 有效性指无偏估计量的方差达到 C-R 下界

 8 .研究人员对有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量进行研究,经验表明有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量测量方差相等,测得如下试验数据:

 糖尿病老鼠:9 只,样本均值 64.26,样本方差 1.40

 正常老鼠:

 7 只,样本均值 75.66,样本方差 1.32 在置信水平为 0.10 之下,有糖尿病的老鼠和正常老鼠血液中 Fe 的含量之差的置信区间为(t(0.95,14)=1.76):

 A. [5.68,15.56] B. [8.02,19.47] C.[10.36,12.43] D.[6.53,16.32] 有 t =(??? − ???) − (?? ?? − ?? ?? )?? ?? √ 1??+1?? 其中 S ?? 2 =(?? − 1)?? ?? + (?? − 1)?? ???? + ?? − 2 代入计算[(75.66 − 64.26) ± 1.76 × √( 19+17 )((9−1)×1.4+(7−1)×1.329+7−2)]可得。

  9 .置信水平为 α,下列说法正确的是(BD

  ), A 在置信水平一定的条件下,提高置信估计精度需要缩小样本量; B 在置信水平一定的条件下,提高置信估计精度需要增加样本量; C 在样本量一定的条件下,提高置信估计精度,需要降低置信水平; D 在样本量一定的条件下,提高置信估计精度,需要增大置信水平。

 以置信区间X? ± Z(1 − α/2)??√??为例,增大 n 或者增大α可缩小区间长度。

 10 .某调查公司接受委托满意度调查,满意度分数在 0~20 之间,随机抽取 36 名消费者,平均满意分 12,标准差 3,在大样本的假设下,根据调查结果对总体平均满意情况的 95%的置信区间,结果是:B A. 9~15 分 B. 11~13 分 分 C. 12~14 分 D. 6~18 分 因为:

 12 − ??3√36~??(0,1) 可得 11<μ<13

 11 .一位社会学者随机抽取 3000 个家庭,想研究文化程度的高低与离婚率的高低是否有关,适合采用的检验方法应是( D

  )

 A. 正态分布检验

  B. t 分布检验

  C. 2? 拟合优度检验

  D. 2? 独立性度检验 正态分布检验:检验均值是否相等,不符合题目条件 t 分布检验:检验均值是否相等,不符合题目条件

 卡方拟合优度检验:检验两种分布是否相同,不符合题目条件 卡方独立性度检验:检验列联表的行与列是否独立,与题目吻合 12 .在假设检验中,备择假设所表达的含义总是指()

 A.参数是正确的 B.变量之间没有关系 C.参数没有发生变化 D.参数发生了变化

  13 .在估计某一总体的均值时,随机抽取了 n 个单元作样本,用样本均值作为估计量,在构造置信区间时,发现置信区间太宽,有可能的原因是:BD A. 选择的估计量有偏 B. 样本量太小 C. 置信水平太大,应从 0.10 降低到 0.05 D. 精度要求太高 以置信区间X? ± Z(1 − α/2)??√??为例,增大 n 或者增大α可缩小区间长度。

 14 .指出下列的说法哪一个是正确的(BD

  )

 A 在置信水平一定的条件下,要提高可靠性,就应该缩小样本量; B 在置信水平一定的条件下,要提高可靠性,就应该增大样本量; C 在样本量一定的条件下,要提高可靠性,就降低置信水平; D 在样本量一定的条件下,要提高可靠性,就提高置信水平。

 以置信区间 X ?±Z(1-α/2)σ/√n 为例,增大 n 或者增大α可缩小区间长度。

 15 .在假设检验中,备择假设所表达的含义总是指(?)

 A.参数是正确的

 B.变量之间没有关系 C.参数没有发生变化 D.参数发生了变化

 16 .某汽车生产厂家为增加某型号汽车的销售量,采用促销手段,促销一个月后,分别收集了 8 个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C 销售点代号:1 2 3 4 5 6

  7

 8 促销前(辆): 90 83 105 97 110 78

 55

 123

 促销后(辆): 97 80 110 93 123 84

 57

 110

 A. 如果样本X 1 ,…,X

 n 独立同分布来自 N(21 ,? ? ),Y 1 ,…,Y n 独立同分布来自 N(22 ,? ? ), X Y ?在大样本下有近似的正态分布,可以检验0 1 2: H ? ? ? ; B. 如果样本X 1 ,…,X

 n 独立同分布来自N(21 ,? ? ),Y 1 ,…,Y n 独立同分布来自N(22 ,? ? ),i iX Y ?在大样本下有正态分布,可以检验0 1 2: H ? ? ? ;

 C. 如果样本 X 1 ,…,X

 n 独立同分布来自 N(21 ,? ? ),Y 1 ,…,Y n 独立同分布来自 N(22 ,? ? ), X Y ?有 t 分布,可以检验0 1 2: H ? ? ? ; D. 如果样本X 1 ,…,X

 n 独立同分布来自 N(21 ,? ? ),Y 1 ,…,Y n 独立同分布来自 N(22 ,? ? ), X Y ?有2? 分布,可以检验0 1 2: H ? ? ? ; 本题为配对样本均值比较问题,只有 C 符合检验该问题。

 二、简答题:(10 分×3=30 分)

 1.假设检验的零假设和备择假设的设立对于检验的结论影响不大,请问这样的理解有问题吗?请给出你的解释。

 答:有问题。首先,设立某种零假设即设定了检验统计量,代表着确定了零分布,即 p 值计算依据;另外,零假设和备择假设是不对称的,通常将简单的假设、需要被保护的假设作为零假设。

 2. 解释下面符号的区别:

 2s , 2? 和2X? (提示:请按有放回和无放回抽样分别叙述)

 有放回 无放回 2s :样本方差 1?? − 1∑(?? ?? − ???) 2????=1 1?? − 1∑(?? ?? − ???) 2????=1 2? :总体方差 1??∑(?? ?? − ??) 2????=1 1??∑(?? ?? − ??) 2????=1 2X? :样本均值的方差 ?? 2?? ?? 2??(1 −?? − 1?? − 1 )

 3.统计推断与描述统计之间有哪些重要的区别? 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。

 推断统计是研究如何利用样本数据来推断总体特征的统计学方法,其内容包括参数估计和假设检验两大类。参数估计是利用样本信息推断总体特征,假设检验是利用样本信息判断对总体的假设是否成立。

  4.解释 p 值检验的基本原理。

 P 值即概率,在原假设为真的前提下出现观察样本以及更极端情况的概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的 P 值,一般以 P < 0.05 为显著, P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于 0.05 或 0.01。实际上,P 值不能赋予数据任何重要性,只能说明某事件发生的机率

 5.【负责人:3.1】请说明 Gamma 分布与卡方分布之间有哪些区别与联系? 参数为 1/2 和 1/2 的 Gamma 分布等于自由度为 1 的卡方分布,相同λ参数的独立 Gamma 分布之和服从 Gamma 分布,因此自由度为 n 的卡方分布是α=n/2,和λ=1/2 的 Gamma 分布。即:

 Ga( n2,12 ) = χ2 (??)

 6.

 求 Gamma 分布的矩估计; Gamma 分布的前两阶矩是 {μ 1 =????μ 2 =??(?? + 1)?? 2 解得 λ =μ 1μ 2 − μ 1 2

 α =μ 1 2μ 2 − μ 1 2

 由于σ ? 2 = μ 2 ? − μ 1 ? 2 ,矩估计方法是 {

 ???=???σ ? 2??? =???2σ ? 2

  7.假设检验中的两类错误之间有什么关系?能否同时减少两类错误? 原假设是正确的却拒绝了原假设,所犯的错误成为第一类错误,犯第一类错误的概率即为α。原假设是错误的却没有拒绝原架设,所犯的错误称为第二类错误,犯第二类错误的概率即为β。

 在固定样本量 n 的情况下,要减小α必导致增大β。

 在固定样本量 n 的情况下,要减小β必导致增大α。

 要使α、β都减小,需增大样本量。

 8.简述损失函数和风险函数的定义 在统计学,损失函数是指一种将一个事件(在一个样本空间中的一个元素)映射到一个表达与其事件相关的经济成本或机会成本的实数上的一种函数。更通俗地说,在统计学中损失函数是一种衡量损失和错误(这种损失与"错误地"估计有关,如费用或者设备的损失)程度的函数。

 风险函数是损失函数的期望值,表示为:R(θ,d) = E[L(d,θ)]。

  9.

 解释 t 分布和正态分布之间的差异; t 分布由一个标准正态分布与一个卡方分布构成:

 T =??√ ????⁄ 其中 X~N(0,1),Y~?? 2 ( ?? )

 ,T 服从自由度为 n 的 t 分布 t 分布相对正态分布低峰厚位。

 当 n>30 时 t 分布近似于标准正态分布。

 10.解释假设检验和置信区间估计的区别。

 参数估计是用统计量估计未知的参数;如果参数已知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时为假设检验。

 区间估计立足于大概率,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。

  13.

 中位数检验与均值 t 检验之间的区别与联系; --中位数检验是非参数统计方法,t 检验是参数统计方法; --中位数检验适用于总体分布未知的情景,t 检验需要总体正态分布的假设前提 --两者都使用了代表样本中心位置的指标。

  14.

 简述置信区间估计和假设检验之间的关系。

 --计算置信区间的枢轴量与假设检验的统计量是同一个量 --置信区间的置信水平(1-α)与假设检验的显著性水平α是两个相互对立事件的概率 --使用置信区间可以完成假设检验

 三、计算题(25 分)

 1 . Hardy-Weinberg 平衡问题中,父代有两种基因 M 和 N,M 在种群中的分布为 b(1,p)现在测量到了子代基因分布为:

 M MN N 总量 频数 342 500 187 1029 a) 请根据这些数据求父代的 p 的极大似然估计;(10 分)

 b) 请给出 p 的置信区间的求解公式,并解释; (15 分)

 解:

 a) 根据 Hardy-Weinberg 平衡定律,MM、MN、NN 出现的频率分别是?? 2 、 2??(1 − ??) 、(1 − ??) 2 ,令 n 为总量,x1、x2、x3 代表三个单元的观测数量,本案例是多项分布的参数推断问题,似然函数是:

 f(p) =??!?? 1 !?? 2 !?? 3 !(?? 2 ) ?? 1 (2??(1 − ??)) ?? 2 ((1 − ??) 2 ) ?? 3

 对数似然是:

 ??(??) = log??! − ∑ log?? ?? !3??=1+ ?? 1 log?? 2 + ?? 2 log2??(1 − ??) + ?? 3 log(1 − ??) 2

 = log??! − ∑ log?? ?? !3??=1+ (2?? 1 + ?? 2 )log?? + (?? 2 + 2?? 3 )log(1 − ??) + ?? 2 log2 对 p 求导,令导数为 0,有

 2?? 1 +?? 2??−?? 2 +2?? 31−??= 0 求解得到

 p =2?? 1 +?? 22(?? 1 +?? 2 +?? 3 )

 那么极大似然估计 ??? =2 × 342 + 5002 × 1029= 0.575 b) 根据中央极限定理 ??? − ??√ ??(1 − ??)??~??(0,1) 当 p 未知,n 非常大时,使用???估计 p,得到置信区间:

 [??? − ??( ??2 )√ ???(1 − ???)??,??? + ??( ??2 )√ ???(1 − ???)??]

 2 .用 possion( ? )分布参数 ? 的极大似然估计的渐进分布求置信区间。

 解:如果 X 服从参数为λ的 possion 分布,那么 P(X = x) =λ ?? ?? −λ?? ?? 联合频率函数是边际频率函数的乘积,那么对数似然是 l(λ) = ∑(?? ?? logλ − λ − log?? ??!)????=1 = ∑?? ??????=1logλ − ??λ − ∑log?? ?? !????=1 令一阶导数为 0,得 ?? ′ (λ) =∑ ?? ????=1λ− ?? = 0 那么,极大似然估计是 ???= ???

 求解置信区间,需要计算I(λ),令??(??|λ)表示参数为λ的 PMF,需要计算 I(λ) = −E[?? 2??λ 2log??(??|λ)] 已知 log??(??|??) = ??log?? − ?? − log??! 可得 ?? 2??λ 2log??(??|??) = −???? 2

 那么 I(λ) =1??

 因此,λ的近似100(1 − α)%置信区间为 ???± ??(??/2) √?????

 3 . X 1 , X 2 , … ,X n

 是从两点分布 Bernoulli(1,p)中抽取出来的独立同分布样本:

 (1).求 (1-p) 2 的极大似然估计(10 分)。

 (2)(1)中的估计量是无偏估计吗?如果是有偏的,请给出(1-p) 2 的一个无偏估计(15分)

 解:(1)似然函数为:

 p(?? 1 ,?? 2 …?? ?? ) = ?? ∑?? ??????=1(1 − ??) ??−∑?? ??????=1 对数似然函数为:

 logp(?? 1 ,?? 2 …?? ?? ) = ∑?? ??????=1log?? + (?? − ∑?? ??????=1)log(1 − ??) 求导并令导数为 0,得到 ∑ ?? ??????=1??−?? − ∑ ?? ??????=11 − ??= 0 化简,得 ??? =∑ ?? ??????=1??= ??? 那么(1-p)2 的极大似然估计为:(1 − ???) 2

 (2)已知有 ????? 2 = Var??? + (?????) 2

 E(1 − ???) 2 = E(1 − 2??? + ??? 2 ) = 1 − 2E??? + ????? 2

 = 1 − 2p +??(1 − ??)??+ ?? 2

 因此,(1)中估计量不是无偏估计。

 因为有:(1-p) 2 =1-p-p(1-p)。

 已知 S 2 是 p(1-p)的无偏估计,???是 p 的无偏估计,那么(1-p) 2 的无偏估计为 1 − ??? − ?? 2

  4. nX X ,...,1是从正态分布 ) , (2? ? N )中抽取的独立随机变量,请回答

  1)计算????????22?SE ,S 2 是样本方差;(10 分)

 2)请在所有的形式为 aX 1 +bX 2 的估计量中,找到 ? 2 的最小方差无偏估计;(10 分)

 解:(1)由于 (?? − 1)?? 2?? 2~?? 2 (?? − 1) 所以 E(?? − 1)?? 2?? 2= ?? − 1 解得 E?? 2?? 2= 1 (2)由题 E(aX 1 + bX 2 ) = 2μ 则 aμ + bμ = 2μ a + b = 2 要使Var(aX 1 + bX 2 )方差最小,带入b = 2 − a,有

 Var(aX 1 + (2 − a)X 2 ) = ?? 2 ???????? 1 + (2 − ??) 2 ???????? 2 = (2?? 2 − 4?? + 4)?? 2

 求(2?? 2 − 4?? + 4)的极小值,令导数为 0,得到 4a-4=0,则 a=1 那么,当 a=1 是有最小方差无偏估计 X 1 +X 2

  四、 论述题:(25 分)

 1. 研究者想了解某种电子设备产品在一年的各个季节里被购买的情况是否存在不同。如果用销售量来解释这一问题,对这一问题可能提出的最简单的零假设可能是什么?在这一假设之下,研究者调查了有关这种产品过去 3 年的销售量 2070 万台。

 表 1 某种电子设备产品在过去 3 年中的销售量 季节 O (万)

 E O i -E i

 (O i -E i ) 2

 ii iEE O2) ( ? 春季

  495 517.5 -22.5 506.25 0.98 夏季

  503 517.5 -14.5 210.25 0.41 秋季

  491 517.5 -26.5 702.25 1.36 冬季 581 517.5 63.5 4032.25 7.79 总计

 2070 2070 0 5451 10.54 1.解释表头字母的含义; O

 表示第 i 个季节实际销售观测数 E

 表示如果假定各季节销售无差异时的销售期望数 O i -E i

  观测与期望的差值 (O i -E i ) 2

  偏差平方 (O i -E i ) 2 / E i

  偏差平方与期望数的比值 2.请将上面的表格填写完整。

 3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,请给出你的推断过程和据此可能的结论。

 由于 10.54 大于 7.81,卡方拟合优度检验统计量落在拒绝域中,则拒绝原假设,电子设备产品在一年的各个季节里被购买的情况存在不同。

  2. 研究者想了解某地区的医院出院人数(DISC)和床位量(BEDN),调查了 21 家医院数据,分为甲级(I)和乙级(II)两类如下:

 等级 I I I I I II II II II II II II II II II II II II II II II DISC

 91 240 255 233 315 200 266 120 228 362 414 518 389 535 273 440 431 534 426 505 322

 BEDN

 62 64 67 69 70 73 81 91 96 100 100 103 110 127 111 116 120 122 130 137 142 1.如果我们感兴趣的问题是医院出院人数小于 400 的比例估计,请给出通过抽取样本研究这一问题的统计推断问题和估计量; 2.如果假定 p 来自先验分布 beta(a,,b),请先根据甲级医院估计出 a 和 b , 再给出对乙级医院 p 的后验估计计算公式和计算结果; 3.如果将床位量按(0,70],(71,110]以及(110,150] 分为大,中,小,请给出用来判断床位数和出院人数关系的统计模型和解答。

 解:

 (1)用 X 表示出院人数是否小于 400 的随机变量,则 X~b(1,p) 其中:p=Pr(X<400) 则: ??? =∑ ?? ??????=1?? (2)因为:后验∝先验•似然,则 p 的后验 ∝ (p ??−1 (1 − ??) ??−1 )(?? ∑?? ?? (1 − ??) ??−∑?? ?? ) ∝ p ??+∑?? ?? −1 (1 − ??) ??+??−∑?? ?? −1

 那么 p~beta(a + ∑?? ??????=1,b + n − ∑?? ??????=1) 其中,n 为样本量。根据 beta 分布的期望得到后验估计 ??? =a + ∑ ?? ??????=1a + b + n (3)构造列联表:

 床位量/出院人数 小于 400 大于 400 总计 小 1134 0 1134 中 1565 932 2497 大 595 2871 3466 总计 3294 3803 7097 使用卡方独立性检验,H0:床位数与出院人数独立,H1:床位数与出院人数相关 1)R 语言 R 语言中使用 chisq.test()函数数对列联表的行变量和列变量进行卡方独立性检验,执行:

 >chisq.test(data.frame(c(1134, 1565, 595), c(0, 932, 2871))) 输出 X-squared = 2766.8,df=2,p-value < 2.2e-16

 所以拒绝原假设,床位数与出院人数不独立。

 2)直接计算:

 卡方统计量:χ 2 = ∑ ∑(??− ?? .?? ?? .?? ??⁄ ) 2?? .?? ?? .????⁄2??=13??=1 代入计算得 2766.8,自由度为 2,给出的 p 值小于 0.01,所以拒绝原假设。

  4. 研究者想了解某种产品在四家商场中购买是否存在不同。如果用销售量来解释这一问题,对这一问题可能提出的最简单的零假设可能是什么?在这一假设之下,研究者调查了有关这种产品过去 2 年的销售量 196 万台。

 表 1 某种产品在过去 2 年中的销售量 商场 O (万)

 E O i -E i

 (O i -E i ) 2

 ii iEE O2) ( ? A

  98

  B

  67

  C

  13

  D 18

  总计

 196

  1.解释表头字母的含义; 2.请将上面的表格填写完整。

 3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,请给出你的推断过程和据此可能的结论。

 同第一题

 5. 某种感冒冲剂规定每包重量为 12 克,超重或过轻都是严重问题。质检员抽取 25 包冲剂称重检验,得到平均每包的重量为 11.85 克,标准差 6 . 0 ? s 克。假定产品重量服从正态分布( 05 . 0 ? ? )。( 96 . 12??z , 71 . 12??t )

 (1)

 感冒冲剂的每包重量是否符合标准要求?(写出详细的检验过程)

 (2)

 检验结论能否证明感冒冲剂的每包重量符合标准要求?为什么? (3)

 上述检验结论可能犯哪一类错误?说明这一错误的实际含义。

 (4)

 根据上述检验计算出的 223 . 0 ? P ,解释这个 P 值的具体含义。

 (1)解:

 H0:μ=12 H1:μ≠12 t =??? − ????√??⁄=11.85 − 120.6√25⁄= −1.25 ∵ |??| = 1.25 < ?? ?? 2⁄= 1.71

 故不拒绝原假设,认为符合标准

 (2) 不能,假设检验只是得出符合标准的概率较大,没有大概率表明原假设错误,不能拒绝原假设但并不能认为原假设一定正确。

 (3) 上述检验结论犯了第 II 类错误,原假设错误,由于样本落入接受域中而错误的接受原假设,这个样本提供的证据还不足以证明产品不符合每包 12g 的要求因此接受了符合要求的原假设。

 (4) 原假设成立的概率是 p,由于 p=0.223>0.05,所以认为差别由抽样误差引起,不能拒绝原假设。

相关热词搜索:统计学 考题 精简版

版权所有 蒲公英文摘 www.zhaoqt.net