模拟试题一
一. 单项选择题(每小题2分,共20分)
1. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在
网上购物的主要原因是“价格便宜”。这里的参数是( )
A. 1000个消费者 B. 所有在网上购物的消费者
C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额
为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( )
A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样
某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70到90分之间的学生大约占( ) A. 95% B. % C. 68% D. 99%
已知总体的均值为50,标准差为8,从该总体中随机抽取容量为的样本,则样本均值的数学期望和抽样分布的标准误差分别为( )
A. 50,8 B. 50,1 C. 50,4 D. 8,8
根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75分~85分。全班学生的平均分数( )
A.肯定在这一区间内 B.有95%的可能性在这一区间内
C.有5%的可能性在这一区间内 D.要么在这一区间内,要么不在这一区间内 一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机抽取120个新车主中有57人为女性,在0.05的显著性水平下,检验2005年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为( )
A.H0:40%,H1:40% B.H0:40%,H1:40% C.H0:40%,H1:40% D.H0:40%,H1:40%
2. 3. 4. 5.
6.
7. 在回归分析中,因变量的预测区间估计是指( )
A. 对于自变量x的一个给定值x0,求出因变量y的平均值的区间 B. 对于自变量x的一个给定值x0,求出因变量y的个别值的区间
C. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间 D. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间
8. 在多元线性回归分析中,如果F检验表明线性关系显著,则意味着( )
A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系著 B. 所有的自变量与因变量之间的线性关系都显著
C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显著 D. 所有的自变量与因变量之间的线性关系都不显著
9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( )
A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型
10. 设p为商品价格,q销售量,则指数p0q1p0q0的实际意义是综合反映( )
A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度
C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度
二. 简要回答下列问题(每小题5分,共15分)
1. 简述直方图和茎叶图的区别。 2. 简述假设检验中P值的含义。
.
精品文档
3. 解释指数平滑法。
三. (15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试
成绩的分布如下: 考试成绩(分) 学生人数(人) 2 60以下 7 60—70 9 70—80 7 80—90 5 90—100 30 合计 (1) 画出乙班考试成绩的直方图。 (2) 计算乙班考试成绩的平均数及标准差。 (3) 比较甲乙两个班哪个班考试成绩的离散程度大?
四. (25分) 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产
品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:
每包重量(克) 96-98 98-100 100-102 102-104 104-106 合计 包数 2 3 34 7 4 50 假定食品包重服从正态分布,要求:
(1) 确定该种食品平均重量95%的置信区间。
(2) 如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间。 (3) 采用假设检验方法检验该批食品的重量是否符合标准要求?(0.05,写出检验的具体步骤)。 五. (25分)一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、
各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。利用Excel得到下面的回归结果(0.05): 方差分析表 变差来源 df 回归 残差 总计 参数估计表 Intercept X Variable 1 X Variable 2 X Variable 3 Coefficients 75.1025 -117.8861 80.6107 0.5012 标准误差 2445.0213 31.74 14.7676 0.1259 t Stat 3.1039 -3.6958 5.4586 3.9814 P-value 0.00457 0.00103 0.00001 0.00049 29 SS 13458586.7 MS 40024.7 — F — — Significance F 8.88341E-13 — — (1) 将方差分析表中的所缺数值补齐。
(2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。 (3) 检验回归方程的线性关系是否显著?
(4) 计算判定系数R,并解释它的实际意义。 (5) 计算估计标准误差sy,并解释它的实际意义。
.
2精品文档
模拟试题一解答
一、单项选择题
1. A;2. D;3. C;4. B;5. D;6. C;7. B;8. A;9. D;10. B。
二、简要回答下列问题
1. (1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。 (2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 2. 如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值
P值是假设检验中的另一个决策工具,对于给定的显著性水平,若P,则拒绝原假设。
3. 指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1期的预测值等于t期的实际观察值与第t期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法,其模型为Ft1Yt(1)Ft。
三、(1)乙班考试成绩的直方图如下:
10820人数60以下90-10060-7070-8080-90考试成绩乙班考试成绩分布的直方图(2)xMi1k
ifiin552657759857955231077分
3030s(Mi1kx)2fin1(5577)22(6577)27(7577)29(8577)27(9577)25
301408011.86分29 (3)甲班考试分数的离散系数为:v甲s120.1395。 x86s11.860.10。 乙班考试分数的离散系数为:v乙x77由于v甲v乙,所以甲班考试成绩的离散程度小于乙班。
.
精品文档
四、(1)已知:n50,z0.0521.96。
样本均值为:xMi1kifiinki15066101.32克, 50样本标准差为:s(Mx)2fin11.63450130.881.634克。 49由于是大样本,所以食品平均重量95%的置信区间为:
xz2sn101.321.96101.320.453
即(100.867,101.773)。
(2)提出假设:H0:100,H1:100 计算检验的统计量:z 由于z5.712z0.052
五、(1)
方差分析表 变差来源 df 回归 3 残差 总计 26 SS 12026774.1 1431812.6 MS 40024.7 55069.7 F 72.80 — Significance F 8.88341E-13 — x0sn1.634501.96,所以拒绝原假设,该批食品的重量不符合标准要求。
101.321005.712
29 13458586.7 — — — ˆ75.1025117.8861x180.6107x20.5012x3。 (2)多元线性回归方程为:yˆ117.8861 表示:在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,销售量1ˆ80.6107表示:在销售价格和广告费用不变的情况下,年人均收入每平均下降117.8861个单位;2ˆ0.5012表示:在年销售价格和人均收入不变的增加一个单位,销售量平均增加80.6107个单位;3情况下,广告费用每增加一个单位,销售量平均增加0.5012个单位。
(3)由于Significance F=8.88341E-13<0.05,表明回归方程的线性关系显著。
(4)R2SSR12026774.1.36%,表明在销售量的总变差中,被估计的多元线性回归方SST13458586.7SSEMSE55069.7234.67。表明用销售价格、年人均收入和广告费用
nk1程所解释的比例为.36%,说明回归方程的拟合程度较高。
(5)se来预测销售量时,平均的预测误差为234.67。
.
精品文档
模拟试题二
一. 单项选择题(每小题2分,共20分)
1. 根据所使用的计量尺度不同,统计数据可以分为( ) 2. 3. 4.
A. 分类数据、顺序数据和数值型数据 B. 观测数据和试验数据 C. 截面数据和时间序列数据 D. 数值型数据和试验数据 饼图的主要用途是( )
A. 反映一个样本或总体的结构 B. 比较多个总体的构成 C. 反映一组数据的分布 D. 比较多个样本的相似性
如果一组数据是对称分布的,则在平均数加减2个标准差之内的数据大约有( ) A. 68% B. 90% C. 95% D. 99%
从均值为200、标准差为50的总体中,抽出n100的简单随机样本,用样本均值x估计总体均值,则x的数学期望和标准差分别为( )
A. 200,5 B. 200,20 C. 200,0.5 D. 200,25 95%的置信水平是指( )
A.总体参数落在一个特定的样本所构造的区间内的概率为95% B.总体参数落在一个特定的样本所构造的区间内的概率为5%
C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5% 在假设检验中,如果所计算出的P值越小,说明检验的结果( ) A.越显著 B.越不显著 C.越真实 D.越不真实
在下面的假定中,哪一个不属于方差分析中的假定( ) A.每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是的 D. 各总体的方差等于0
在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是( ) A. 一个样本观测值之间误差的大小 B. 全部观测值误差的大小
C. 各个样本均值之间误差的大小 D. 各个样本方差之间误差的大小 在多元线性回归分析中,t检验是用来检验( )
A. 总体线性关系的显著性 B. 各回归系数的显著性 C. 样本线性关系的显著性 D. H0:12k0
A. 简单平均法 B. 移动平均法 C. 指数平滑法 D. 线性模型法
5.
6.
7. 8. 9.
10. 下面的哪种方法不适合对平稳序列的预测( )
二. 简要回答下列问题(每小题5分,共20分)
1. 简述直方图和条形图的区别。 2. 简述中心极限定理。
3. 回归分析主要解决以下几个方面的问题? 4. 解释拉氏价格指数和帕氏价格指数。
三. (20分)一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名
品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下: 灯泡寿命(小时) 供应商甲 供应商乙 12 4 700~900 .
精品文档
14 34 900~1100 24 19 1100~1300 10 3 1300~1500 60 60 合计 (1) 请用直方图直观地比较这两个样本,你能得到什么结论? (2) 你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平?请简要说
明理由。 (3) 哪个供应商的灯泡具有更长的寿命? (4) 哪个供应商的灯泡寿命更稳定?
四. (20分)为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,
得样本均值为6.5小时,样本标准差为2.5小时。
(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?
(注:z0.0251.96,z0.051.5)
五. (20分)一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时
间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(y)、行使时间(x1)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(0.05):
ˆ42.38 截距的标准差s方程的截距ˆ36.59 回归平方和SSR29882 00ˆ9.16 回归系数1ˆ0.46 回归系数2回归系数的标准差s4.78 1残差平方和SSE5205 — 回归系数的标准差sˆ20.14 (1) 写出每天的收入(y)与行使时间(x1)和行驶的里程(x2)的线性回归方程。
(2) 解释各回归系数的实际意义。 (3) 计算多重判定系数R,并说明它的实际意义。 (4) 计算估计标准误差Sy,并说明它的实际意义。
(5) 若显著性水平=0.05,回归方程的线性关系是否显著?(注:F0.05(2,17)3.59)
2模拟试题二解答
一、单项选择题
1. A;2. A;3. C;4. A;5. C;6. A;7. D;8. C;9. B;10. D。
二、简要回答下列问题
1. (1)条形图是用条形的长度或高度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
(2)直方图的各矩形通常是连续排列,而条形图则是分开排列。
(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 2. 从均值为、方差为的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),
.
2精品文档
样本均值x的抽样分布近似服从均值为、方差为2n的正态分布。 3.(1)从一组样本数据出发,确定出变量之间的数学关系式;(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
4. 在计算一组商品价格的综合指数时,把作为权数的销售量固定在基期计算的指数称为拉氏价格指数。在计算一组商品价格的综合指数时,把作为权数的销售量固定在报告期计算的指数称为帕氏价格指数。
三、(1)两个供应商灯泡使用寿命的直方图如下:
304030频数20频数20100700~900900~11001100~1300101100~13001300~15001300~15000700~900900~1100使用寿命使用寿命
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
供应商甲供应商乙x甲Mi1kkifin800121000141200241400106001106.67小时。
60608004100034120019140032001070小时。
6060x乙Mi1ifin甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
n1s199.v甲甲0.18
x甲1106.67s甲(Mi1kix)2fi2357333.34199.小时。
59s甲v乙.
(Mi1kix)2fis乙x乙n1136.920.13 10701106000136.92小时。 59精品文档
由于v乙v甲,说明供应商乙的灯泡寿命更稳定。
四、(1)已知:n225,x6.5,s2.5,z0.0251.96。 网络用户每天平均上网时间的95%的置信区间为:
xz2sn6.51.962.52256.50.33
即(6.17,6.83)。 (2)样本比例ppz2
900.4。龄在20岁以下的网络用户比例的95%的置信区间为: 225p(1p)0.4(10.4)0.41.960.40.0 n225即(33.6%,46.4%)。
ˆ42.389.16x10.46x2。 五、(1)回归方程为:yˆ9.16表示:在行驶里程不变的情况下,行驶时间每增加1小时,每天的收入平均增 (2)1ˆ0.46表示:在行驶时间不变的情况下,行驶里程每增加1公里,每天的收入平均增加加9.16元;20.46元。
(3)R2SSR2988285.17%。 SST298825205表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为85.17%,说明回归方程的拟合程度较高。
(4)seSSEnk1520517.50。
2021表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17.50元。 (5)提出假设:H0:120,H1:1,2至少有一个不等于0。 计算检验的统计量F:
SSRk29882248.80
SSEnk152052021于F48.80F0.05(2,17)3.59,拒绝原假设H0。这意味着每天收入与行驶时间和行驶里程之
F间的线性关系是显著的。
.
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- kqyc.cn 版权所有 赣ICP备2024042808号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务