《多元统计分析思考题》
第一章 回归分析
1、回归分析是怎样的一种统计方法,用来解决什么问题?
2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么?
3、实际应用中,如何设定回归方程的形式?
4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么?
5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估计两有哪些统计性质?要想获得理想的参数估计值,需要注意一些什么问题?
6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?
7、建立自变量与因变量的回归模型,是否意味着他们之间存在因果关系?为什么?
8、回归分析中,为什么要作假设检验?检验依据的统计原理是什么?检验的过程是怎样
的?
9、回归诊断可以大致确定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足这些假定,将可能引起怎样的后果?如何检验实际应用问题是否满足这些假定?对于各种不满足假定的情形,分别采用哪些改进方法?
10、回归分析中的R2有何意义?它能用来衡量模型优劣吗?
11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不
存在交互作用的情形下是否相同?为什么?
12、有哪些确定最优回归模型的准则?如何选择回归变量?
13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何
关系?形式有否不同?
14、利用回归方法解决实际问题的大致步骤是怎样的?
15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果?
第二章 判别分析
1、判别分析的目的是什么?
2、有哪些常用的判别分析方法?这些方法的基本原理或步骤是怎样的?它们各有什么特点或优劣之处?
3、判别分析与回归分析有何异同之处?
4、判别分析对变量与样本规模有何要求?
5、如何度量判别效果?有哪些影响判别效果的因素?
6、逐步判别是如何选择判别变量的?基本思想或步骤是什么?
7、判别分析有哪些现实应用?举例说明。
第三章 聚类分析
1、 聚类分析的目的是什么?与判别分析有何异同?这种方法有哪些局限或欠缺?
2、 有哪些常用的聚类统计量?
3、 系统(谱系)聚类法的基本思想是怎样的?它包含哪些具体方法?
4、 聚类分析对变量与样本规模有何要求?有哪些因素影响分类效果?要想减少不利因素
的影响,可以采取哪些改进方法?
5、 实际应用问题,如何确定分类数目?
6、 快速聚类法(K—均值法)的基本思想或步骤是怎样的?
7、 有序样品的最优分别法的基本思想或步骤是怎样的?
8、 应用聚类分析解决实际问题的基本步骤是怎样的?应该注意哪些方面的问题?
第四章 主成分分析与典型相关分析
1、 主成分分析的基本思想是什么?在低维情况下,如何利用几何图形解释主成分的意
义?
2、 什么是主成分的贡献率与累计贡献率?实际应用时,如何确定主成分的个数?
3、 主成分有哪些基本性质?
4、 对于任何情形的多个变量,都可以采取主成分方法降维吗?为什么?
5、 怎样的情况下需要计算标准化的主成分?
6、 主成分有哪些应用?
7、 如何解释主成分的实际含义?
8、 典型相关分析的基本思想是什么?有何实际用途?
9、 典型相关分析与回归分析、判别分析、主成分分析、因子分析有何关联?试比较这些
方法的异同之处。
10、典型相关分析有哪些基本假定?
11、如何解释典型相关函数的实际意义?
12、典型相关方法中冗余度分析的意义是什么?
第五章 因子分析与对应分析
1、 因子分析是怎样的一种统计方法?它的基本目的和用途是什么?
2、 因子分子中的KMO统计量与巴特莱特球形性检验的目的是什么?
3、 因子分析有哪些类型?它们有何区别?Q型因子分析与聚类分析有何异同?
4、 因子分析中的变量类型是怎样的?因子分析对变量数目有没有要求?对样本规模有
没有要求?
5、 因子分析有怎样的基本假定?对样本特点(或性质)有何要求?
6、 因子分析模型中,因子载荷、变量共同度、方差贡献等统计量的统计意义是什么?
7、 因子分析与主成分分析有何区别与联系?它们分别适用于怎样的情况?
8、 如何确定公共因子数目?如何解释公共因子的实际意义?
9、 怎样的情况下,需要作因子旋转?
10、有哪些估计因子得分的方法?因子得分的估计是普通意义下的参数估计吗?为什
么?
11、对应分析的基本思想或原理是什么?试举例说明它的应用。
12、对应分析中总惯量的意义是什么?