本题利用数据集MEAO0_01.RAW中的数据。(i)用OLS估计方程(iv)求容许方差函数被误设的WLS标准误。
本题利用数据集MEAO0_01.RAW中的数据。
(i)用OLS估计方程
(iv)求容许方差函数被误设的WLS标准误。它与通常的WLS标准误有很大的不同吗?
(v)为了估计支出对math 4的影响, OLS与WLS哪一个看起来更准确?
本题利用数据集MEAO0_01.RAW中的数据。
(i)用OLS估计方程
(iv)求容许方差函数被误设的WLS标准误。它与通常的WLS标准误有很大的不同吗?
(v)为了估计支出对math 4的影响, OLS与WLS哪一个看起来更准确?
第1题
本题利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当lotsize=20000,scrft=2500和bdrms=4时,求出log(price) 的预测值。利用6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变异而言,决定你是偏好第(i)部分中的模型,还是偏好模型
第2题
本题利用LOANAPP.RAW中的数据。
(i)估计计算机习题C7.8第(iii) 部分中的方程, 计算其异方差-稳健的标准误。将的95%的置信区间与非稳健的置信区间相比较。
(ii)由第(i)部分的回归计算拟合值。其中有没有哪个估计值小于0?有没有哪个估计值大于1?而这些情况对加权最小二乘估计的应用意味着什么?
第3题
本题利用MEAP93.RAW中的数据。
(i) 估计模型math10=β0+β1log(expend)+β2Inchprg+u,并按照通常的方式报告估计方程,包括样本容量和R2。斜率系数的符号与你的预期一致吗?请加以解释。
(ii)你如何理解第(i)部分中估计出来的截距?特别是,令两个解释变量都等于零说得过去吗?[提示:记住log(1)=0。]
(i)现在做math10对log(expend)的简单回归, 并将斜率系数与第(i)部分中得到的估计值进行比较。与第(i)部分中的结果相比,这里估计出来的支出效应是更大还是更小?
(iv)求山lexpend=log(expend)与Inchprg之间的相关系数。你认为其符号合理吗?
(v)利用第(iv)部分的结果来解释你在第(iii)部分中得到的结论。
第4题
利用MEAP00 O1中的数据回答本题。
(i)使用OLS估计模型
并用通常的格式报告你的结论。在5%的显著性水平上,每个解释变量都是统计显著的吗?
(ii)求出第(i) 部分中回归的拟合值。拟合值的取值范围是多少?它与math4的实际数据取值范围相比如何?
(iii)求出第(i)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。
(iv)在方程中增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗?
(v)回到第(i)部分中的模型,将因变量和每个解释变量都除以各自的样本标准差,并重新进行回归。(除非你还将每个变量分别减去了各自的均值,否则还应该包括一个截距项。)以标准差为单位,哪个解释变量对数学考试通过率具有最大的影响?
第5题
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机习题c 3.8.)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧对立假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告H0:βlog(hseval)=0的双侧p值。
(iv) 在第(ii) 部分的回归中, log(income) 和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个邮区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
第6题
我们希望利用h(n)长度为N=50的FIR滤波器对一段很长的数据序列进行滤波处理,要求采用重叠保留法通过DFT(即FFT)来实现。所谓重叠保留法,就是对输入序列进行分段(本题设每段长度为M=100个采样点),但相邻两段必须重叠V个点,然后计算各段与h(n)的L点(本题取L=128)循环卷积,得到输出序列ym(n),m表示第m段循环卷积计算输出。最后,从ym(n)中选取B个样值,使每段选取的B个样值连接得到滤波输出y(n)。 (1)求V;(2)求B;(3)确定取出的B个采样应为ym(n)中的哪些样点。
第7题
人口特征方面的数据。目的是想考察快餐店是否在黑人更集中的区域收取更高的价格。
(i)求出样本中prpblck和income的平均值及其标准差。prpblck和income的度量单位是什么?
(ii)考虑一个模型,用人口中黑人比例和收入中位数来解释苏打饮料的价格psoda:
用OLS估计这个模型并以方程的形式报告结果, 包括样本容量和R。(报告估计值时不要使用科学计数法。)解释prpblck的系数。你认为它在经济上算大吗?
(iii) 将第(ii)部分得到的估计值与psoda对prpblck进行简单回归得到的估计值进行比较。控制收入变量后,这种歧视效应是更大还是更小了?
(iv)收入价格弹性为常数的模型可能更加适合。报告如下模型的估计值:
(vi)求出1og(income)和prppov的相关系数。大致符合你的预期吗?
(vii)评价如下说法:“由于log(income)和prppov如此高度相关,所以它们不该进入同一个回归。”
第9题
A.重大创新将更多来自跨领域、跨学科的交叉融合,场景驱动和数据驱动成为新趋势
B.科技创新活动日益表现出大众化、集群化、社会化、网络化的特征
C.生物与信息加速融合,自然科学与人文社会科学之间相互渗透,基础研究、应用研究、技术开发和产业化边界日趋模糊
D.传统能源清洁利用成为推动各领域向智能化跃升的一个重要引擎
第10题
第11题
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。