数据集CEOSAL2.RAW包含了美国公司首席执行官的信息。变量salary是以千美元计的年薪,ceoten是已
(i)求出样本中的平均年薪和平均任期。
(ii)有多少位CEO尚处于担任CEO的第一年(就是说,ceoten=0)?最长的CEO任期是多少?
(ii)估计简单回归模型log(salary)=β0+β1ceoten+u,用通常的形式报告你的结果。多担任一年CEO,预计年薪增长(近似)的百分数是多少?
(i)求出样本中的平均年薪和平均任期。
(ii)有多少位CEO尚处于担任CEO的第一年(就是说,ceoten=0)?最长的CEO任期是多少?
(ii)估计简单回归模型log(salary)=β0+β1ceoten+u,用通常的形式报告你的结果。多担任一年CEO,预计年薪增长(近似)的百分数是多少?
第3题
ize) 方面的信息, 以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题, 只使用单身者数据(fsize=1)。
(i)数据集中有多少单身者?
(il)利用OLS估计模型
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H1:β2<1检验H0:β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归, inc的斜率估计值与第(ii) 部分的估计值有很大不同吗?为什么?
第4题
数据集401KSUBS.RAW包含了净金融财富(nenfa)、被调查者年龄(age)、家庭年收入(inc)、家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题,只使用无子女已婚者数据(marr=1,fsize=2)。
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
第6题
(i)暂不考虑家庭的聚类特征, 用OLS估计模型
其中变量定义在数据集中给出。我们最感兴趣的变量是choice, 它是一个虚拟变量, 如果一个人选择了如何在不同的投资之间配置其养老金,这个变量就等于1。choice的影响估计值是多少?它在统计上显著吗?
(ii)收入、财富、拥有股票和拥有个人退休金账户这些控制变量重要吗?请加以解释。(iii)确定数据集中有多少个不同的家庭。
(iv)现在, 求对家庭内聚类相关保持稳健的OLS标准误。它们与通常的OLS标准误差别大吗?你感到意外吗?
(v)通过对同一个家庭内的夫妻进行差分来估计这个方程。你在第(ii)部分中提到的解释变量为什么在差分估计时被去掉了?
(vi)第(v)部分中剩下的解释变量显著吗?你感到意外吗?
第8题
使用数据集TWOYEAR.RAW.
(i)变量phsrank表示一个人的高中百分位等级。(数字越大越好。比如90意味着,你的排名比所在班级中90%的同学更高。)求出样本中phsrank的最小、最大和平均值。
(ii)在方程(4.26)中增加变量phsrank,并照常报告OLS估计值。phsrank在统计上显著吗?高中排名提高10个百分位点,能导致工资增加多少?
(iii)在方程(4.26)中增加变量phsrank显著改变了2年制和4年制大学教育回报的结论了吗?请解释。
(iv)数据集包含了一个被称为id的变量。你若在方程(4.17)或(4.26)中增加id,预计它在统计上不会显著,解释为什么?双侧检验的p值是多少?
第9题
薪水信息和职业统计。
(i)估计一个将每场得分(points)与加入联盟年数(exper)、年龄(age)、大学期间打球年数(coll)相联系的模型。包含一个exper的二次项,其他变量都应该以水平值形式加入模型。按照通常的格式报告结果。
(ii)保持大学打球年数和年龄不变,从加入联盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗?
(iii)你为什么认为coll具有负系数,而且统计显著?(提示:NBA运动员在读完大学之前被选拔出,甚至直接从高中选出。)
(iv)有必要在方程中增加age的二次项吗?一旦控制了exper和coll之后,这对年龄效应意味着什么?
(v)现在将log(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。
(vi)在第(v)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?
第11题
参考4.4节中所用的例子。你将使用数据集TWOYEAR.RAW.
(i)变量phsrank表示一个人的高中百分位等级。(数字越大越好。比如90意味着, 你的排名比所在班级中90%的同学更高。)求出样本中phsrank的最小、最大和平均值。
(ii)在方程(4.26) 中增加变量phsrank, 并照常报告OLS估计值。phs rank在统计上显著吗?高中排名提高10个百分位点,能导致工资增加多少?
(iii)在方程(4.26) 中增加变量phs rank显著改变了2年制和4年制大学教育回报的结论了吗?请解释。
(iv)数据集包含了一个被称为id的变量。你若在方程(4.17)或(4.26)中增加id,预计它在统计上不会显著,解释为什么?双侧检验的p值是多少?