计量经济学之以python为工具(一)【重温大学时光之——计量经济学入门】 – Python量化投资

计量经济学之以python为工具(一)【重温大学时光之——计量经济学入门】

最近把统计和计量经济学的东西重新在过一遍。之前扔了太多了,事无巨细的写一写。

《计量经济学入门》黄少敏

以上面这本书作为本次学习内容。
想我这三张的人了,还是得回头把还给老师的再要回来,都是泪。不说了。

总之呢,本次重温的主题为——计量经济学之以python为工具

 

第一章 什么是计量经济学

本章要点:

1、计量经济学是统计方法在经济学在实证研究中的应用。

2、经济模型是在经济理论基础上,有解释变量和被解释变量组成,用来做回归分析的关系灯饰。

3、模型中的被解释变量是研究者所有分析研究的问题点。

4、模型中的解释变量是解释被解释变量变化的变量。

5、回归分析就是用统计方法,根据实际数据计算(估算)出模型的参数值。

6、做计量经济学的研究,需要忠于实际数据。

7、我们通常把数据分为三类:横基面数据、时间序列数据、面板数据。

8、应用计量经济学所必须的条件:经济模型、实际数据、计算机、统计软件   – -!

 

习题:

1.1、什么是计量经济学?

计量经济学就是统计学在经济学实证研究中的应用。是通过对实际数据的分析来研究经济规律的一门科学。对经济学的研究,有从质的方面入手的——纯理论模型的探讨;也有从量的方面入手的,即用实际数据对经济理论模型的实证研究分析。

1.2、被解释变量与解释变量是什么关系?

在计量经济学的模型中,总有自变量和因变量,或称为解释变量和被解释变量。被解释变量就是因为其他因素变化而变化的变量。解释变量就是在特定环境中因为自身变化而影响被解释变量变化的变量。

对同一个被解释变量可以接受多个解释变量。

比如:\(市场需求=f(价格,收入,其他物价,消费偏好,市场期望)\)

1.3 经济研究中有哪些数据类型?

横截面数据(Corss-sectional data)

时间序列数据(Time-series data)

集合数据:横截面与时间序列合在一起。

纵向数据

面板数据/板块数据

aaaaa1

1.4 做计量经济学的研究,需要哪些条件?

 

第二章 统计基础知识

频率表:显示变量中不同类型或量值分布的表格。一般变量可以分为连续型、离散型。
离散型数据,关注的是类型的分布;
连续型数据,关注的是值的分布。

第二节 均值

常规的概念为“平均数”,统计学的概念为“期望值”。
假设有个随机变量X,取N个样本,x1,x2,x3,……xn。均值用\( {\over x}\)表示,即:
\({\over x} = {\sum_n x_i \over n} \) 或者  \({\over x} = {x_1+x_2+x_3+…..+x_{n-1}+x_n \over n}\)

这里每一个样本出现的概率是一样的,即1/n,当我们谈到期望值时,就引入较为复杂的概念——每个样本的概率不一样,此时均值用期望值代替:
\(E(x)=x_ip_i , i=1,2,3,…..,n\)

 

第三节 方差与标准差

方差是用来衡量离散性的,即每个样本与平均值的距离。
方差有2种:总体方差、抽样方差。

总体方差:\({\sigma^2} = {\sum_\limits N(x_i-\mu)^2\over N}\)

抽样方差:\({s^2} = {\sum_\limits N(x_i-{\over x})^2\over {n-1}}\)

总体标准差:\({\sigma = \sqrt {\sigma^2}}\)
抽样标准差:\({s = \sqrt {s^2}}\)

对于已知概率的变量,其方差计算方式为:

\({\sigma^2} = {\sum_\limits N(x-\mu)^2p_i}\)

\({\sigma^2} = {\sum_\limits N[x_i-E(x)]^2p_i}\)

第四节 假设检验
假设检验的步骤分5步:

1、设定假设条件:原假设和替代假设,二者概率之和必须为1,即原假设\(H_0:\mu=0\)则替代假设为\(H_0:\mu\neq0\)   

2、决定使用哪种检验:小于30使用学生-t检验;大于30则使用Z检验(正态分布)

3、找出临界值,基于α为1%、5%、10%下,概率分布表里Zc值或tc

4、计算统计值

5、统计值的绝对值与临界值进行比较,得到结论。

如果统计值的绝对值,大于临界值,则否定原假设;

如果统计值的绝对值,小于临界值,则不能否定原假设;

\(Z^*={{\over x}-\mu_0\over\sigma/{\sqrt n}} \) 或  \( t^*={{\over x} – \mu_0 \over s – \sqrt n}\)

在实际过程中,一般用\(Z^*={{\over x} – \mu_0 \over s – \sqrt n}\)来计算,用真是标准偏差的估计值s来代替\(\sigma\),因为总体的真实标准差往往是不知道的。

PS:如何设定假设? 

比较原始均值(\(\mu_0\))与新样本(\(\over x
\)
)均值比较,如果原始均值大于新样本,就假设新样本均值小于原是均值,替代假设为大于等于原始均值。

反之,则相反。

什么是第一类误差,什么是第二类误差。

协方差:\({\sigma_x}{_y}= {{\sum_\limits n(x_i-{\over x })(y_i-{\over y })}\over n}\)

相关系数:

\({\sigma_{xy} \over \sigma_x\sigma_y } = \)\({{\sum_\limits n(x_i-{\over x })(y_i-{\over y })}\over n}\over {\sum_\limits N(x_i-{\over x})^2\over N} {\sum_\limits N(y_i-{\over y})^2\over N}\) = \({{\sum_\limits n(x_i-{\over x })(y_i-{\over y })}}\over \sqrt {{\sum_\limits N(x_i-{\over x})} {\sum_\limits N(y_i-{\over y})}}\)

 

 

 

习题:

9:数据:
    X1    X2    X3    X4    X5    X6
0    231    12    102    101    1    161
1    122    11    121    121    1    58
2    212    12    161    161    2    70
3    193    12    173    173    2    140
4    173    23    131    131    1    120
5    211    13    141    141    2    184
6    222    13    112    112    1    42
7    250    11    161    161    2    207
8    183    21    122    122    1    104
9    93    12    117    117    2    82
10    113    11    225    225    4    90
11    162    12    127    127    1    135
12    133    13    225    225    4    22
13    171    12    214    214    3    113
14    222    21    236    236    4    198
15    241    11    118    118    1    152
16    191    13    127    127    2    172
17    182    13    112    112    1    67
18    181    23    217    217    3    211
19    123    11    218    218    3    37
20    174    12    119    119    1    220
21    159    13    127    127    2    183
22    124    18    210    210    3    110
 

 

 

 

 

 

 


 

和平精英下载
「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
4 条回复 A 作者 M 管理员
  1. 风吹过,我来过!

  2. 随便看看,随便转转!

  3. 感觉很不错的样子!

  4. 偶然来访,受益良多!

欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论