分布

SciPy publisher01 22℃

数据分布形态
一组或一系列数字,落在坐标图里的形态特征。比如:正态分布。

1.正态分布 Normal distribution

1.1 定义


image.png

又名高斯分布 Gaussian distribution
若随机变量X服从一个数学期望为μ,标准方差为σ^2的高斯分布

1.2 正态分布的特征

  • 正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
  • u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。
  • σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
  • 3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%

2.卡方分布

卡方分布是从正态分布中衍生出的一种分布。其定义是若干个随机变量的平方和也服从一种分布,即卡方分布。
卡方分布:常用于拟合优度检验


image.png

3.t分布

t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析


image.png

4.f分布


image.png

5.区别:

卡方分布:常用于拟合优度检验
t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析
t分布: 在信息不足的情况下,只能用t分布,比如在整体方差不知道的情况下,对总体均值的估计和检验常用t统计量

6.伯努利分布 两点分布

伯努利分布是二元分布 – 它只需要两个值(0 或 1),概率为p
可以求期望 E(x) 方差D(x)


image.png

7.Gamma 分布

Gamma 分布是由两个参数定义的连续概率分布。
给定不同的参数,伽玛分布可能看起来非常不同。探索不同的参数。
指数分布在技术上是 Gamma 分布的一个特例,但也在 scipy 中单独实现为expon。

8.Beta 分布

Beta 分布是在区间[0,1]上定义的分布,由两个形状参数定义


image.png


image.png

9.泊松分布

在给定已知平均速率(和独立出现)的情况下,泊松分布建模了固定时间间隔的事件。


image.png


image.png

10.二项分布


image.png

11.均匀分布


image.png

12.指数分布


image.png


image.png


image.png

但有可能与实际不符,那就加个参数

13. sigmoid函数


image.png


image.png

reference:
https://blog.csdn.net/back_to_dream/article/details/51361431
https://blog.csdn.net/renwudao24/article/details/44463489
截图来自YouTube

转载请注明:Python量化投资 » 分布

喜欢 (0)or分享 (0)