Skip to content

Commit 7cc187e

Browse files
authored
Update inequality.md (#104)
1 parent 8fcac6a commit 7cc187e

File tree

1 file changed

+24
-25
lines changed

1 file changed

+24
-25
lines changed

lectures/inequality.md

Lines changed: 24 additions & 25 deletions
Original file line numberDiff line numberDiff line change
@@ -16,7 +16,6 @@ kernelspec:
1616
## 概览
1717

1818
在{doc}`long_run_growth` 中,我们研究了某些国家和地区的人均国内生产总值是如何变化的。
19-
的变化。
2019

2120
人均 GDP 很重要,因为它能让我们了解某个国家的家庭平均收入。
2221

@@ -28,7 +27,7 @@ kernelspec:
2827
例如,假设有两个社会,每个社会都有 100 万人,其中
2928
3029
* 在第一个社会中,一个人的年收入是 $100,000,000,其他人的年收入为零。
31-
其他人的收入为零
30+
3231
* 在第二个社会中,每个人的年收入都是 100 美元
3332
3433
这些国家的人均收入相同(平均收入为 100 美元),但人民的生活却大不相同(例如,在第一个社会中,几乎每个人都在挨饿,尽管有一个人非常富有)。
@@ -53,9 +52,9 @@ kernelspec:
5352

5453
最终,罗马共和国让位于一系列独裁政权 -- 从公元前 27 年的[屋大维](https://en.wikipedia.org/wiki/Augustus)(奥古斯都)开始。
5554

56-
这段历史告诉我们,不平等很重要,因为它可以推动世界重大事件的发生。
55+
这段历史告诉我们,不平等很关键,因为它可以推动世界重大事件的发生。
5756

58-
不平等之所以重要,还有其他原因,比如它如何影响人类福祉。
57+
不平等之所以关键,还有其他原因,比如它如何影响人类福祉。
5958

6059
有了这些动机,让我们开始思考什么是不平等,以及如何量化和分析不平等。
6160

@@ -129,10 +128,9 @@ $$
129128

130129
如果我们使用 `matplotlib` 中的线形图,它将自动帮我们完成插值。
131130

132-
语句 $y = L(x)$ 的含义是,最低的 $(100 \times x$ \% 的人拥有$(100 \times y)$\% 的财富。
131+
洛伦兹曲线 $y = L(x)$ 的含义是,最低的 $(100 \times x$ \% 的人拥有$(100 \times y)$\% 的财富。
133132

134133
* 如果 $x=0.5$,$y=0.1$,那么最底层的 50%人口拥有 10%的财富。
135-
拥有 10%的财富。
136134

137135
在上面的讨论中,我们重点讨论了财富,但同样的观点也适用于收入、消费等。
138136

@@ -141,9 +139,9 @@ $$
141139

142140
让我们来看一些例子,并尝试构建理解。
143141

144-
首先,让我们构建一个可以在下面的模拟中使用的 `lorenz_curve` 函数。
142+
首先,让我们构建一个可以在下面模拟中使用的 `lorenz_curve` 函数。
145143

146-
构造一个函数,它能将收入或财富数据的数组转换为个人(或家庭)的累积份额和收入(或财富)的累积份额。
144+
构造这样一个函数,它能将收入或财富数据的数组转换为个人(或家庭)的累积份额和收入(或财富)的累积份额。
147145

148146
```{code-cell} ipython3
149147
def lorenz_curve(y):
@@ -192,7 +190,7 @@ def lorenz_curve(y):
192190

193191
在下图中,我们从对数正态分布中生成了 $n=2000$ 个样本,并将这些样本视为我们的总体。
194192

195-
直的 45 度线($x=L(x)$ 对于所有 $x$)对应于完全平等的情况。
193+
其中45 度线($x=L(x)$ 对于所有 $x$)对应于完全平等的情况。
196194

197195
对数正态分布的样本产生了一个不那么平等的分布。
198196

@@ -229,7 +227,7 @@ plt.show()
229227
接下来让我们查看美国的收入和财富数据。
230228

231229
(data:survey-consumer-finance)=
232-
下面的代码块导入了2016年的`SCF_plus`数据集的一个子集,
230+
下面的代码导入了2016年的`SCF_plus`数据集的一个子集,
233231
该数据集来源于[消费者财务调查](https://en.wikipedia.org/wiki/Survey_of_Consumer_Finances)(SCF)。
234232

235233
```{code-cell} ipython3
@@ -242,7 +240,7 @@ df_income_wealth = df.dropna()
242240
df_income_wealth.head(n=5)
243241
```
244242

245-
下一个代码块使用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
243+
接下来的代码使用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
246244

247245
(代码稍微复杂一些,因为我们需要根据 SCF 提供的人口权重来调整数据。)
248246

@@ -404,16 +402,16 @@ plt.show()
404402

405403
### 模拟数据的基尼系数
406404

407-
让我们通过一些模拟来研究基尼系数
405+
让我们通过模拟数据来研究基尼系数
408406

409-
下面的代码从样本中计算基尼系数
407+
下面的代码将从样本中计算基尼系数
410408

411409
(code:gini-coefficient)=
412410

413411
```{code-cell} ipython3
414412
def gini_coefficient(y):
415413
r"""
416-
实现基尼不平等指数
414+
实现的基尼不平等指数
417415
418416
参数
419417
----------
@@ -535,6 +533,7 @@ plt.show()
535533
```
536534

537535
我们可以在 {numref}`gini_histogram` 中看到,根据50年的数据和所有国家的数据,该指标在20到65之间变化。
536+
538537
现在,我们来看看美国在过去几十年的基尼系数变化。
539538

540539
```{code-cell} ipython3
@@ -544,7 +543,7 @@ data.head(n=5)
544543
data.columns = data.columns.map(lambda x: int(x.replace('YR','')))
545544
```
546545

547-
此包通常会返回包含年份信息的列。这在使用 pandas 简单绘图时并不总是方便,因此在绘图之前将结果转置可能会有帮助。)
546+
这个数据包通常会返回包含年份信息的列。这在使用 pandas 简单绘图时并不总是方便,因此在绘图之前将结果转置可能会有帮助。)
548547

549548
```{code-cell} ipython3
550549
data = data.T # 将年份作为行
@@ -573,7 +572,7 @@ plt.show()
573572
(compare-income-wealth-usa-over-time)=
574573
### 财富的基尼系数
575574

576-
在上一节中,我们研究了收入的基尼系数,重点是使用美国的数据
575+
在上一节中,我们重点使用美国的数据研究了收入的基尼系数
577576

578577
现在让我们来看一下财富分布的基尼系数。
579578

@@ -609,7 +608,7 @@ plt.show()
609608

610609
财富基尼系数的时间序列呈现出 U 形走势,在20世纪80年代初之前下降,然后迅速上升。
611610

612-
一个可能的原因是这种变化主要由技术驱动的
611+
一个可能的原因是这种变化是主要由技术驱动的
613612

614613
然而,我们将在下文中看到,并非所有发达经济体都经历了类似的不平等增长。
615614

@@ -624,7 +623,7 @@ data = gini_all.unstack()
624623
data.columns
625624
```
626625

627-
此数据集中包含167个国家的数据
626+
此数据包中涵盖了167个国家的数据
628627

629628
让我们比较三个发达经济体:美国、英国和挪威。
630629

@@ -643,15 +642,15 @@ ax.legend(labels=["美国", "英国", "挪威"], title="")
643642
plt.show()
644643
```
645644

646-
我们看到挪威的数据时间序列较短
645+
我们发现挪威的数据时间序列较短
647646

648647
让我们仔细查看底层数据,看看是否可以修正这个问题。
649648

650649
```{code-cell} ipython3
651650
data[['NOR']].dropna().head(n=5)
652651
```
653652

654-
此数据集中挪威的数据可以追溯到1979年,但时间序列中存在空缺,matplotlib 没有显示这些数据点。
653+
此数据包中挪威的数据可以追溯到1979年,但时间序列中存在空缺,所以matplotlib 没有显示这些数据点。
655654

656655
我们可以使用 `.ffill()` 方法来复制并前移序列中的最后已知值,以填补这些空缺。
657656

@@ -671,13 +670,13 @@ ax.legend(labels=["美国", "英国", "挪威"], title="")
671670
plt.show()
672671
```
673672

674-
从该图中我们可以观察到,与英国和挪威相比,美国的基尼系数更高(即收入不平等程度更高)。
673+
从这个图中我们可以观察到,与英国和挪威相比,美国的基尼系数更高(即收入不平等程度更高)。
675674

676675
挪威在这三个经济体中基尼系数最低,而且基尼系数没有上升的趋势。
677676

678677
### 基尼系数与人均GDP(随时间变化)
679678

680-
我们还可以查看基尼系数与人均GDP的比较(随时间变化)
679+
我们还可以查看(随时间变化的)基尼系数与人均GDP的比较
681680

682681
让我们再次关注美国、挪威和英国。
683682

@@ -846,11 +845,11 @@ plt.show()
846845
```{exercise}
847846
:label: inequality_ex1
848847
849-
使用模拟计算系列对数正态分布的前10%份额,这些对数正态分布与随机变量 $w_\sigma = \exp(\mu + \sigma Z)$ 相关联,其中 $Z \sim N(0, 1)$ 且 $\sigma$ 在一个从 $0.2$ 到 $4$ 的有限网格上变化。
848+
使用模拟数据来计算对数正态分布的前10%份额,这些对数正态分布与随机变量 $w_\sigma = \exp(\mu + \sigma Z)$ 相关联,其中 $Z \sim N(0, 1)$ 且 $\sigma$ 在一个从 $0.2$ 到 $4$ 的有限网格上变化。
850849
851850
随着 $\sigma$ 的增加,$w_\sigma$ 的方差也在增加。
852851
853-
为了关注波动性,在每一步调整 $\mu$ 以保持等式 $\mu = -\sigma^2 / 2$ 为真
852+
为了关注波动性,在每一步调整 $\mu$ 以保持等式 $\mu = -\sigma^2 / 2$ 成立
854853
855854
对于每个 $\sigma$,生成2000个 $w_\sigma$ 的独立抽样,并计算洛伦兹曲线和基尼系数。
856855
@@ -872,7 +871,7 @@ def calculate_top_share(s, p=0.1):
872871
return s[index:].sum() / s.sum()
873872
```
874873

875-
继续使用上面定义的 `calculate_top_share` 函数和之前定义的 `lorenz_curve` 以及 `gini_coefficient` 函数,我们可以为各个 σ 值生成统计数据,并绘制变化趋势。
874+
继续使用上面定义的 `calculate_top_share` 函数和之前定义的 `lorenz_curve` 以及 `gini_coefficient` 函数,我们可以为各个 $\sigma$ 值生成统计数据,并绘制变化趋势。
876875

877876
```{code-cell} ipython3
878877
k = 5

0 commit comments

Comments
 (0)