0%

利用Python进行数据分析》读书笔记。
第 11 章:金融和经济数据应用

自2005年开始,python在金融行业中的应用越来越多。

这主要得益于越来越成熟的函数库(NumPy和pandas)以及大量经验丰富的程序员。

许多机构发现python不仅非常适合成为交互式的分析环境,也非常适合开发文件的系统,所需的时间也比Java或C++少得多。

Python还是一种非常好的粘合层,可以非常轻松为C或C++编写的库构建Python接口。

金融分析领域的内容博大精深。在数据规整化方面所花费的精力常常会比解决核心建模和研究问题所花费的时间多得多。

在本章中,术语截面(cross-section)来表示某个时间点的数据。

例如标普500指数中所有成份股在特定日期的收盘价就形成了一个截面。

多个数据在多个时间点的截面数据就构成了一个面板(panel)。

面板数据既可以表示为层次化索引的DataFrame,也可以表示为三维的Panel pandas对象。

Read more »

数据分析和建模的大量编程工作都是在数据准备上的:加载、清理、转换以及重塑。

pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法,
能够轻松地将数据规整化为正确的形式。
尤其,Pandas 的许多功能都来自实际应用中的需求。

数据规整主要包括:合并数据集、重塑和轴向旋转、数据转换、字符串操作。

Read more »