Pandas是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。
Pandas特色
Pandas 适用于处理以下类型的数据:
- 与 SQL 或 Excel 表类似的,含异构列的表格数据;
- 有序和无序(非固定频率)的时间序列数据;
- 带行列标签的矩阵数据,包括同构或异构型数据;
- 任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。
Pandas数据结构
Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。对于 R 用户,DataFrame 提供了比 R 语言 data.frame 更丰富的功能。Pandas 基于 NumPy 开发,可以与其它第三方科学计算支持库完美集成。
维数 | 名称 | 描述 |
---|---|---|
1 | Series | 带标签的一维同构数组 |
2 | DataFrame | 带标签的,大小可变的,二维异构表格 |
Pandas用法
Pandas用法与Matlab中矩阵操作很类似,熟悉Matlab操作的同学可以很快上手Pandas。
生成对象
生成Series对象:
1 | In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) |
生成DataFrame对象:
1 | In [7]: df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD')) |
参考链接
- Pandas 中文,by pypandas.
- 十分钟入门 Pandas,by pypandas.
- Python读取csv文件的三种方式,by 涛声依旧2019.
- Python模块化开发组织代码程序示例,by BabyFish13.
- Python最佳实践指南!,by Prodesire.