Pandas模塊是python中很重要的一個存在,它可以將同一索引下的數據進行合并,幫助大家更好的進行數據分析!最初是用于金融行業數據分析,后來得以在各個行業中廣泛運行。

軟件介紹

Pandas是python的一個數據分析包,最初由AQR Capital Management于2008年4月開發,并于2009年底開源出來,目前由專注于Python數據包開發的PyData開發team繼續開發和維護,屬于PyData項目的一部分。Pandas最初被作為金融數據分析工具而開發出來,因此,pandas為時間序列分析提供了很好的支持。 Pandas的名稱來自于面板數據(panel data)和python數據分析(data analysis)。panel data是經濟學中關于多維數據集的一個術語,在Pandas中也提供了panel的數據類型。

Pandas模塊

Python中pandas模塊快速入門

我這里簡單介紹一下Python中,pandas模塊定義的兩種常用的數據結構,Series和DaraFrame。Series和Python中的Dict類似,但是是結構化的,而DataFrame和數據庫中的表類似。

1.pandas基本數據結構-pandas.Series&pandas.DataFrame

第二種定義DataFrame的方法不能手動設置index,只能自動生成序列。

date_range('20180201',periods=8)定義時間序列,可以用freq來設置頻率:s=pd.date_range('20180101',periods=8,freq='h')

支持的頻率有s、min、h、d、w、m、y,默認為d

2.pandas查看數據

3.pandas常規操作

更新日志

包括許多API更改、新特性、增強和性能改進,以及大量bug修復。

亮點包括:

刪除Python 2支持

使用重新標記的Groupby聚合

更好的多指標報告

更好的截斷repr的系列和數據aframe

Pandas for pythonv0.25.0 免費版下載地址

遠程下載