Pandas模塊是python中很重要的一個存在,它可以將同一索引下的數據進行合并,幫助大家更好的進行數據分析!最初是用于金融行業數據分析,后來得以在各個行業中廣泛運行。
軟件介紹
Pandas是python的一個數據分析包,最初由AQR Capital Management于2008年4月開發,并于2009年底開源出來,目前由專注于Python數據包開發的PyData開發team繼續開發和維護,屬于PyData項目的一部分。Pandas最初被作為金融數據分析工具而開發出來,因此,pandas為時間序列分析提供了很好的支持。 Pandas的名稱來自于面板數據(panel data)和python數據分析(data analysis)。panel data是經濟學中關于多維數據集的一個術語,在Pandas中也提供了panel的數據類型。

Python中pandas模塊快速入門
我這里簡單介紹一下Python中,pandas模塊定義的兩種常用的數據結構,Series和DaraFrame。Series和Python中的Dict類似,但是是結構化的,而DataFrame和數據庫中的表類似。
1.pandas基本數據結構-pandas.Series&pandas.DataFrame
第二種定義DataFrame的方法不能手動設置index,只能自動生成序列。
date_range('20180201',periods=8)定義時間序列,可以用freq來設置頻率:s=pd.date_range('20180101',periods=8,freq='h')
支持的頻率有s、min、h、d、w、m、y,默認為d
2.pandas查看數據
3.pandas常規操作
更新日志
包括許多API更改、新特性、增強和性能改進,以及大量bug修復。
亮點包括:
刪除Python 2支持
使用重新標記的Groupby聚合
更好的多指標報告
更好的截斷repr的系列和數據aframe




