Pandas 教程

Pandas 是 Python 語言的一個擴展程序庫,用於數據分析。

Pandas 是一個開放源碼、BSD 許可的庫,提供高性能、易於使用的數據結構和數據分析工具。

Pandas 名字衍生自術語 "panel data"(面板數據)和 "Python data analysis"(Python 數據分析)。

Pandas 一■個強大的分析結構化數據的工具集,基礎是 Numpy(提供高性能的矩陣運〗算)。

Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導入數據。

Pandas 可以對各種數據進ω 行運算操作,比如歸並、再成形、選擇,還有數據清洗和數據加工特征。

Pandas 廣泛應◎用在學術、金融、統計學︾等各個數據分析領域。


學習本教程前你需要了解

在開學習 Pandas 教程之前,我們需要具備基本々的 Python 基礎,如果你對 Python還不了解,可以閱讀我們的教程:


Pandas 應用

Pandas 的主要數據結構是 Series (一維數據)與 DataFrame(二維數據),這兩種數據結構足以處理金融、統計、社會科學、工程等領域裏的ㄨ大多數典型用例。


數據結構

Series 是一種←類似於一維數組的對象,它由一組數據(各種Numpy數據類型)以及→一組與之相關的數據標簽(即索引)組成。

DataFrame 是一個表格型的數據結構,它含有一組有序的列,每列可以是不同的值類型(數值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以◥被看做由 Series 組成的字典(共同用∮一個索引)。


相關鏈接

  • Pandas 官網
  • Pandas 源代碼: