pandas

出典: フリー百科事典『ウィキペディア(Wikipedia)』

出典: フリー百科事典『ウィキペディア(Wikipedia)』
pandas
Pandas logo.svg
作者 The PyData Development Team
開発元 コミュニティ開発
最新版 0.24.2[1] / 2019年3月16日(53日前) (2019-03-16
リポジトリ github.com/pandas-dev/pandas
プログラミング言語 Python
対応OS クロスプラットフォーム
種別 数値計算統計
ライセンス BSDライセンス
公式サイト http://pandas.pydata.org/
テンプレートを表示

pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する[2]。PandasはBSDライセンスのもとで提供されている[3]

特徴[編集]

  • データ操作のための高速で効率的なデータフレーム (DataFrame) オブジェクト
  • メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSVテキストファイルExcelSQLデータベース、HDF5フォーマットなど
  • かしこいデータのアライメントおよび統合された欠損値処理
  • データセットの柔軟な変形およびピボット
  • ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得
  • データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful groupを使ったデータの集計および変換
  • 高性能なデータセットのマージと結合
  • 時系列データ: 日付範囲生成[4]、周波数変換、移動窓を用いた統計値や線形回帰、シフトと遅延、など
  • パフォーマンスのための高度な最適化。重要なコードはCythonまたはC言語で実装されている[5]

歴史[編集]

開発者であるWes McKinneyは、財務データを定量分析するための高性能で柔軟なツールを欲しており、AQR Capital Managementにて2008年にpandasの開発を開始した。 AQRを去る前に上司を説得し、ライブラリの一般公開が可能となった。

別のAQR従業員であるChang Sheは、2012年からこのライブラリの2番目の主要コントリビューターとなった。同時期に、Pythonコミュニティでライブラリが普及し、さらに多くのコントリビューターがプロジェクトに加わることになった。

2015年、pandasはNumFOCUS(アメリカ合衆国における501(c)(3)非営利慈善団体)の財政出資プロジェクトとして署名した[6]

参考文献[編集]

  1. ^ Release Notes – pandas 0.24.2 documentation”. pandas (2019年3月16日). 2019年3月16日閲覧。
  2. ^ Wes McKinney (2011年). “pandas: a Foundational Python Library for Data Analysis and Statistics”. 2018年8月2日閲覧。
  3. ^ License – Package overview – pandas 0.21.1 documentation”. pandas (2017年12月12日). 2017年12月13日閲覧。
  4. ^ pandas.date_range – pandas 0.21.1 documentation”. pandas (2017年12月12日). 2017年12月13日閲覧。
  5. ^ Python Data Analysis Library – pandas: Python Data Analysis Library”. pandas. 2017年11月13日閲覧。
  6. ^ NumFOCUS – pandas: a fiscally sponsored project”. NumFOCUS. 2018年4月3日閲覧。

関連項目[編集]