やりたいことから調べるPythonサンプルコードリスト 〜Pandas編〜 ※随時更新

やりたいことから調べるPythonサンプルコードリスト 〜Pandas編〜 ※随時更新

やりたいことが頭に浮かんだらそれをすぐに実行できるようなサンプルコードリストが欲しい!、それがあれば頭の中のイメージをすぐ再現できるようになるはず!

ということで、私が日々「これをやりたい!」と思ったことと、それを実現できるサンプルコードを随時更新していきます!

なお、このページで使用しているデータセットはkaggleで公開されているTitanic: Machine Learning from Disasterを使用しています。

CSV ファイルを読み込んで、DataFrame形式にしたい

DataFrameを新規作成・編集したい

DataFrameの先頭・後尾10行を表示したい

()の中に数値を指定しない(df.head() / df.tail())だと先頭・後尾5行が表示される。

DataFrameを縦横入れ替えて表示したい

DataFrameの表示を省略されないようにしたい

特定の列に含まれる値・文字列のパターンを知りたい

unique関数はSeries object (1列のデータ)に対するユニークな値を返すので、[]内には列名を指定する。
pandas.Series.unique documentation

特定の列に含まれる値・文字列の出現回数を知りたい

pandas.Series.value_counts documentation

特定の列に含まれる値・文字列の出現回数を整形して出力したい

各列・各行の要素数を知りたい

pandas.DataFrame.count documentation
pandas.DataFrame.shape documentation

列名一覧を取得したい

pandas.DataFrame.values documentation

欠損値の数を調べたい

pandas.DataFrame.isnull documentation

欠損値のある列名と欠損数・欠損割合を表示させたい

表示例

四捨五入したい

pandas.DataFrame.round documentation

基本統計量(平均値、標準偏差、中央値、最大値、最小値等)を取得したい

pandas.DataFrame.describe documentation

DataFrameをCSVファイルとして保存したい

pandas.DataFrame.to_csv

DataFrameをpickle化して外部保存したい

リストや辞書型も同様にpickle化可能
pickle documentation

DataFrameの表示に色付けしたい

styling機能で条件付き書式設定ができる模様。勉強中...
pandasのStyling機能で強化するJupyter実験レポート / PyConJP 2019