python PR

【最新版】pandasチートシートでデータ分析の効率アップ!使い方を徹底解説

記事内に商品プロモーションを含む場合があります

ど~も!データサイエンティストのえいせいです。

pythonのコードを書いていてよく、「あれっ、あの関数どうやって書くんだっけ?」という事がありますよね?
綴りなど細かい点を全て覚えるのは至難の業ですし、むしろわざわざ覚える手間がもったいないです。

そんな時はチートシートを活用しましょう。

今回はデータ分析で使うpandasの関数のチートシートを作成しました。
ぜひ活用してください。

pandasでデータの読み込み

以下がpandasの「データの読み込み」に関するチートシートです。

テキストファイルの読み込み

 

 

Excelファイルの読み込み

 

 

JSONファイルの読み込み

 

 

pandasでデータの選択

以下がpandasの「データの選択」に関するチートシートです。

 

基本的な選択方法

 

複数条件での選択方法

 

 

pandasでデータの操作

以下がpandasの「データの操作」に関するチートシートです。

条件による行の選択と並び替え

 

 

データの並び替えとフィルタリング

 

新しい列・行の作成と削除

 

欠損値の処理

 

 

pandasでデータの結合

以下がpandasの「データの結合」に関するチートシートです。

concat()

2つ以上のデータフレームを結合する。オプションとして、複数のデータフレームを同時に結合することもできる。

 

merge()

結合キーを指定してデータフレームを結合。共通の列またはインデックスを使用して、複数のデータフレームを結合することができる。

 

merge_ordered

2つのデータフレームを並べ替えながら結合する。
両方のデータフレームが時間的または序列的な情報を持っている場合に便利。

 

 

pandasでグループ化

以下がpandasの「グループ化」に関するチートシートです。
まずはサンプルのデータフレームを作成します。

 

単一カラムでのグループ化

 

複数カラムでのグループ化

 

グループによるフィルタリング

 

グループによるソート

 

グループによる変換

 

 

 

pandasでデータの集計と統計量の計算

以下がpandasの「データの集計と統計量の計算」に関するチートシートです。
まずはサンプルのデータフレームを作成します。

 

 

データを集計し統計量を求める

 

 

pandasでデータの保存とエクスポート

以下がpandasの「データの保存とエクスポート」に関するチートシートです。

 

基礎:データの保存

 

応用編:データの保存

 

 

 

以上がチートシート一覧になります。
pandasの操作に関して詳しく知りたい人は、全9回の無料講座で詳しく解説してますので、ご利用ください。

【python】データ分析のためのpandasの使い方①:データフレームの作成

書き方のお作法はPEP8が参考になります。

あなたにおススメの記事