Python

Python

【Python】Pandasのqueryメソッドでデータフレームを操作する

Pandasは、Pythonでデータ解析を行うための強力なライブラリです。データフレームという構造を用いて、データの操作や加工が容易になります。この記事では、Pandasのqueryメソッドの使い方について解説します。特に、変数を使用するパ...
Python

【Python】データフレームのメソッドから簡単に水平棒グラフを作成する(DataFrame.plot.barh)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。(今回は水平棒グラフ!) 本記事では、水平棒グラフの生成について解説します。水平棒グラフは基本的には棒グラフと同じ要...
Python

【Python】データフレームの列の型を変換する方法(Pandas.DataFrame.astype)

本記事では、PythonライブラリPandasのデータフレームにおける列の型を変換する方法を紹介します。データサイエンスの現場において、データフレーム列の型を変換するシチュエーションとして、数値データだと思っていた列が実は文字列になっていた...
Python

【Python】高効率でデータフレームをローカルに保存する(Pandas.DataFrame.to_parquet)

先日YouTubeでPandasデータフレームのto_csvメソッドは最遅方法であることを解説してくれた動画を拝見しました。自分でも実行してみたら、まさにその通りでびっくりでしたので、記事にまとめます。データの前処理を一時保存したり、処理の...
Python

【Python】データフレームで文字を指定して列を分割する(pd.DataFrame / str.split)

本記事は、PythonのライブラリPandasのデータフレームの列の分割について解説した記事になります。データフレームの1列を分割するようなシチュエーションは、だいたい前処理の過程でしょう。例えばメールアドレスからドメイン数を集計したかった...
Python

【Python】データフレームのメソッドから簡単に棒グラフを作成する(DataFrame.plot.bar)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、棒グラフの生成を解説します。棒グラフはカテゴリーの数量などを表示することに適しています。またカテゴリーに...
Python

【Python】進捗表示(プログレスバー)で使えるtqdm(tqdm.tqdm)

本記事は、Pythonの繰り返し処理for文で進捗状態を表示できる「tqdm」について紹介いたします。私自身データサイエンティストとして業務を行なっていますが、Pythonでの処理が多く、かつデータ量も多かったりするので、そんなときにこの「...
Python

【Python】データフレームのメソッドから簡単に折れ線グラフを作成する(DataFrame.plot.line)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、折れ線グラフの生成を解説します。折れ線グラフは、連続する要素の変化に対して結果の推移を表す際に使用される...
Python

【Python】データフレームのメソッドから簡単に散布図を生成する(DataFrame.plot.scatter)

本記事では、PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、散布図の生成を解説します。散布図はデータの分布などを可視化する際に使用することが多いです。主...
Python

【Python】データフレームの最大値の行名・列名を取得する(DataFrame.idxmax)

こんにちは。本記事では、PythonのライブラリであるPandasのデータフレームでの最大値を持つ行名・列名の取得について取り扱います。特に最大値がデーアフレーム内のどこにあるかを特定させたい場合などに、使用することが多いイメージです。私も...