データ

Python

【Python】データフレームのメソッドから簡単に水平棒グラフを作成する(DataFrame.plot.barh)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。(今回は水平棒グラフ!) 本記事では、水平棒グラフの生成について解説します。水平棒グラフは基本的には棒グラフと同じ要...
Python

【Python】データフレームの列の型を変換する方法(Pandas.DataFrame.astype)

本記事では、PythonライブラリPandasのデータフレームにおける列の型を変換する方法を紹介します。データサイエンスの現場において、データフレーム列の型を変換するシチュエーションとして、数値データだと思っていた列が実は文字列になっていた...
数理最適化

【数理最適化】注目の数理最適化のおすすめ書籍【2023年版】

こんにちは。本記事では私のオススメする数理最適化の書籍を紹介します。数理最適化とは、有名なアプローチだと「巡回セールスマン問題」や「広告予算配分」などの問題で利用されることが多いです。そんなどこかで耳にしたことのあるであろう様々な問題を解決...
Python

【Python】高効率でデータフレームをローカルに保存する(Pandas.DataFrame.to_parquet)

先日YouTubeでPandasデータフレームのto_csvメソッドは最遅方法であることを解説してくれた動画を拝見しました。自分でも実行してみたら、まさにその通りでびっくりでしたので、記事にまとめます。データの前処理を一時保存したり、処理の...
Python

【Python】データフレームで文字を指定して列を分割する(pd.DataFrame / str.split)

本記事は、PythonのライブラリPandasのデータフレームの列の分割について解説した記事になります。データフレームの1列を分割するようなシチュエーションは、だいたい前処理の過程でしょう。例えばメールアドレスからドメイン数を集計したかった...
Python

【Python】データフレームのメソッドから簡単に棒グラフを作成する(DataFrame.plot.bar)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、棒グラフの生成を解説します。棒グラフはカテゴリーの数量などを表示することに適しています。またカテゴリーに...
コラム

【データサイエンティスト協会】スキルチェックリストの紹介

先日、データサインティスト検定の試験日程などが発表されました。私は第1回受験の合格者ということもあり、データサイエンティスト検定(DS検定)が盛り上がりを見せてくれると嬉しい気持ちになります。さて、そんなデータサイエンティスト検定ですが、現...
Python

【Python】進捗表示(プログレスバー)で使えるtqdm(tqdm.tqdm)

本記事は、Pythonの繰り返し処理for文で進捗状態を表示できる「tqdm」について紹介いたします。私自身データサイエンティストとして業務を行なっていますが、Pythonでの処理が多く、かつデータ量も多かったりするので、そんなときにこの「...
Python

【Python】データフレームのメソッドから簡単に折れ線グラフを作成する(DataFrame.plot.line)

PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、折れ線グラフの生成を解説します。折れ線グラフは、連続する要素の変化に対して結果の推移を表す際に使用される...
Python

【Python】データフレームのメソッドから簡単に散布図を生成する(DataFrame.plot.scatter)

本記事では、PythonのライブラリPandasのDataFrameのメソッドを使用して簡単にさまざまなグラフを生成することができます。本記事では、散布図の生成を解説します。散布図はデータの分布などを可視化する際に使用することが多いです。主...