データ

Python

【Python】データフレームの最大値の行名・列名を取得する(DataFrame.idxmax)

こんにちは。本記事では、PythonのライブラリであるPandasのデータフレームでの最大値を持つ行名・列名の取得について取り扱います。特に最大値がデーアフレーム内のどこにあるかを特定させたい場合などに、使用することが多いイメージです。私も...
統計学

欠損値には発生パターンがあるらしい(MCAR, MAR, MNAR)

本記事では、データ分析の敵とも言えるデータの「欠損値」の発生パターンについて書きます。特に欠損値には発生パターンがあるということを最近人から教えていただきましたので、それを調べたので備忘録として書かせていただきます。 はじめに 先日欠損値に...
Python

【Python】Pandasデータフレームの列をインデックスに変換する(DataFrame.set_index)

本記事では、PythonライブラリPandasの、データフレームの列をインデックスに変換する処理を紹介・解説します。難しいことはないので、コードを読んでサクッと次の処理へ進んでって下さい。列→インデックス、インデックス→列の変換は、私のデー...
Python

【Python】データフレームを条件抽出する(DataFrame.query)

本記事はPythonのライブラリである「Pandas」のデータフレームのデータ抽出について取り扱います。SQLのように、テーブル上のデータに条件をかけてその条件に該当する行を抽出するにはどうしたら良いか解説いたします。 該当コード まずはシ...
教養

【書評】「AI・データ倫理の教科書」著:福岡真之介/弘文堂 

本サイトをご覧いただきありがとうございます。弘文堂から2022年6月に出版されている「AI・データ倫理の教科書」についての書評記事を書いていきます。もはや当たり前になった「AI」。データサイエンティストとして、間違ったような、ちょっと違うよ...
Python

【Python】データフレームの列名変更とその用途

本記事をご覧いただきありがとうございます。本記事では、Pythonのライブラリ、Pandasのデータフレームの列名に関する処理について取り扱います。本記事のターゲットは、データフレームの取り扱いにまだそこまで慣れていない方を対象としています...
資格

【ITストラテジスト】おすすめ通信講座(STUDYing)

本記事では、タイトルの通り、「ITストラテジスト」の通信講座を展開し始めたSTUDYingの講座を紹介いたします。私も身銭を切って受講し始めましたので、辛めに書いていきたいと思います。実際にITストラテジストを目指しておりますので、フル活用...
Python

【Python】データフレームの欠損値を削除する

本記事では、Pythonのライブラリ、Pandasのデータフレーム内の欠損値削除について解説します。データ分析に付き物の欠損値ですが、欠損値の取り扱いは非常に奥が深いものになっています。考え方として、画一的な処理はなるべく避けるべきですが、...
その他

【Googleスプレッドシート】query関数の簡単な使い方解説

こんにちは。当サイトへお越しいただきありがとうございます。本記事では、Googleスプレッドシートのquery関数について解説いたします。このquery関数の動作は、エクセルでは実現できない(2023年1月現在)動きなので、スプレッドシート...
Python

【Python】データフレーム同士を結合する

本記事では、プログラミング言語のPythonにおけるライブラリ、Pandasのデータフレーム処理の一つ、データフレーム同士の結合について紹介します。本記事のターゲットは、ピンポイントでデータフレーム同士の結合方法を忘れた方や、Pythonの...