「pandasって名前は聞いたことあるけど、何がそんなにすごいの?」そんな疑問を持っている方、多いんじゃないでしょうか。😊
今回は海外で話題の学習シリーズ godzilla.dev の「AI x Quant Trader Series — Day 5」 で取り上げられている内容をもとに、Pythonデータ処理の最強ライブラリ pandas の基本データ構造を、日本語で丁寧に解説していきます!
対象読者は Python初〜中級者。「pandasを触ったことがない」という方でも、ざっくりとした流れがつかめるはずです。
🐼 pandasって何者?
ひと言で言うと、「Pythonで表(テーブル)データを扱うためのライブラリ」です。
イメージとしては、ExcelやGoogle スプレッドシートをPythonのコードで操作できるようにしたもの、と思ってもらうとわかりやすいです。株価データや売上データのような「行と列」で構成されたデータを扱うのが得意で、AI・機械学習の前処理には欠かせない存在なんですよね。
📦 pandasの2大データ構造
pandasには主に2つのデータ構造があります。まずここをしっかり押さえましょう。
- Series(シリーズ):1次元のデータ。Excelの「1列分」のイメージ
- DataFrame(データフレーム):2次元のデータ。Excelの「シート全体」のイメージ
この2つを使いこなすことが、pandasマスターへの第一歩です!
🛠️ 実際にコードを書いてみよう
ポイントをまとめるとこんな感じです。
- Series は
pd.Series()でリストや辞書から作れる - DataFrame は
pd.DataFrame()で辞書を渡すのが基本 - インデックス(行ラベル)を自分で指定できる
import pandas as pd
# ── Series の作成 ──
# 株価の終値データをSeriesで表現するイメージ
prices = pd.Series([150.5, 152.3, 148.9, 155.0],
index=[





