プログラミング入門

pandasをゼロから学ぶ!AI×量子トレーダー養成講座 Day5 データ構造入門

「pandasって名前は聞いたことあるけど、何がそんなにすごいの?」そんな疑問を持っている方、多いんじゃないでしょうか。😊

今回は海外で話題の学習シリーズ godzilla.dev の「AI x Quant Trader Series — Day 5」 で取り上げられている内容をもとに、Pythonデータ処理の最強ライブラリ pandas の基本データ構造を、日本語で丁寧に解説していきます!

対象読者は Python初〜中級者。「pandasを触ったことがない」という方でも、ざっくりとした流れがつかめるはずです。

🐼 pandasって何者?

data analysis chart
data analysis chart / Photo by RDNE Stock project via Pexels

ひと言で言うと、「Pythonで表(テーブル)データを扱うためのライブラリ」です。

イメージとしては、ExcelやGoogle スプレッドシートをPythonのコードで操作できるようにしたもの、と思ってもらうとわかりやすいです。株価データや売上データのような「行と列」で構成されたデータを扱うのが得意で、AI・機械学習の前処理には欠かせない存在なんですよね。

📦 pandasの2大データ構造

pandasには主に2つのデータ構造があります。まずここをしっかり押さえましょう。

  • Series(シリーズ):1次元のデータ。Excelの「1列分」のイメージ
  • DataFrame(データフレーム):2次元のデータ。Excelの「シート全体」のイメージ

この2つを使いこなすことが、pandasマスターへの第一歩です!

🛠️ 実際にコードを書いてみよう

ポイントをまとめるとこんな感じです。

  • Series は pd.Series() でリストや辞書から作れる
  • DataFrame は pd.DataFrame() で辞書を渡すのが基本
  • インデックス(行ラベル)を自分で指定できる
import pandas as pd

# ── Series の作成 ──
# 株価の終値データをSeriesで表現するイメージ
prices = pd.Series(
    [150.5, 152.3, 148.9, 155.0],
    index=["2026-07-01", "2026-07-02", "2026-07-03", "2026-07-04"]
)
print(prices)
# 2026-07-01    150.5
# 2026-07-02    152.3
# 2026-07-03    148.9
# 2026-07-04    155.0
# dtype: float64

# ── DataFrame の作成 ──
# 複数の銘柄の終値をまとめて1つの表にする
df = pd.DataFrame({
    "date": ["2026-07-01", "2026-07-02", "2026-07-03"],
    "AAPL": [190.2, 191.8, 189.5],
    "GOOG": [140.1, 141.0, 139.7],
})
print(df)
#          date   AAPL   GOOG
# 0  2026-07-01  190.2  140.1
# 1  2026-07-02  191.8  141.0
# 2  2026-07-03  189.5  139.7

Seriesが「1列」、DataFrameが「複数列をまとめた表」になっているのがイメージできたでしょうか?

🔍 基本操作もあわせて覚えよう


データ構造を作れるようになったら、次は「よく使う操作」を押さえておくと実務でもすぐに役立ちます。

  • df.head() — 先頭数行だけを確認する
  • df["AAPL"] — 列を1つ取り出す(Seriesとして返ってくる)
  • df[df["AAPL"] > 190] — 条件を満たす行だけを絞り込む
  • df.describe() — 平均・最大・最小などの統計量をまとめて確認する
# AAPLが190を超えた日だけ抽出
print(df[df["AAPL"] > 190])
#          date   AAPL   GOOG
# 1  2026-07-02  191.8  141.0

# 統計量をまとめてチェック
print(df.describe())

この「条件で絞り込む」書き方は、for文でループを回すより圧倒的に速く、コードもシンプルになります。AI・量子トレーディングのようにデータ量が多い分野ほど、この書き方の恩恵は大きくなりますよ📈

まとめ

今回のポイントを整理するとこんな感じです👇

  • ✅ pandasは「Pythonで表データを扱うライブラリ」
  • ✅ Series(1次元)とDataFrame(2次元)が2大データ構造
  • df["列名"]や条件式で、直感的にデータを取り出せる

まずは自分の手元にあるCSVデータをDataFrameに読み込んでみるところから始めてみてください。「あ、意外と簡単かも」と感じてもらえるはずです。一緒に手を動かしていきましょう!💪

📚 関連商品・おすすめ書籍

スッキリわかるPython入門 第2版 (スッキリわかる入門シリーズ)

もしも

スッキリわかるPython入門 第2版 (スッキリわかる入門シリーズ)

初心者に定番のPython入門書

Amazonで見る

実践Claude Code入門―現場で活用するためのAIコーディングの思考法

もしも

実践Claude Code入門―現場で活用するためのAIコーディングの思考法

AIコーディングの現場活用法を学ぶ一冊

Amazonで見る

Python Web開発実践入門 ―― FastAPIによるWebAPI開発と非同期処理

もしも

Python Web開発実践入門 ―― FastAPIによるWebAPI開発と非同期処理

FastAPIでWebAPI開発を実践的に学ぶ

Amazonで見る

※本記事にはアフィリエイトリンクが含まれます。

ABOUT ME
やまちゃん
これまで学生と社会人を合わせて5000人以上にプログラミング学習を指導。 ゼロからイチをわかりやすく解説する専門家として活動しており、本業ではArduinoを用いたIoT開発とロボットプログラミングが専門。 Pythonを用いたアプリ開発、ウェブアプリケーションの開発で業務の効率化をサポートしています。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です