「自分のアプリ、OpenAIにどれくらいトークン使ってるんだろう…」「どのAPIコールが遅いのか全然わからない…」
そんな悩みを抱えている方に、朗報です!🎉
SpanlensというオープンソースのLLM監視ツールが、開発者コミュニティで注目を集めています。なんとたった1行の変更で、AIアプリのAPI呼び出し全体を丸ごと可視化できてしまうんですよね。
Spanlensって何者?

Spanlensは、LLMオブザーバビリティ(可観測性)プラットフォームです。ちょっと難しい言葉ですが、イメージとしては「AIへのAPI呼び出しをすべて記録・モニタリングしてくれるダッシュボード」だと思ってください。
対応しているプロバイダーがかなり充実しています。
- ✅ OpenAI
- ✅ Anthropic(Claude)
- ✅ Google Gemini
- ✅ Mistral
- ✅ OpenRouter
- ✅ Azure OpenAI
- ✅ Ollama(ローカルLLM)
主要なAIプロバイダーをほぼ網羅しているのが嬉しいポイントです。ライセンスはMITライセンスなので、商用プロジェクトにも安心して使えます。
導入は本当に1行だけ?
Spanlensの最大の魅力は、導入のシンプルさです。仕組みはプロキシ方式で、Spanlensのプロキシ経由でAPIリクエストを送ることで、全通信を透過的に記録します。
CLIツールを使えば、コードを自動で書き換えてくれるウィザードが起動します。
# Spanlensのウィザードを起動(コードを自動書き換えしてくれる)
npx @spanlens/cli init
手動で設定したい場合は、既存のクライアントのbaseURLをSpanlensのプロキシURLに向けるだけです。たとえばPythonでOpenAIクライアントを使っている場合はこんな感じです。
from openai import OpenAI
# ここを変えるだけ!もとのOpenAIのURLをSpanlensプロキシに向ける
client = OpenAI(
api_key="your-openai-api-key",
base_url="https://proxy.spanlens.io/openai" # ← この1行が肝
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[{"role": "user", "content": "こんにちは!"}]
)
print(response.choices[0].message.content)
ポイントをまとめるとこんな感じです。
- 既存コードの変更はbase_urlの差し替えのみ
- APIキーや呼び出し方法はそのまま変えなくてOK
- プロキシが間に入るだけなので、レスポンス自体は変わらない
何が記録されるの?
Spanlensを通したリクエストは、以下の情報が自動的に記録されます。
- 📊 使用モデル名
- 🔢 消費トークン数(入力・出力それぞれ)
- ⏱️ レイテンシ(応答時間)
- 💰 コスト見積もり
これ、AIアプリを本番運用するときに絶対に把握しておきたい情報ばかりですよね。「今月のAPI費用がいつのまにか爆増していた…」という事態を防げるのが大きいです。
まとめ
Spanlensは、1行の変更でLLMのAPI呼び出し全体を可視化・監視できるオープンソースツールです。OpenAIからOllamaまで主要プロバイダーをカバーしており、コスト管理やパフォーマンス改善に役立ちます。
AIを使ったアプリを開発している方は、ぜひ一度試してみてください 🚀 「むずかしそう」を「できそう」に変えてくれる、嬉しいツールです!





