トークンとは？｜AI専門用語をわかりやすく解説！

「ChatGPTのトークン上限って何？」「トークン数で料金が変わるのはなぜ？」そんな疑問を持ったことはありませんか？

トークンとは、AIが文章を理解・生成する際の最小処理単位です。ChatGPTなどの生成AIは、文章をトークンに分解して処理しており、トークン数はAIの処理能力やコストに直結する重要な概念です。

この記事では、トークンの仕組みやカウント方法、料金との関係、ビジネスでの活用ポイントまでわかりやすく解説します。

1. はじめに

ChatGPTやClaudeなどの生成AIを使っていると、「トークン数」「トークン上限」「コンテキストウィンドウ」といった言葉を目にすることがあります。AIのAPI利用料金もトークン数で計算されるため、トークンの仕組みを理解することはAI活用の基本です。

しかし、「トークンとは具体的に何なのか」「なぜ文字数ではなくトークン数でカウントするのか」がわかりにくいと感じている方も多いのではないでしょうか。

この記事では、トークンの基本的な概念から実務での活用ポイントまで、初心者の方にもわかりやすく解説していきます。

トークンとは、AIが文章を処理する際の最小単位です。AIは入力された文章をそのまま理解するのではなく、まずトークンという細かいパーツに分解（トークナイズ）してから処理を行います。

トークンの主な特徴は以下の通りです。

例えば「おはようございます」という文章は、AIの内部では「お」「は」「よう」「ござ」「います」のように複数のトークンに分解されます。このトークン化の処理を「トークナイゼーション」と呼びます。

トークンの概念は、生成AIのさまざまな場面で登場します。

場面	トークンの関わり方
ChatGPTとの会話	入力（質問）と出力（回答）の両方がトークンとしてカウントされる
API利用料金	入力トークン数＋出力トークン数で料金が計算される
コンテキストウィンドウ	AIが一度に処理できるトークン数の上限（例：GPT-4oは128Kトークン）
長文の入力制限	トークン上限を超えると、古い会話内容が切り捨てられる
翻訳・要約	入力テキストと出力テキストのトークン数で処理コストが決まる

日常的にChatGPTを使う場合はトークンを意識する必要はあまりありませんが、APIを利用したアプリ開発やビジネス活用では、トークン数の管理がコスト最適化の重要なポイントになります。

AIがテキストをトークンに分解する処理は「トークナイザー」と呼ばれるプログラムによって行われます。代表的なトークナイザーの仕組みを紹介します。

BPE（Byte Pair Encoding）：最も広く使われている方式です。頻出する文字の組み合わせを1つのトークンとしてまとめていきます。OpenAIのGPTシリーズで採用されています。
SentencePiece：Googleが開発したトークナイザーで、言語に依存しない分割が可能です。日本語のような言語でも効率的にトークン化できます。
WordPiece：BERTなどのモデルで使用される方式です。単語をサブワード（単語の断片）に分割して処理します。

トークン数の目安として、英語では「1トークン ≒ 4文字」「1,000トークン ≒ 750単語」程度です。日本語は英語より多くのトークンを消費する傾向があり、同じ内容でも日本語の方がトークン数が多くなります。

AIの性能を表す「コンテキストウィンドウ」は、AIが一度に処理できるトークン数の上限を示します。例えばGPT-4oは128Kトークン（約12万8千トークン）のコンテキストウィンドウを持ちます。

トークンの概念を理解することは、ビジネスでのAI活用において重要です。

API利用コストの最適化：プロンプトの設計を工夫してトークン数を削減することで、API利用料金を大幅に節約できます。不要な説明を省いたり、出力形式を指定したりすることが有効です。
AIアプリケーションの設計：コンテキストウィンドウの上限を考慮したシステム設計が必要です。長い文書を扱う場合は、文書を分割して処理するなどの工夫が求められます。
応答品質の向上：トークン数を意識したプロンプト設計により、AIから得られる回答の品質を向上させることができます。
多言語対応の考慮：日本語は英語よりトークン消費量が多いため、多言語対応のサービスではコスト差を考慮した設計が重要です。
パフォーマンスの最適化：トークン数が多いほどAIの処理時間も長くなるため、リアルタイム性が求められるサービスではトークン数の管理がパフォーマンスに直結します。