Gammaのサブスクリプションプランには特定のAIトークン数が含まれていることにお気づきだろうか。
GammaはOpenAIのトークンの定義を使っている:
トークンは言葉の断片と考えることができる。APIがリクエストを処理する前に、入力はトークンに分解される。これらのトークンは、単語の先頭や末尾で正確に切り分けられるわけではありません。トークンには、末尾のスペースやサブワードさえも含まれることがあります。
単語をどのようにトークンに分割するかも言語に依存する。例えば「Cómo estás」(スペイン語で「お元気ですか」)は5つのトークンを含む(10文字分)。トークン対文字の比率が高くなると、英語以外の言語のAPIを実装するコストが高くなります。
GammaのPlus契約プランでは1世代につき5万AIトークンまで、GammaのPro契約プランでは1世代につき10万AIトークンまで利用できる。
OpenAIは無料のトークナイザーを提供しており、これを使うと、テキストが言語モデルによってどのようにトークン化されるかを理解し、そのテキストに含まれるトークンの総数を把握することができます。https://platform.openai.com/tokenizer