gists

claude code の ↓11 token って何を表現してる？17:54Claude Codeの表示についてですね。ウェブを検索しましたウェブを検索しました↓11 tokens は、そのリクエストでモデルから出力（ダウンロード）されたトークン数が11トークンであることを示しています。ただし、この矢印の向きについてはGitHubでも議論があり、直感に反するという指摘が出ています。通常のネットワーク慣習では「↓＝ダウンロード＝サーバーからクライアントへ」ですが、Claude Codeでは「↓」を入力トークン（クライアント→モデルへ送った量）として使っている GitHubとのことです。つまり、スクリーンショットの ↓11 tokens はモデルに送られた入力トークンが11トークンだったという意味になります。Temperingステップでは、ほぼ出力のみ（thinking）で入力が少なかったため、このような小さい数字になっていると考えられます。3min も待っているのはなぜだろう、モデルに送った量は少ないんでしょ？17:55いい質問ですね。入力トークンが少なくても時間がかかる理由は、ステータスに表示されている thinking にあります。スクリーンショットを見ると Tempering（3m 8s · ↓11 tokens · thinking）となっていますが、この「thinking」は拡張思考（extended thinking）モードで、モデルが内部で長時間推論しているということです。つまり、送ったデータ（入力）は少なくても、モデル側が内部で深く考え込んでいるので時間がかかっています。拡張思考中のthinkingトークンは大量に生成されていますが、↓11 tokensのカウントにはthinkingトークンが含まれていない可能性が高いです。実際にモデルが出力した「目に見える応答」だけが11トークンで、裏側ではずっと思考トークンを生成し続けていた、という状況だと思われます。 3分以上かかったのは、Claudeが複雑なタスク（173件のemoji/descriptionの処理結果をまとめる作業）に対して、内部で慎重に推論していたからでしょう。

This site is open source. Improve this page.