Token tracking y cálculo de costes por mensaje

- Config: COST_PER_1M_INPUT y COST_PER_1M_OUTPUT configurables via .env - OpenAI adapter: stream_options include_usage para capturar tokens reales - base.py: acumula input/output tokens de cada iteración del agente - planner.py: devuelve usage junto con el plan - engine.py: suma tokens de planner + steps + review, calcula coste USD - Response incluye usage{input_tokens, output_tokens} y total_cost_usd Formato compatible con el bridge de Claude Code CLI para integración con el frontend y reporting a Acai webservice. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-03 14:18:23 +00:00
parent 2712c2fd49
commit 7c891cf023
5 changed files with 60 additions and 10 deletions
--- a/src/orchestrator/agents/base.py
+++ b/src/orchestrator/agents/base.py
@@ -59,6 +59,8 @@ class BaseAgent:
        )
        tool_executions: list[ToolExecution] = []
        accumulated_content = ""
+        total_input_tokens = 0
+        total_output_tokens = 0
        # Real conversation history: assistant messages + tool results
        conversation: list[dict[str, Any]] = []
        tool_fingerprints: dict[str, ToolExecution] = {}
@@ -139,6 +141,11 @@ class BaseAgent:
                    tool["parsed_arguments"] = args
                    tool_calls.append(tool)

+                # Accumulate token usage from any chunk that has it
+                if chunk.usage:
+                    total_input_tokens += chunk.usage.get("input_tokens", 0)
+                    total_output_tokens += chunk.usage.get("output_tokens", 0)
+
                if chunk.finish_reason == "end_turn":
                    break

@@ -234,6 +241,10 @@ class BaseAgent:
            "content": accumulated_content,
            "artifacts": artifacts,
            "tool_executions": tool_executions,
+            "usage": {
+                "input_tokens": total_input_tokens,
+                "output_tokens": total_output_tokens,
+            },
        }

    async def _execute_tool(
--- a/src/orchestrator/agents/planner.py
+++ b/src/orchestrator/agents/planner.py
@@ -55,9 +55,10 @@ def create_planner_profile() -> AgentProfile:
 class PlannerAgent(BaseAgent):
    """Generates execution plans from objectives."""

-    async def plan(self, session: SessionState) -> list[TaskStep]:
-        """Generate a plan and return TaskSteps."""
+    async def plan(self, session: SessionState) -> tuple[list[TaskStep], dict[str, int]]:
+        """Generate a plan and return (TaskSteps, usage)."""
        result = await self.execute(session, max_steps=1)
+        usage = result.get("usage", {"input_tokens": 0, "output_tokens": 0})
        content = result["content"].strip()

        # Parse the JSON plan from the model output
@@ -92,7 +93,7 @@ class PlannerAgent(BaseAgent):
                    parsed.get("facts", [])
                )

-            return steps
+            return steps, usage

        except (json.JSONDecodeError, KeyError) as e:
            logger.warning("Failed to parse planner output: %s", e)
@@ -104,4 +105,4 @@ class PlannerAgent(BaseAgent):
                    else "Execute task",
                    agent_role="coder",
                )
-            ]
+            ], usage
--- a/src/orchestrator/engine.py
+++ b/src/orchestrator/engine.py
@@ -115,9 +115,10 @@ class OrchestratorEngine:

        # 2. Plan
        task.status = TaskStatus.PLANNING
+        planner_usage: dict[str, int] = {"input_tokens": 0, "output_tokens": 0}
        try:
            planner = self._create_agent(AgentRole.PLANNER)
-            plan_steps = await planner.plan(session)
+            plan_steps, planner_usage = await planner.plan(session)
            task.plan = plan_steps
            task.status = TaskStatus.EXECUTING
        except Exception as e:
@@ -234,6 +235,21 @@ class OrchestratorEngine:
            session_id=session.session_id,
        )

+        # Accumulate token usage: planner + all steps + review
+        total_input = planner_usage.get("input_tokens", 0)
+        total_output = planner_usage.get("output_tokens", 0)
+        for r in results:
+            total_input += r.get("usage", {}).get("input_tokens", 0)
+            total_output += r.get("usage", {}).get("output_tokens", 0)
+        # Add review usage if any
+        total_input += review_result.get("usage", {}).get("input_tokens", 0)
+        total_output += review_result.get("usage", {}).get("output_tokens", 0)
+        # Calculate cost
+        cost_usd = (
+            (total_input / 1_000_000) * settings.cost_per_1m_input
+            + (total_output / 1_000_000) * settings.cost_per_1m_output
+        )
+
        return {
            "session_id": session.session_id,
            "task_id": task.task_id,
@@ -245,6 +261,11 @@ class OrchestratorEngine:
            ),
            "review": review_result.get("content", ""),
            "status": status,
+            "usage": {
+                "input_tokens": total_input,
+                "output_tokens": total_output,
+            },
+            "total_cost_usd": round(cost_usd, 6),
        }

    def _error_result(self, session: SessionState, error: str) -> dict[str, Any]: