`agent_k.mission.nodes`

State machine nodes for mission phases.

agent_k.mission.nodes

State machine nodes for AGENT-K mission graph.

@notice: | State machine nodes for AGENT-K mission graph.

@dev: | See module for implementation details and extension points.

@graph: id: agent_k.mission.nodes provides: - agent_k.mission.nodes:DiscoveryNode - agent_k.mission.nodes:ResearchNode - agent_k.mission.nodes:PrototypeNode - agent_k.mission.nodes:EvolutionNode - agent_k.mission.nodes:SubmissionNode consumes: - agent_k.mission.state:MissionState - agent_k.agents.lobbyist:LobbyistAgent - agent_k.agents.scientist:ScientistAgent - agent_k.agents.evolver:EvolverAgent pattern: graph-state-machine

@similar: - id: agent_k.agents.lycurgus when: "Lycurgus orchestrates nodes; this module defines node behavior."

@agent-guidance: do: - "Use agent_k.mission.nodes as the canonical home for this capability." do_not: - "Create parallel modules without updating @similar or @graph."

@human-review: last-verified: 2026-01-26 owners: - agent-k-core

(c) Mike Casale 2025. Licensed under the MIT License.

DiscoveryNode `dataclass`

Bases: BaseNode[MissionState, GraphContext, MissionResult]

Discovery phase node.

Executes the LOBBYIST agent to discover competitions matching criteria.

Transitions:
    - Success → ResearchNode
    - Failure → End(failure)

@notice: | Discovery phase node.

@dev: | See module for implementation details and extension points.

@pattern:
    name: graph-node
    rationale: "Encapsulates discovery phase logic in the mission graph."
    violations: "Discovery logic outside nodes causes transition drift."

@collaborators:
    required:
        - agent_k.agents.lobbyist:LobbyistAgent
        - agent_k.ui.agui:EventEmitter
    optional:
        - httpx:AsyncClient
        - agent_k.core.protocols:PlatformAdapter
    injection: GraphContext
    lifecycle: "Instantiated per graph run."

@concurrency:
    model: asyncio
    safe: false
    reason: "Mutates mission state during execution."

@invariants:
    - "timeout > 0"

Source code in agent_k/mission/nodes.py

@dataclass
class DiscoveryNode(BaseNode[MissionState, GraphContext, MissionResult]):
    """Discovery phase node.

        Executes the LOBBYIST agent to discover competitions matching criteria.

        Transitions:
            - Success → ResearchNode
            - Failure → End(failure)

    @notice: |
        Discovery phase node.

    @dev: |
        See module for implementation details and extension points.

        @pattern:
            name: graph-node
            rationale: "Encapsulates discovery phase logic in the mission graph."
            violations: "Discovery logic outside nodes causes transition drift."

        @collaborators:
            required:
                - agent_k.agents.lobbyist:LobbyistAgent
                - agent_k.ui.agui:EventEmitter
            optional:
                - httpx:AsyncClient
                - agent_k.core.protocols:PlatformAdapter
            injection: GraphContext
            lifecycle: "Instantiated per graph run."

        @concurrency:
            model: asyncio
            safe: false
            reason: "Mutates mission state during execution."

        @invariants:
            - "timeout > 0"
    """

    timeout: int = DISCOVERY_TIMEOUT_SECONDS

    async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> ResearchNode | End[MissionResult]:
        """Execute discovery phase."""
        state = ctx.state
        emitter, http_client, platform_adapter = _require_context(ctx.deps)

        with logfire.span("graph.discovery", mission_id=state.mission_id):
            # Emit phase start
            await emitter.emit_phase_start(
                phase="discovery",
                objectives=[
                    "Find competitions matching criteria",
                    "Validate competition accessibility",
                    "Rank by fit score",
                ],
            )

            state.current_phase = "discovery"
            state.phase_started_at = datetime.now(UTC)

            try:
                if state.competition_id:
                    competition = await platform_adapter.get_competition(state.competition_id)
                    state.selected_competition = competition
                    state.discovered_competitions = [competition]
                    state.phases_completed.append("discovery")
                    await emitter.emit_phase_complete(
                        phase="discovery", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                    )
                    return ResearchNode()

                # Build prompt from criteria
                prompt = self._build_discovery_prompt(state.criteria)

                # Create dependencies
                deps = LobbyistDeps(http_client=http_client, platform_adapter=platform_adapter, event_emitter=emitter)

                # Run lobbyist agent
                lobbyist_agent = _resolve_agent(ctx.deps, "lobbyist")
                run_result = await lobbyist_agent.run(prompt, deps=deps)
                result = run_result.output

                # Update state
                state.discovered_competitions = result.competitions

                if not result.competitions:
                    await emitter.emit_phase_complete(
                        phase="discovery", success=False, duration_ms=self._elapsed_ms(state.phase_started_at)
                    )
                    return End(
                        MissionResult(
                            success=False,
                            mission_id=state.mission_id,
                            error_message="No competitions found matching criteria",
                            phases_completed=list(state.phases_completed),
                        )
                    )

                # Select best competition
                state.selected_competition = result.competitions[0]
                state.competition_id = state.selected_competition.id
                state.phases_completed.append("discovery")

                await emitter.emit_phase_complete(
                    phase="discovery", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )

                # Transition to research
                return ResearchNode()

            except Exception as e:
                logfire.error("discovery_failed", error=str(e), traceback=traceback.format_exc())
                state.errors.append(
                    {
                        "phase": "discovery",
                        "error": str(e),
                        "error_type": type(e).__name__,
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )
                await _emit_phase_failure(state=state, emitter=emitter, phase="discovery", error=e, context="discovery")
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message=f"Discovery failed: {e}",
                        phases_completed=list(state.phases_completed),
                    )
                )

    def _build_discovery_prompt(self, criteria: Any) -> str:
        """Build discovery prompt from criteria."""
        parts = ["Find Kaggle competitions with the following criteria:"]

        if criteria.target_competition_types:
            types = ", ".join(t.value for t in criteria.target_competition_types)
            parts.append(f"- Types: {types}")

        if criteria.min_prize_pool:
            parts.append(f"- Minimum prize: ${criteria.min_prize_pool:,}")

        if criteria.min_days_remaining:
            parts.append(f"- At least {criteria.min_days_remaining} days remaining")

        if criteria.target_domains:
            domains = ", ".join(criteria.target_domains)
            parts.append(f"- Domains: {domains}")

        parts.append(f"- Target top {criteria.target_leaderboard_percentile * 100:.0f}% on leaderboard")

        return "\n".join(parts)

    def _elapsed_ms(self, start: datetime | None) -> int:
        """Calculate elapsed milliseconds."""
        return int((datetime.now(UTC) - start).total_seconds() * 1000) if start else 0

run `async`

run(ctx: GraphRunContext[MissionState, GraphContext]) -> ResearchNode | End[MissionResult]

Execute discovery phase.

Source code in agent_k/mission/nodes.py

async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> ResearchNode | End[MissionResult]:
    """Execute discovery phase."""
    state = ctx.state
    emitter, http_client, platform_adapter = _require_context(ctx.deps)

    with logfire.span("graph.discovery", mission_id=state.mission_id):
        # Emit phase start
        await emitter.emit_phase_start(
            phase="discovery",
            objectives=[
                "Find competitions matching criteria",
                "Validate competition accessibility",
                "Rank by fit score",
            ],
        )

        state.current_phase = "discovery"
        state.phase_started_at = datetime.now(UTC)

        try:
            if state.competition_id:
                competition = await platform_adapter.get_competition(state.competition_id)
                state.selected_competition = competition
                state.discovered_competitions = [competition]
                state.phases_completed.append("discovery")
                await emitter.emit_phase_complete(
                    phase="discovery", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )
                return ResearchNode()

            # Build prompt from criteria
            prompt = self._build_discovery_prompt(state.criteria)

            # Create dependencies
            deps = LobbyistDeps(http_client=http_client, platform_adapter=platform_adapter, event_emitter=emitter)

            # Run lobbyist agent
            lobbyist_agent = _resolve_agent(ctx.deps, "lobbyist")
            run_result = await lobbyist_agent.run(prompt, deps=deps)
            result = run_result.output

            # Update state
            state.discovered_competitions = result.competitions

            if not result.competitions:
                await emitter.emit_phase_complete(
                    phase="discovery", success=False, duration_ms=self._elapsed_ms(state.phase_started_at)
                )
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message="No competitions found matching criteria",
                        phases_completed=list(state.phases_completed),
                    )
                )

            # Select best competition
            state.selected_competition = result.competitions[0]
            state.competition_id = state.selected_competition.id
            state.phases_completed.append("discovery")

            await emitter.emit_phase_complete(
                phase="discovery", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
            )

            # Transition to research
            return ResearchNode()

        except Exception as e:
            logfire.error("discovery_failed", error=str(e), traceback=traceback.format_exc())
            state.errors.append(
                {
                    "phase": "discovery",
                    "error": str(e),
                    "error_type": type(e).__name__,
                    "timestamp": datetime.now(UTC).isoformat(),
                }
            )
            await _emit_phase_failure(state=state, emitter=emitter, phase="discovery", error=e, context="discovery")
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message=f"Discovery failed: {e}",
                    phases_completed=list(state.phases_completed),
                )
            )

ResearchNode `dataclass`

Bases: BaseNode[MissionState, GraphContext, MissionResult]

Research phase node.

Executes the SCIENTIST agent to analyze the competition.

Transitions:
    - Success → PrototypeNode
    - Failure → End(failure)

@notice: | Research phase node.

@dev: | See module for implementation details and extension points.

@pattern:
    name: graph-node
    rationale: "Encapsulates research phase logic in the mission graph."
    violations: "Research logic outside nodes causes transition drift."

@collaborators:
    required:
        - agent_k.agents.scientist:ScientistAgent
        - agent_k.ui.agui:EventEmitter
    optional:
        - httpx:AsyncClient
        - agent_k.core.protocols:PlatformAdapter
    injection: GraphContext
    lifecycle: "Instantiated per graph run."

@concurrency:
    model: asyncio
    safe: false
    reason: "Mutates mission state during execution."

@invariants:
    - "timeout > 0"

Source code in agent_k/mission/nodes.py

@dataclass
class ResearchNode(BaseNode[MissionState, GraphContext, MissionResult]):
    """Research phase node.

        Executes the SCIENTIST agent to analyze the competition.

        Transitions:
            - Success → PrototypeNode
            - Failure → End(failure)

    @notice: |
        Research phase node.

    @dev: |
        See module for implementation details and extension points.

        @pattern:
            name: graph-node
            rationale: "Encapsulates research phase logic in the mission graph."
            violations: "Research logic outside nodes causes transition drift."

        @collaborators:
            required:
                - agent_k.agents.scientist:ScientistAgent
                - agent_k.ui.agui:EventEmitter
            optional:
                - httpx:AsyncClient
                - agent_k.core.protocols:PlatformAdapter
            injection: GraphContext
            lifecycle: "Instantiated per graph run."

        @concurrency:
            model: asyncio
            safe: false
            reason: "Mutates mission state during execution."

        @invariants:
            - "timeout > 0"
    """

    timeout: int = RESEARCH_TIMEOUT_SECONDS

    async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> PrototypeNode | End[MissionResult]:
        """Execute research phase."""
        state = ctx.state
        emitter, http_client, platform_adapter = _require_context(ctx.deps)
        competition = state.selected_competition
        if competition is None:
            _cleanup_session_data(state.mission_id)
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message="No competition selected for research",
                    phases_completed=list(state.phases_completed),
                )
            )

        with logfire.span("graph.research", competition_id=state.competition_id):
            await emitter.emit_phase_start(
                phase="research",
                objectives=[
                    "Analyze leaderboard and score distribution",
                    "Review relevant papers and techniques",
                    "Perform exploratory data analysis",
                    "Synthesize strategy recommendations",
                ],
            )

            state.current_phase = "research"
            state.phase_started_at = datetime.now(UTC)

            try:
                # Research implementation
                deps = ScientistDeps(
                    http_client=http_client, platform_adapter=platform_adapter, competition=competition
                )

                prompt = f"Research competition: {competition.title}"
                scientist_agent = _resolve_agent(ctx.deps, "scientist")
                run_result = await scientist_agent.run(prompt, deps=deps)
                result = run_result.output

                eda_results: dict[str, Any] | None = None
                try:
                    train_path, test_path, sample_path = await _prepare_session_data(
                        platform_adapter, state.mission_id, competition.id
                    )
                    profile = build_dataset_profile(train_path, test_path, sample_path)
                    hints = generate_preprocessing_hints(profile, competition.id)
                    eda_results = {
                        "dataset_profile": profile.to_dict(),
                        "preprocessing_hints": [hint.to_dict() for hint in hints],
                    }
                    try:
                        external_data = await get_external_data_policy(
                            http_client, competition.id, profile=profile, cache=deps.research_cache
                        )
                        eda_results["external_data_rules"] = external_data
                    except Exception as exc:
                        logfire.warning("external_data_rules_failed", error=str(exc))
                except Exception as exc:
                    logfire.warning("research_profile_failed", error=str(exc))

                try:
                    leaderboard = await platform_adapter.get_leaderboard(competition.id, limit=100)
                    analysis = _build_leaderboard_analysis(
                        leaderboard, state.criteria.target_leaderboard_percentile, competition.metric_direction
                    )
                except Exception as exc:
                    logfire.warning("leaderboard_analysis_failed", error=str(exc))
                    analysis = None

                state.research_findings = _build_research_findings(result, analysis, eda_results=eda_results)
                state.phases_completed.append("research")

                await emitter.emit_phase_complete(
                    phase="research", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )

                return PrototypeNode()

            except Exception as e:
                logfire.error("research_failed", error=str(e), traceback=traceback.format_exc())
                state.errors.append(
                    {
                        "phase": "research",
                        "error": str(e),
                        "error_type": type(e).__name__,
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )
                await _emit_phase_failure(state=state, emitter=emitter, phase="research", error=e, context="research")
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message=f"Research failed: {e}",
                        phases_completed=list(state.phases_completed),
                    )
                )

    def _elapsed_ms(self, start: datetime | None) -> int:
        return int((datetime.now(UTC) - start).total_seconds() * 1000) if start else 0

run `async`

run(ctx: GraphRunContext[MissionState, GraphContext]) -> PrototypeNode | End[MissionResult]

Execute research phase.

Source code in agent_k/mission/nodes.py

async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> PrototypeNode | End[MissionResult]:
    """Execute research phase."""
    state = ctx.state
    emitter, http_client, platform_adapter = _require_context(ctx.deps)
    competition = state.selected_competition
    if competition is None:
        _cleanup_session_data(state.mission_id)
        return End(
            MissionResult(
                success=False,
                mission_id=state.mission_id,
                error_message="No competition selected for research",
                phases_completed=list(state.phases_completed),
            )
        )

    with logfire.span("graph.research", competition_id=state.competition_id):
        await emitter.emit_phase_start(
            phase="research",
            objectives=[
                "Analyze leaderboard and score distribution",
                "Review relevant papers and techniques",
                "Perform exploratory data analysis",
                "Synthesize strategy recommendations",
            ],
        )

        state.current_phase = "research"
        state.phase_started_at = datetime.now(UTC)

        try:
            # Research implementation
            deps = ScientistDeps(
                http_client=http_client, platform_adapter=platform_adapter, competition=competition
            )

            prompt = f"Research competition: {competition.title}"
            scientist_agent = _resolve_agent(ctx.deps, "scientist")
            run_result = await scientist_agent.run(prompt, deps=deps)
            result = run_result.output

            eda_results: dict[str, Any] | None = None
            try:
                train_path, test_path, sample_path = await _prepare_session_data(
                    platform_adapter, state.mission_id, competition.id
                )
                profile = build_dataset_profile(train_path, test_path, sample_path)
                hints = generate_preprocessing_hints(profile, competition.id)
                eda_results = {
                    "dataset_profile": profile.to_dict(),
                    "preprocessing_hints": [hint.to_dict() for hint in hints],
                }
                try:
                    external_data = await get_external_data_policy(
                        http_client, competition.id, profile=profile, cache=deps.research_cache
                    )
                    eda_results["external_data_rules"] = external_data
                except Exception as exc:
                    logfire.warning("external_data_rules_failed", error=str(exc))
            except Exception as exc:
                logfire.warning("research_profile_failed", error=str(exc))

            try:
                leaderboard = await platform_adapter.get_leaderboard(competition.id, limit=100)
                analysis = _build_leaderboard_analysis(
                    leaderboard, state.criteria.target_leaderboard_percentile, competition.metric_direction
                )
            except Exception as exc:
                logfire.warning("leaderboard_analysis_failed", error=str(exc))
                analysis = None

            state.research_findings = _build_research_findings(result, analysis, eda_results=eda_results)
            state.phases_completed.append("research")

            await emitter.emit_phase_complete(
                phase="research", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
            )

            return PrototypeNode()

        except Exception as e:
            logfire.error("research_failed", error=str(e), traceback=traceback.format_exc())
            state.errors.append(
                {
                    "phase": "research",
                    "error": str(e),
                    "error_type": type(e).__name__,
                    "timestamp": datetime.now(UTC).isoformat(),
                }
            )
            await _emit_phase_failure(state=state, emitter=emitter, phase="research", error=e, context="research")
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message=f"Research failed: {e}",
                    phases_completed=list(state.phases_completed),
                )
            )

PrototypeNode `dataclass`

Bases: BaseNode[MissionState, GraphContext, MissionResult]

Prototype phase node.

Generates initial baseline solution.

Transitions:
    - Success → EvolutionNode
    - Failure → End(failure)

@notice: | Prototype phase node.

@dev: | See module for implementation details and extension points.

@pattern:
    name: graph-node
    rationale: "Encapsulates prototype phase logic in the mission graph."
    violations: "Prototype logic outside nodes causes transition drift."

@collaborators:
    required:
        - agent_k.core.solution:execute_solution
        - agent_k.ui.agui:EventEmitter
    optional:
        - agent_k.core.protocols:PlatformAdapter
    injection: GraphContext
    lifecycle: "Instantiated per graph run."

@concurrency:
    model: asyncio
    safe: false
    reason: "Mutates mission state during execution."

@invariants:
    - "timeout > 0"

Source code in agent_k/mission/nodes.py

@dataclass
class PrototypeNode(BaseNode[MissionState, GraphContext, MissionResult]):
    """Prototype phase node.

        Generates initial baseline solution.

        Transitions:
            - Success → EvolutionNode
            - Failure → End(failure)

    @notice: |
        Prototype phase node.

    @dev: |
        See module for implementation details and extension points.

        @pattern:
            name: graph-node
            rationale: "Encapsulates prototype phase logic in the mission graph."
            violations: "Prototype logic outside nodes causes transition drift."

        @collaborators:
            required:
                - agent_k.core.solution:execute_solution
                - agent_k.ui.agui:EventEmitter
            optional:
                - agent_k.core.protocols:PlatformAdapter
            injection: GraphContext
            lifecycle: "Instantiated per graph run."

        @concurrency:
            model: asyncio
            safe: false
            reason: "Mutates mission state during execution."

        @invariants:
            - "timeout > 0"
    """

    timeout: int = PROTOTYPE_TIMEOUT_SECONDS

    async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> EvolutionNode | End[MissionResult]:
        """Execute prototype phase."""
        state = ctx.state
        emitter, _http_client, platform_adapter = _require_context(ctx.deps)
        competition = state.selected_competition
        if competition is None:
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message="No competition selected for prototype phase",
                    phases_completed=list(state.phases_completed),
                )
            )

        with logfire.span("graph.prototype", competition_id=state.competition_id):
            await emitter.emit_phase_start(
                phase="prototype",
                objectives=[
                    "Generate baseline solution code",
                    "Validate solution structure",
                    "Establish baseline score",
                ],
            )

            state.current_phase = "prototype"
            state.phase_started_at = datetime.now(UTC)

            try:
                with tempfile.TemporaryDirectory() as work_dir:
                    work_path = Path(work_dir)
                    competition_id = state.competition_id or competition.id
                    state.competition_id = competition_id
                    train_path, test_path, sample_path = await _prepare_session_data(
                        platform_adapter, state.mission_id, competition_id
                    )
                    staged = stage_competition_data(
                        train_path, test_path, sample_path, work_path, competition_id=competition_id
                    )
                    schema = infer_competition_schema(staged["train"], staged["test"], staged["sample"])
                    profile = build_problem_profile(competition, schema)
                    technique_policy = build_technique_policy(profile, state.criteria)

                    prototype_code = self._generate_prototype(
                        competition,
                        state.research_findings,
                        target_columns=schema.target_columns,
                        train_target_columns=schema.train_target_columns,
                        id_column=schema.id_column,
                    )
                    prototype_code, notes = apply_solution_policy(prototype_code, technique_policy)
                    if notes:
                        logfire.warning("prototype_policy_injection_failed", notes=notes)

                    execution = await execute_solution(
                        prototype_code,
                        work_path,
                        timeout_seconds=self.timeout,
                        use_builtin_code_execution=True,
                        model_spec=evolver_settings.model,
                    )

                    submission_path = work_path / "submission.csv"
                    baseline_score = parse_baseline_score(execution.stdout)
                    if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                        logfire.warning(
                            "prototype_execution_failed",
                            returncode=execution.returncode,
                            timed_out=execution.timed_out,
                            submission_exists=submission_path.exists(),
                            stderr=execution.stderr[:1000] if execution.stderr else "",
                            stdout=execution.stdout[:500] if execution.stdout else "",
                            runtime_ms=execution.runtime_ms,
                        )
                        fallback_code = _generate_fallback_prototype(
                            target_columns=schema.target_columns,
                            train_target_columns=schema.train_target_columns,
                            id_column=schema.id_column,
                            metric=competition.metric,
                        )
                        _write_fallback_submission(
                            train_path=staged["train"],
                            test_path=staged["test"],
                            sample_path=staged["sample"],
                            metric=competition.metric,
                            output_path=submission_path,
                        )
                        prototype_code = fallback_code

                    if baseline_score is None:
                        baseline_score = _compute_baseline_score(
                            train_path=staged["train"],
                            target_columns=schema.train_target_columns,
                            metric=competition.metric,
                        )

                    state.prototype_code = prototype_code
                    state.prototype_score = baseline_score
                    tracker = create_experiment_tracker()
                    metadata = extract_solution_metadata(prototype_code)
                    tracker.record_experiment(
                        ExperimentRecord(
                            competition_id=competition_id,
                            phase="prototype",
                            model_name=metadata.model_name,
                            model_family=metadata.model_family,
                            hyperparameters=metadata.hyperparameters,
                            feature_set=metadata.feature_set,
                            feature_engineering=metadata.feature_engineering,
                            target_transform=metadata.target_transform,
                            metrics={
                                "baseline_score": baseline_score,
                                "runtime_ms": execution.runtime_ms,
                                "timed_out": execution.timed_out,
                                "returncode": execution.returncode,
                            },
                            cv_score=baseline_score,
                            code_signature=hashlib.sha256(prototype_code.encode()).hexdigest()[:12],
                            dataset_fingerprint=competition_id,
                        )
                    )

                state.phases_completed.append("prototype")

                await emitter.emit_phase_complete(
                    phase="prototype", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )

                return EvolutionNode()

            except Exception as e:
                logfire.error("prototype_failed", error=str(e), traceback=traceback.format_exc())
                state.errors.append(
                    {
                        "phase": "prototype",
                        "error": str(e),
                        "error_type": type(e).__name__,
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )
                await _emit_phase_failure(state=state, emitter=emitter, phase="prototype", error=e, context="prototype")
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message=f"Prototype failed: {e}",
                        phases_completed=list(state.phases_completed),
                    )
                )

    def _generate_prototype(
        self,
        competition: Any,
        research: Any,
        *,
        target_columns: list[str],
        train_target_columns: list[str],
        id_column: str,
    ) -> str:
        """Generate prototype solution code."""
        metric = getattr(competition, "metric", None)
        metric_key = metric if isinstance(metric, EvaluationMetric) else EvaluationMetric.ACCURACY
        metric_value = metric_key.value
        target_columns_repr = repr(target_columns)
        train_target_columns_repr = repr(train_target_columns)
        strategy_items: list[str] = []
        for attr in ("strategy_recommendations", "recommended_approaches"):
            value = getattr(research, attr, None)
            if isinstance(value, list):
                strategy_items.extend(str(item) for item in value if item)
            elif isinstance(value, str) and value:
                strategy_items.append(value)
        strategy_text = " ".join(strategy_items)
        strategy_lower = strategy_text.lower()

        is_classification = metric_key in {
            EvaluationMetric.ACCURACY,
            EvaluationMetric.AUC,
            EvaluationMetric.LOG_LOSS,
            EvaluationMetric.F1,
        }
        uses_proba = metric_key in {EvaluationMetric.AUC, EvaluationMetric.LOG_LOSS}

        if "lightgbm" in strategy_lower or "lgbm" in strategy_lower:
            model_class = "LGBMClassifier" if is_classification else "LGBMRegressor"
            fallback_class = "GradientBoostingClassifier" if is_classification else "GradientBoostingRegressor"
            model_import = "from sklearn.ensemble import GradientBoostingClassifier, GradientBoostingRegressor"
            model_bootstrap = dedent(
                """
                HAS_LGB = False
                try:
                    from lightgbm import LGBMClassifier, LGBMRegressor
                    HAS_LGB = True
                except Exception:
                    HAS_LGB = False
                """
            ).strip()
            model_init = dedent(
                f"""
                if HAS_LGB:
                    base_model = {model_class}(random_state=42)
                else:
                    base_model = {fallback_class}(random_state=42)
                """
            ).strip()
        elif "linear" in strategy_lower:
            model_class = "LogisticRegression" if is_classification else "LinearRegression"
            model_import = "from sklearn.linear_model import LogisticRegression, LinearRegression"
            model_bootstrap = ""
            model_init = f"base_model = {model_class}(random_state=42)"
        elif "gradient" in strategy_lower or "boost" in strategy_lower:
            model_class = "GradientBoostingClassifier" if is_classification else "GradientBoostingRegressor"
            model_import = "from sklearn.ensemble import GradientBoostingClassifier, GradientBoostingRegressor"
            model_bootstrap = ""
            model_init = f"base_model = {model_class}(random_state=42)"
        else:
            model_class = "RandomForestClassifier" if is_classification else "RandomForestRegressor"
            model_import = "from sklearn.ensemble import RandomForestClassifier, RandomForestRegressor"
            model_bootstrap = ""
            model_init = f"base_model = {model_class}(random_state=42)"

        prototype_code = (
            dedent(
                f"""
        import os
        import numpy as np
        import pandas as pd
        from sklearn.compose import ColumnTransformer
        from sklearn.impute import SimpleImputer
        from sklearn.model_selection import train_test_split
        from sklearn.pipeline import Pipeline
        from sklearn.preprocessing import OneHotEncoder
        from sklearn.multioutput import MultiOutputClassifier, MultiOutputRegressor
        from sklearn.metrics import (
            accuracy_score,
            f1_score,
            log_loss,
            mean_absolute_error,
            mean_squared_error,
            mean_squared_log_error,
            roc_auc_score,
        )
        {model_import}
        {model_bootstrap}

        TARGET_COLUMNS = {target_columns_repr}
        TRAIN_TARGET_COLUMNS = {train_target_columns_repr}
        ID_COLUMN = "{id_column}"
        METRIC = "{metric_value}"
        METRIC_KEY = METRIC.lower().replace("_", "")
        VALIDATION_SPLIT = float(os.getenv("AGENT_K_VALIDATION_SPLIT", "0.2"))
        IS_CLASSIFICATION = {is_classification}
        USES_PROBA = {uses_proba}
        USES_LOG_TARGET = False

        train_df = pd.read_csv("train.csv")
        test_df = pd.read_csv("test.csv")

        y = train_df[TRAIN_TARGET_COLUMNS]
        if len(TRAIN_TARGET_COLUMNS) == 1:
            y = train_df[TRAIN_TARGET_COLUMNS[0]]
        X = train_df.drop(columns=TRAIN_TARGET_COLUMNS)

        categorical_cols = X.select_dtypes(include=["object", "category"]).columns
        numeric_cols = X.select_dtypes(exclude=["object", "category"]).columns

        categorical_transformer = Pipeline(steps=[
            ("imputer", SimpleImputer(strategy="most_frequent")),
            ("encoder", OneHotEncoder(handle_unknown="ignore")),
        ])
        numeric_transformer = Pipeline(steps=[
            ("imputer", SimpleImputer(strategy="median")),
        ])

        preprocessor = ColumnTransformer(
            transformers=[
                ("categorical", categorical_transformer, categorical_cols),
                ("numeric", numeric_transformer, numeric_cols),
            ],
        )

        {model_init}
        if len(TRAIN_TARGET_COLUMNS) > 1:
            base_model = (
                MultiOutputClassifier(base_model)
                if IS_CLASSIFICATION
                else MultiOutputRegressor(base_model)
            )

        X_train, X_val, y_train, y_val = train_test_split(
            X,
            y,
            test_size=VALIDATION_SPLIT,
            random_state=42,
            stratify=y if IS_CLASSIFICATION and len(TRAIN_TARGET_COLUMNS) == 1 else None,
        )

        clf = Pipeline(steps=[
            ("preprocessor", preprocessor),
            ("model", base_model),
        ])

        def _encode_labels(values, classes):
            mapping = {{label: idx for idx, label in enumerate(classes)}}
            return np.array([mapping.get(value, -1) for value in values])

        def _score_classification_single(y_true, preds, probas, classes):
            if METRIC_KEY == "accuracy":
                return accuracy_score(y_true, preds)
            if METRIC_KEY == "f1":
                average = "binary" if len(classes) == 2 else "weighted"
                return f1_score(y_true, preds, average=average, zero_division=0)
            if METRIC_KEY == "auc":
                if len(classes) < 2:
                    return 0.5
                if len(classes) == 2:
                    pos_label = classes[1]
                    y_binary = (y_true == pos_label).astype(int)
                    return roc_auc_score(y_binary, probas[:, 1])
                y_encoded = _encode_labels(y_true, classes)
                return roc_auc_score(
                    y_encoded,
                    probas,
                    multi_class="ovo",
                    average="macro",
                )
            if METRIC_KEY == "logloss":
                if len(classes) < 2:
                    return 0.0
                return log_loss(y_true, probas, labels=classes)
            return accuracy_score(y_true, preds)

        def _score_classification(y_true, preds, probas, model_step):
            scores = []
            if len(TRAIN_TARGET_COLUMNS) == 1:
                classes = model_step.classes_
                scores.append(_score_classification_single(y_true, preds, probas, classes))
            else:
                for idx, column in enumerate(TRAIN_TARGET_COLUMNS):
                    estimator = model_step.estimators_[idx]
                    classes = estimator.classes_
                    col_preds = preds[:, idx]
                    col_probas = probas[idx] if probas is not None else None
                    scores.append(
                        _score_classification_single(
                            y_true[column],
                            col_preds,
                            col_probas,
                            classes,
                        )
                    )
            return float(np.mean(scores)) if scores else 0.0

        def _score_regression_single(y_true, preds):
            if METRIC_KEY == "rmse":
                return mean_squared_error(y_true, preds) ** 0.5
            if METRIC_KEY == "mae":
                return mean_absolute_error(y_true, preds)
            if METRIC_KEY == "rmsle":
                if USES_LOG_TARGET:
                    return mean_squared_error(y_true, preds) ** 0.5
                return mean_squared_log_error(y_true, preds) ** 0.5
            return mean_squared_error(y_true, preds) ** 0.5

        def _score_regression(y_true, preds):
            if len(TRAIN_TARGET_COLUMNS) == 1:
                return _score_regression_single(y_true, preds)
            scores = [
                _score_regression_single(y_true[column], preds[:, idx])
                for idx, column in enumerate(TRAIN_TARGET_COLUMNS)
            ]
            return float(np.mean(scores)) if scores else 0.0

        clf.fit(X_train, y_train)
        model_step = clf.named_steps["model"]
        if IS_CLASSIFICATION:
            if USES_PROBA:
                val_probas = clf.predict_proba(X_val)
                val_preds = clf.predict(X_val)
                score = _score_classification(y_val, val_preds, val_probas, model_step)
            else:
                val_preds = clf.predict(X_val)
                score = _score_classification(y_val, val_preds, None, model_step)
        else:
            val_preds = clf.predict(X_val)
            score = _score_regression(y_val, val_preds)
        print(f"Baseline {metric_value} score: {{score}}")

        clf.fit(X, y)
        submission = pd.read_csv("sample_submission.csv")
        if IS_CLASSIFICATION and USES_PROBA:
            if len(TRAIN_TARGET_COLUMNS) == 1 and len(TARGET_COLUMNS) > 1:
                test_probas = clf.predict_proba(test_df)
                class_labels = [str(label) for label in model_step.classes_]
                proba_df = pd.DataFrame(test_probas, columns=class_labels)

                def _normalize_label(label):
                    return str(label).lower().replace("class_", "").replace("class ", "")

                normalized = {{_normalize_label(label): label for label in class_labels}}
                for column in TARGET_COLUMNS:
                    key = _normalize_label(column)
                    label = normalized.get(key)
                    if label and label in proba_df.columns:
                        submission[column] = proba_df[label]
                    elif test_probas.shape[1] == len(TARGET_COLUMNS):
                        submission[column] = test_probas[:, TARGET_COLUMNS.index(column)]
                    else:
                        submission[column] = 0.0
            elif len(TRAIN_TARGET_COLUMNS) == 1:
                test_probas = clf.predict_proba(test_df)
                submission[TARGET_COLUMNS[0]] = test_probas[:, 1]
            else:
                test_probas = clf.predict_proba(test_df)
                for idx, column in enumerate(TARGET_COLUMNS):
                    column_proba = test_probas[idx]
                    if column_proba.ndim == 2 and column_proba.shape[1] > 1:
                        submission[column] = column_proba[:, 1]
                    else:
                        submission[column] = column_proba.ravel()
        else:
            test_preds = clf.predict(test_df)
            if USES_LOG_TARGET:
                test_preds = np.expm1(test_preds)
            if len(TARGET_COLUMNS) == 1:
                submission[TARGET_COLUMNS[0]] = test_preds
            else:
                for idx, column in enumerate(TARGET_COLUMNS):
                    submission[column] = test_preds[:, idx]
        submission.to_csv("submission.csv", index=False)
        """
            ).strip()
            + "\n"
        )
        return prototype_code

    def _elapsed_ms(self, start: datetime | None) -> int:
        return int((datetime.now(UTC) - start).total_seconds() * 1000) if start else 0

run `async`

run(ctx: GraphRunContext[MissionState, GraphContext]) -> EvolutionNode | End[MissionResult]

Execute prototype phase.

Source code in agent_k/mission/nodes.py

async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> EvolutionNode | End[MissionResult]:
    """Execute prototype phase."""
    state = ctx.state
    emitter, _http_client, platform_adapter = _require_context(ctx.deps)
    competition = state.selected_competition
    if competition is None:
        return End(
            MissionResult(
                success=False,
                mission_id=state.mission_id,
                error_message="No competition selected for prototype phase",
                phases_completed=list(state.phases_completed),
            )
        )

    with logfire.span("graph.prototype", competition_id=state.competition_id):
        await emitter.emit_phase_start(
            phase="prototype",
            objectives=[
                "Generate baseline solution code",
                "Validate solution structure",
                "Establish baseline score",
            ],
        )

        state.current_phase = "prototype"
        state.phase_started_at = datetime.now(UTC)

        try:
            with tempfile.TemporaryDirectory() as work_dir:
                work_path = Path(work_dir)
                competition_id = state.competition_id or competition.id
                state.competition_id = competition_id
                train_path, test_path, sample_path = await _prepare_session_data(
                    platform_adapter, state.mission_id, competition_id
                )
                staged = stage_competition_data(
                    train_path, test_path, sample_path, work_path, competition_id=competition_id
                )
                schema = infer_competition_schema(staged["train"], staged["test"], staged["sample"])
                profile = build_problem_profile(competition, schema)
                technique_policy = build_technique_policy(profile, state.criteria)

                prototype_code = self._generate_prototype(
                    competition,
                    state.research_findings,
                    target_columns=schema.target_columns,
                    train_target_columns=schema.train_target_columns,
                    id_column=schema.id_column,
                )
                prototype_code, notes = apply_solution_policy(prototype_code, technique_policy)
                if notes:
                    logfire.warning("prototype_policy_injection_failed", notes=notes)

                execution = await execute_solution(
                    prototype_code,
                    work_path,
                    timeout_seconds=self.timeout,
                    use_builtin_code_execution=True,
                    model_spec=evolver_settings.model,
                )

                submission_path = work_path / "submission.csv"
                baseline_score = parse_baseline_score(execution.stdout)
                if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                    logfire.warning(
                        "prototype_execution_failed",
                        returncode=execution.returncode,
                        timed_out=execution.timed_out,
                        submission_exists=submission_path.exists(),
                        stderr=execution.stderr[:1000] if execution.stderr else "",
                        stdout=execution.stdout[:500] if execution.stdout else "",
                        runtime_ms=execution.runtime_ms,
                    )
                    fallback_code = _generate_fallback_prototype(
                        target_columns=schema.target_columns,
                        train_target_columns=schema.train_target_columns,
                        id_column=schema.id_column,
                        metric=competition.metric,
                    )
                    _write_fallback_submission(
                        train_path=staged["train"],
                        test_path=staged["test"],
                        sample_path=staged["sample"],
                        metric=competition.metric,
                        output_path=submission_path,
                    )
                    prototype_code = fallback_code

                if baseline_score is None:
                    baseline_score = _compute_baseline_score(
                        train_path=staged["train"],
                        target_columns=schema.train_target_columns,
                        metric=competition.metric,
                    )

                state.prototype_code = prototype_code
                state.prototype_score = baseline_score
                tracker = create_experiment_tracker()
                metadata = extract_solution_metadata(prototype_code)
                tracker.record_experiment(
                    ExperimentRecord(
                        competition_id=competition_id,
                        phase="prototype",
                        model_name=metadata.model_name,
                        model_family=metadata.model_family,
                        hyperparameters=metadata.hyperparameters,
                        feature_set=metadata.feature_set,
                        feature_engineering=metadata.feature_engineering,
                        target_transform=metadata.target_transform,
                        metrics={
                            "baseline_score": baseline_score,
                            "runtime_ms": execution.runtime_ms,
                            "timed_out": execution.timed_out,
                            "returncode": execution.returncode,
                        },
                        cv_score=baseline_score,
                        code_signature=hashlib.sha256(prototype_code.encode()).hexdigest()[:12],
                        dataset_fingerprint=competition_id,
                    )
                )

            state.phases_completed.append("prototype")

            await emitter.emit_phase_complete(
                phase="prototype", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
            )

            return EvolutionNode()

        except Exception as e:
            logfire.error("prototype_failed", error=str(e), traceback=traceback.format_exc())
            state.errors.append(
                {
                    "phase": "prototype",
                    "error": str(e),
                    "error_type": type(e).__name__,
                    "timestamp": datetime.now(UTC).isoformat(),
                }
            )
            await _emit_phase_failure(state=state, emitter=emitter, phase="prototype", error=e, context="prototype")
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message=f"Prototype failed: {e}",
                    phases_completed=list(state.phases_completed),
                )
            )

EvolutionNode `dataclass`

Bases: BaseNode[MissionState, GraphContext, MissionResult]

Evolution phase node.

Executes the EVOLVER agent to optimize the solution.

Transitions:
    - Success → SubmissionNode
    - Failure → End(failure with best solution)

@notice: | Evolution phase node.

@dev: | See module for implementation details and extension points.

@pattern:
    name: graph-node
    rationale: "Encapsulates evolution phase logic in the mission graph."
    violations: "Evolution logic outside nodes causes transition drift."

@collaborators:
    required:
        - agent_k.agents.evolver:EvolverAgent
        - agent_k.ui.agui:EventEmitter
    optional:
        - agent_k.core.protocols:PlatformAdapter
    injection: GraphContext
    lifecycle: "Instantiated per graph run."

@concurrency:
    model: asyncio
    safe: false
    reason: "Mutates mission state during execution."

@invariants:
    - "timeout > 0"

Source code in agent_k/mission/nodes.py

@dataclass
class EvolutionNode(BaseNode[MissionState, GraphContext, MissionResult]):
    """Evolution phase node.

        Executes the EVOLVER agent to optimize the solution.

        Transitions:
            - Success → SubmissionNode
            - Failure → End(failure with best solution)

    @notice: |
        Evolution phase node.

    @dev: |
        See module for implementation details and extension points.

        @pattern:
            name: graph-node
            rationale: "Encapsulates evolution phase logic in the mission graph."
            violations: "Evolution logic outside nodes causes transition drift."

        @collaborators:
            required:
                - agent_k.agents.evolver:EvolverAgent
                - agent_k.ui.agui:EventEmitter
            optional:
                - agent_k.core.protocols:PlatformAdapter
            injection: GraphContext
            lifecycle: "Instantiated per graph run."

        @concurrency:
            model: asyncio
            safe: false
            reason: "Mutates mission state during execution."

        @invariants:
            - "timeout > 0"
    """

    timeout: int = EVOLUTION_TIMEOUT_SECONDS

    async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> SubmissionNode | End[MissionResult]:
        """Execute evolution phase."""
        state = ctx.state
        emitter, _http_client, platform_adapter = _require_context(ctx.deps)
        competition = state.selected_competition
        if competition is None:
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message="No competition selected for evolution phase",
                    phases_completed=list(state.phases_completed),
                )
            )

        with logfire.span("graph.evolution", competition_id=state.competition_id):
            await emitter.emit_phase_start(
                phase="evolution",
                objectives=[
                    "Initialize population from prototype",
                    "Evolve solutions over generations",
                    "Track fitness improvements",
                    "Achieve target score or convergence",
                ],
            )

            state.current_phase = "evolution"
            state.phase_started_at = datetime.now(UTC)

            try:
                state.evolution_state = EvolutionState(
                    max_generations=state.criteria.max_evolution_rounds,
                    min_improvements_required=state.criteria.min_improvements_required,
                )

                if _quick_test_enabled(state.criteria):
                    return await self._run_quick_evolution(state, emitter)

                outcome = await self._run_full_evolution(
                    deps=ctx.deps,
                    state=state,
                    emitter=emitter,
                    platform_adapter=platform_adapter,
                    competition=competition,
                )
                if isinstance(outcome, End):
                    return outcome

                (
                    best_solution,
                    best_fitness,
                    history,
                    improvement_count,
                    convergence_detected,
                    convergence_reason,
                    population_size,
                    failure_counts,
                ) = outcome

                resolved_solution = best_solution or state.prototype_code or ""
                resolved_fitness = best_fitness if best_fitness is not None else 0.0
                failure_summary = dict(failure_counts)
                if failure_summary:
                    logfire.info(
                        "evolution_failure_summary",
                        summary=failure_summary,
                        total_failures=sum(failure_summary.values()),
                    )

                state.evolution_state = state.evolution_state.model_copy(
                    update={
                        "best_solution": {"code": resolved_solution, "fitness": resolved_fitness},
                        "convergence_detected": convergence_detected,
                        "convergence_reason": convergence_reason,
                        "current_generation": len(history),
                        "max_generations": state.criteria.max_evolution_rounds,
                        "population_size": population_size,
                        "improvement_count": improvement_count,
                        "min_improvements_required": state.criteria.min_improvements_required,
                        "generation_history": _convert_generation_history(history, population_size),
                        "failure_summary": failure_summary,
                    }
                )

                state.phases_completed.append("evolution")

                await emitter.emit_phase_complete(
                    phase="evolution", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )

                return SubmissionNode()

            except Exception as e:
                logfire.error("evolution_failed", error=str(e), traceback=traceback.format_exc())
                state.errors.append(
                    {
                        "phase": "evolution",
                        "error": str(e),
                        "error_type": type(e).__name__,
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )
                await _emit_phase_failure(state=state, emitter=emitter, phase="evolution", error=e, context="evolution")
                # Even on failure, try to submit best solution if available
                if state.evolution_state and state.evolution_state.best_solution:
                    return SubmissionNode()
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message=f"Evolution failed: {e}",
                        phases_completed=list(state.phases_completed),
                    )
                )

    async def _run_full_evolution(
        self,
        *,
        deps: GraphContext,
        state: MissionState,
        emitter: EventEmitter,
        platform_adapter: PlatformAdapter,
        competition: Any,
    ) -> (
        End[MissionResult] | tuple[str, float | None, list[dict[str, Any]], int, bool, str | None, int, dict[str, int]]
    ):
        criteria = state.criteria
        max_rounds = criteria.max_evolution_rounds

        with tempfile.TemporaryDirectory() as work_dir:
            work_path = Path(work_dir)
            competition_id = state.competition_id or competition.id
            state.competition_id = competition_id
            train_path, test_path, sample_path = await _prepare_session_data(
                platform_adapter, state.mission_id, competition_id
            )
            staged = stage_competition_data(
                train_path, test_path, sample_path, work_path, competition_id=competition_id
            )
            schema = infer_competition_schema(staged["train"], staged["test"], staged["sample"])

            population_size = evolver_settings.population_size
            solution_timeout = evolver_settings.solution_timeout
            profile = build_problem_profile(competition, schema)
            technique_policy = build_technique_policy(profile, criteria)
            population_size = max(population_size, technique_policy.min_population_size)
            if max_rounds <= 5:
                population_size = min(population_size, 4)
                solution_timeout = min(solution_timeout, 90)
            elif max_rounds <= 10:
                population_size = min(population_size, 10)
                solution_timeout = min(solution_timeout, 180)

            min_generations = min(max(evolver_settings.min_generations, technique_policy.min_generations), max_rounds)
            min_improvements_required = criteria.min_improvements_required
            fitness_policy = build_fitness_policy(profile, criteria, max_runtime_ms=int(solution_timeout * 1000))
            target_score = self._calculate_target_score(state)
            evolution_models = [model.strip() for model in criteria.evolution_models if model.strip()]
            use_openevolve = criteria.use_openevolve or evolver_settings.use_openevolve
            research = state.research_findings
            strategy_recommendations = research.strategy_recommendations if research else []
            filtered_recommendations = _filter_disallowed_recommendations(strategy_recommendations)
            strategy_text = "; ".join(filtered_recommendations) if filtered_recommendations else "N/A"
            lightgbm_guidance = (
                "LightGBM is available. Prefer it for tree-based models instead of XGBoost. "
                "For evolutionary searches, always try evolving custom LightGBM loss settings "
                "(quantile alpha, huber delta, asymmetric weighting, MAE/RMSE blends) via the "
                "LightGBM custom objective interface."
                if _LIGHTGBM_AVAILABLE
                else "LightGBM is unavailable in this runtime; do not import or use it."
            )
            avoid_library_guidance = (
                "Avoid XGBoost and CatBoost unless explicitly enabled for the mission; "
                "prefer LightGBM for tree-based boosting."
            )
            base_prompt = f"""
                    Evolve solution for {competition.title}.
                    Target: Top {criteria.target_leaderboard_percentile * 100:.0f}% on leaderboard.
                    Research suggests: {strategy_text}
                    Minimum generations before convergence (global count): {min_generations}.
                    Minimum improvements required before submission: {min_improvements_required}.
                    Maintain diversity using model families and solution complexity bins.
                    Use sample_elites to pull top and diverse candidates.
                    Use cascade evaluation in evaluate_fitness to skip full runs when quick checks fail.
                    Consider KNeighborsRegressor variants with tuned n_neighbors, weights, metric, p, leaf_size,
                    algorithm, and scaling choices (StandardScaler/MinMax/Robust) for distance sensitivity.
                    For categorical features, consider sklearn preprocessing (SimpleImputer + OneHotEncoder(handle_unknown="ignore"))
                    or pandas.get_dummies on a DataFrame; avoid mixing get_dummies output inside a ColumnTransformer.
                    {lightgbm_guidance}
                    {avoid_library_guidance}
                    If research mentions disallowed libraries, ignore those suggestions and stay within the allowed stack.
                    """
            if technique_policy.enable_target_transform:
                base_prompt += (
                    "\nFor skewed regression targets, consider log1p transforms with inverse expm1 on predictions."
                )
            if technique_policy.enable_outlier_clipping:
                base_prompt += "\nConsider clipping extreme numeric outliers via quantiles."

            baseline_fitness = _fitness_from_score(state.prototype_score, competition.metric_direction)
            best_solution = state.prototype_code or ""
            best_fitness: float | None = baseline_fitness
            improvement_count = 0
            combined_history: list[dict[str, Any]] = []
            elite_archive: dict[tuple[int, str], Any] = {}
            convergence_detected = False
            convergence_reason: str | None = None

            dataset_profile: DatasetProfile | None = None
            preprocessing_hints: list[PreprocessingHint] = []
            eda_results = research.eda_results if research else None
            if isinstance(eda_results, dict):
                profile_payload = eda_results.get("dataset_profile")
                if isinstance(profile_payload, dict):
                    dataset_profile = DatasetProfile.from_dict(profile_payload)
                hint_payloads = eda_results.get("preprocessing_hints") or []
                for hint_payload in hint_payloads:
                    if isinstance(hint_payload, dict):
                        preprocessing_hints.append(PreprocessingHint.from_dict(hint_payload))
            tracker = create_experiment_tracker()
            hint_tracker = HintEffectivenessTracker(experiment_tracker=tracker) if preprocessing_hints else None
            failure_counts: dict[str, int] = {}

            def _append_error(error_message: str, error_type: str | None) -> None:
                state.errors.append(
                    {
                        "phase": "evolution",
                        "error": error_message,
                        "error_type": error_type,
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )

            def _warn(event: str, *, error: str, model: str | None = None) -> None:
                if model:
                    logfire.warning(event, error=error, model=model)
                else:
                    logfire.warning(event, error=error)

            def record_rate_limit(error_message: str, *, model_spec: str | None, error_type: str | None) -> None:
                _append_error(error_message, error_type or "rate_limit")
                logfire.warning(
                    "evolution_rate_limited", model=model_spec or evolver_settings.model, error=error_message
                )

            def _set_partial_solution(code: str) -> None:
                if state.evolution_state is None:
                    return
                state.evolution_state = state.evolution_state.model_copy(
                    update={"best_solution": {"code": code, "fitness": 0.0}}
                )

            def _apply_rate_limit(
                error_message: str,
                *,
                model_spec: str | None,
                error_type: str | None,
                deps: EvolverDeps | None,
                mark_convergence: bool,
            ) -> None:
                nonlocal combined_history, improvement_count, convergence_detected, convergence_reason
                record_rate_limit(error_message, model_spec=model_spec, error_type=error_type)
                if deps is not None:
                    combined_history = deps.generation_history
                    improvement_count = deps.improvement_count
                if mark_convergence:
                    convergence_detected = True
                    convergence_reason = "rate_limit"

            async def _emit_failure(result: EvolutionFailure) -> End[MissionResult]:
                _append_error(result.error_message, result.error_type)
                await emitter.emit_phase_error(
                    phase="evolution", error=result.error_message, recoverable=bool(result.recoverable)
                )
                await emitter.emit_error(
                    error_id=f"evolution_{state.mission_id}",
                    category="recoverable" if result.recoverable else "fatal",
                    error_type=result.error_type,
                    message=result.error_message,
                    context="evolution",
                    recovery_strategy="retry" if result.recoverable else "abort",
                )
                await emitter.emit_phase_complete(
                    phase="evolution", success=False, duration_ms=self._elapsed_ms(state.phase_started_at)
                )
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        competition_id=state.competition_id,
                        error_message=f"Evolution failed: {result.error_message}",
                        phases_completed=list(state.phases_completed),
                    )
                )

            async def _apply_fallback(
                result: EvolutionFailure,
                *,
                deps: EvolverDeps,
                model: str | None = None,
                reason: str = "failure_fallback",
                event: str = "evolution_failure_fallback",
                error_id: str = "evolution_fallback",
                update_partial: bool = True,
                require_solution: bool = True,
                error_type: str | None = None,
            ) -> bool:
                nonlocal best_solution, best_fitness, combined_history, improvement_count, convergence_detected
                nonlocal convergence_reason
                fallback_solution = result.partial_solution or best_solution or state.prototype_code or ""
                if require_solution and not fallback_solution:
                    return False
                if update_partial and result.partial_solution:
                    _set_partial_solution(result.partial_solution)
                best_solution = fallback_solution
                if best_fitness is None:
                    best_fitness = baseline_fitness or 0.0
                combined_history = deps.generation_history
                improvement_count = deps.improvement_count
                convergence_detected = True
                convergence_reason = reason
                _warn(event, error=result.error_message, model=model)
                _append_error(result.error_message, error_type or result.error_type)
                await emitter.emit_error(
                    error_id=f"{error_id}_{state.mission_id}",
                    category="recoverable",
                    error_type=error_type or result.error_type,
                    message=result.error_message,
                    context="evolution",
                    recovery_strategy="fallback",
                )
                return True

            def _apply_success(result: Any, deps: EvolverDeps) -> None:
                nonlocal combined_history, improvement_count, best_solution, best_fitness, convergence_detected
                nonlocal convergence_reason
                combined_history = deps.generation_history
                improvement_count = deps.improvement_count
                best_solution = result.best_solution
                best_fitness = result.best_fitness
                convergence_detected = result.convergence_achieved
                convergence_reason = result.convergence_reason

            deps_kwargs = {
                "competition": competition,
                "event_emitter": emitter,
                "platform_adapter": platform_adapter,
                "data_dir": work_path,
                "train_path": staged["train"],
                "test_path": staged["test"],
                "sample_path": staged["sample"],
                "target_columns": schema.target_columns,
                "train_target_columns": schema.train_target_columns,
                "id_column": schema.id_column,
                "problem_profile": profile,
                "technique_policy": technique_policy,
                "fitness_policy": fitness_policy,
                "population_size": population_size,
                "solution_timeout": solution_timeout,
                "target_score": target_score,
                "min_generations": min_generations,
                "min_improvements_required": min_improvements_required,
                "experiment_tracker": tracker,
                "dataset_profile": dataset_profile,
                "preprocessing_hints": preprocessing_hints,
                "hint_tracker": hint_tracker,
                "failure_counts": failure_counts,
            }

            if use_openevolve:
                deps_instance = EvolverDeps(
                    **deps_kwargs,
                    initial_solution=best_solution,
                    best_solution=best_solution or None,
                    best_fitness=best_fitness,
                    max_generations=max_rounds,
                    improvement_count=improvement_count,
                    elite_archive=elite_archive,
                )
                evolver_instance = EvolverAgent(settings=evolver_settings, register=False)
                try:
                    result = await evolver_instance.run_openevolve(
                        deps_instance, base_prompt=base_prompt, model_specs=evolution_models or [evolver_settings.model]
                    )
                except Exception as exc:
                    if _is_rate_limit_error(exc):
                        _apply_rate_limit(
                            str(exc),
                            model_spec=None,
                            error_type=getattr(exc, "code", None),
                            deps=deps_instance,
                            mark_convergence=True,
                        )
                    else:
                        raise
                else:
                    if isinstance(result, EvolutionFailure):
                        if not await _apply_fallback(
                            result, deps=deps_instance, model="openevolve", update_partial=False
                        ):
                            return await _emit_failure(result)
                    else:
                        _apply_success(result, deps_instance)

            elif not evolution_models:
                deps_instance = EvolverDeps(
                    **deps_kwargs,
                    initial_solution=best_solution,
                    best_solution=best_solution or None,
                    best_fitness=best_fitness,
                    max_generations=max_rounds,
                    improvement_count=improvement_count,
                    elite_archive=elite_archive,
                )
                evolver_agent = _resolve_agent(deps, "evolver")
                try:
                    run_result = await evolver_agent.run(base_prompt, deps=deps_instance)
                except Exception as exc:
                    if _is_rate_limit_error(exc):
                        _apply_rate_limit(
                            str(exc),
                            model_spec=None,
                            error_type=getattr(exc, "code", None),
                            deps=deps_instance,
                            mark_convergence=True,
                        )
                    else:
                        raise
                else:
                    result = run_result.output
                    if isinstance(result, EvolutionFailure):
                        if _is_rate_limit_error(result.error_message) or _is_rate_limit_error(result.error_type):
                            if result.partial_solution:
                                best_solution = result.partial_solution
                            _apply_rate_limit(
                                result.error_message,
                                model_spec=None,
                                error_type=result.error_type,
                                deps=deps_instance,
                                mark_convergence=True,
                            )
                        elif _is_constraints_failure(result.error_message):
                            await _apply_fallback(
                                result,
                                deps=deps_instance,
                                reason="constraints",
                                event="evolution_constraints_fallback",
                                error_id="evolution_constraints",
                                update_partial=False,
                                require_solution=False,
                                error_type=result.error_type or "constraints",
                            )
                        else:
                            if not await _apply_fallback(result, deps=deps_instance, model="primary"):
                                if result.partial_solution:
                                    _set_partial_solution(result.partial_solution)
                                return await _emit_failure(result)
                    else:
                        _apply_success(result, deps_instance)
            else:
                agents_by_model: dict[str, Any] = {}
                remaining_generations = max_rounds
                available_models = [model for model in evolution_models if model]
                segment_index = 0
                model_index = 0

                while remaining_generations > 0 and available_models:
                    segment_index += 1
                    rotation_stride = max(5, min(25, math.ceil(remaining_generations / max(len(available_models), 1))))
                    model_spec = available_models[model_index % len(available_models)]
                    segment_generations = min(rotation_stride, remaining_generations)
                    generation_offset = len(combined_history)

                    agent = agents_by_model.get(model_spec)
                    if agent is None:
                        segment_settings = evolver_settings.model_copy(update={"model": model_spec})
                        agent_instance = EvolverAgent(settings=segment_settings, register=False)
                        agent = agent_instance.agent
                        agents_by_model[model_spec] = agent

                    segment_prompt = (
                        f"""{base_prompt}
Model rotation segment {segment_index} using {model_spec}."""
                        f"\nRun {segment_generations} generations for this segment starting at {generation_offset + 1},"
                        " unless convergence criteria are met earlier."
                    )

                    segment_deps = EvolverDeps(
                        **deps_kwargs,
                        initial_solution=best_solution or state.prototype_code or "",
                        best_solution=best_solution or None,
                        best_fitness=best_fitness,
                        max_generations=segment_generations,
                        improvement_count=improvement_count,
                        generation_history=combined_history,
                        generation_offset=generation_offset,
                        elite_archive=elite_archive,
                    )
                    try:
                        run_result = await agent.run(segment_prompt, deps=segment_deps)
                    except Exception as exc:
                        if _is_rate_limit_error(exc):
                            _apply_rate_limit(
                                str(exc),
                                model_spec=model_spec,
                                error_type=getattr(exc, "code", None),
                                deps=segment_deps,
                                mark_convergence=False,
                            )
                            agents_by_model.pop(model_spec, None)
                            available_models = [model for model in available_models if model != model_spec]
                            if not available_models:
                                convergence_detected = True
                                convergence_reason = "rate_limit"
                            continue
                        raise

                    result = run_result.output
                    if isinstance(result, EvolutionFailure):
                        if _is_rate_limit_error(result.error_message) or _is_rate_limit_error(result.error_type):
                            if result.partial_solution:
                                best_solution = result.partial_solution
                            _apply_rate_limit(
                                result.error_message,
                                model_spec=model_spec,
                                error_type=result.error_type,
                                deps=segment_deps,
                                mark_convergence=False,
                            )
                            agents_by_model.pop(model_spec, None)
                            available_models = [model for model in available_models if model != model_spec]
                            if not available_models:
                                convergence_detected = True
                                convergence_reason = "rate_limit"
                            continue
                        if _is_constraints_failure(result.error_message):
                            await _apply_fallback(
                                result,
                                deps=segment_deps,
                                model=model_spec,
                                reason="constraints",
                                event="evolution_constraints_fallback",
                                error_id="evolution_constraints",
                                update_partial=False,
                                require_solution=False,
                                error_type=result.error_type or "constraints",
                            )
                            break

                        if await _apply_fallback(result, deps=segment_deps, model=model_spec):
                            break
                        if result.partial_solution:
                            _set_partial_solution(result.partial_solution)
                        return await _emit_failure(result)

                    if best_fitness is None or result.best_fitness > best_fitness:
                        best_fitness = result.best_fitness
                        best_solution = result.best_solution
                    improvement_count = segment_deps.improvement_count
                    model_index += 1

                    if result.convergence_achieved and len(combined_history) >= min_generations:
                        convergence_detected = True
                        convergence_reason = result.convergence_reason
                        break

                    if len(combined_history) <= generation_offset:
                        baseline = result.best_fitness if result.best_fitness is not None else (best_fitness or 0.0)
                        for idx in range(segment_generations):
                            combined_history.append(
                                {
                                    "generation": generation_offset + idx + 1,
                                    "best_fitness": baseline,
                                    "mean_fitness": baseline,
                                    "worst_fitness": baseline,
                                    "population_size": population_size,
                                    "mutations": {"point": 0, "structural": 0, "hyperparameter": 0, "crossover": 0},
                                }
                            )

                    remaining_generations = max_rounds - len(combined_history)

                if not available_models and remaining_generations > 0:
                    convergence_detected = True
                    convergence_reason = "rate_limit"

        return (
            best_solution,
            best_fitness,
            combined_history,
            improvement_count,
            convergence_detected,
            convergence_reason,
            population_size,
            failure_counts,
        )

    async def _run_quick_evolution(self, state: MissionState, emitter: EventEmitter) -> SubmissionNode:
        max_generations = state.criteria.max_evolution_rounds
        population_size = max(2, min(evolver_settings.population_size, 2))
        baseline_score = state.prototype_score or 0.0
        mutations = {"point": 0, "structural": 0, "hyperparameter": 0, "crossover": 0}

        generation_history: list[GenerationMetrics] = []
        for generation in range(1, max_generations + 1):
            await emitter.emit_generation_start(generation=generation, population_size=population_size)
            metrics = GenerationMetrics(
                generation=generation,
                best_fitness=baseline_score,
                mean_fitness=baseline_score,
                worst_fitness=baseline_score,
                population_size=population_size,
                mutations=mutations,
            )
            generation_history.append(metrics)
            await emitter.emit_generation_complete(
                generation=generation,
                best_fitness=baseline_score,
                mean_fitness=baseline_score,
                worst_fitness=baseline_score,
                population_size=population_size,
                mutations=mutations,
            )

        if state.evolution_state is not None:
            state.evolution_state = state.evolution_state.model_copy(
                update={
                    "current_generation": max_generations,
                    "max_generations": max_generations,
                    "population_size": population_size,
                    "improvement_count": 0,
                    "min_improvements_required": state.criteria.min_improvements_required,
                    "best_solution": {"code": state.prototype_code or "", "fitness": baseline_score},
                    "generation_history": generation_history,
                    "convergence_detected": True,
                    "convergence_reason": "quick_test_mode",
                    "failure_summary": {},
                }
            )
        state.phases_completed.append("evolution")
        await emitter.emit_phase_complete(
            phase="evolution", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
        )
        return SubmissionNode()

    def _calculate_target_score(self, state: MissionState) -> float:
        """Calculate target score from research findings."""
        override = os.getenv("AGENT_K_TARGET_SCORE")
        if override:
            try:
                return float(override)
            except ValueError:
                logfire.warning("invalid_target_score_override", value=override)
        if state.research_findings and state.research_findings.leaderboard_analysis:
            return state.research_findings.leaderboard_analysis.target_score
        return 0.0

    def _elapsed_ms(self, start: datetime | None) -> int:
        return int((datetime.now(UTC) - start).total_seconds() * 1000) if start else 0

run `async`

run(ctx: GraphRunContext[MissionState, GraphContext]) -> SubmissionNode | End[MissionResult]

Execute evolution phase.

Source code in agent_k/mission/nodes.py

async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> SubmissionNode | End[MissionResult]:
    """Execute evolution phase."""
    state = ctx.state
    emitter, _http_client, platform_adapter = _require_context(ctx.deps)
    competition = state.selected_competition
    if competition is None:
        return End(
            MissionResult(
                success=False,
                mission_id=state.mission_id,
                error_message="No competition selected for evolution phase",
                phases_completed=list(state.phases_completed),
            )
        )

    with logfire.span("graph.evolution", competition_id=state.competition_id):
        await emitter.emit_phase_start(
            phase="evolution",
            objectives=[
                "Initialize population from prototype",
                "Evolve solutions over generations",
                "Track fitness improvements",
                "Achieve target score or convergence",
            ],
        )

        state.current_phase = "evolution"
        state.phase_started_at = datetime.now(UTC)

        try:
            state.evolution_state = EvolutionState(
                max_generations=state.criteria.max_evolution_rounds,
                min_improvements_required=state.criteria.min_improvements_required,
            )

            if _quick_test_enabled(state.criteria):
                return await self._run_quick_evolution(state, emitter)

            outcome = await self._run_full_evolution(
                deps=ctx.deps,
                state=state,
                emitter=emitter,
                platform_adapter=platform_adapter,
                competition=competition,
            )
            if isinstance(outcome, End):
                return outcome

            (
                best_solution,
                best_fitness,
                history,
                improvement_count,
                convergence_detected,
                convergence_reason,
                population_size,
                failure_counts,
            ) = outcome

            resolved_solution = best_solution or state.prototype_code or ""
            resolved_fitness = best_fitness if best_fitness is not None else 0.0
            failure_summary = dict(failure_counts)
            if failure_summary:
                logfire.info(
                    "evolution_failure_summary",
                    summary=failure_summary,
                    total_failures=sum(failure_summary.values()),
                )

            state.evolution_state = state.evolution_state.model_copy(
                update={
                    "best_solution": {"code": resolved_solution, "fitness": resolved_fitness},
                    "convergence_detected": convergence_detected,
                    "convergence_reason": convergence_reason,
                    "current_generation": len(history),
                    "max_generations": state.criteria.max_evolution_rounds,
                    "population_size": population_size,
                    "improvement_count": improvement_count,
                    "min_improvements_required": state.criteria.min_improvements_required,
                    "generation_history": _convert_generation_history(history, population_size),
                    "failure_summary": failure_summary,
                }
            )

            state.phases_completed.append("evolution")

            await emitter.emit_phase_complete(
                phase="evolution", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
            )

            return SubmissionNode()

        except Exception as e:
            logfire.error("evolution_failed", error=str(e), traceback=traceback.format_exc())
            state.errors.append(
                {
                    "phase": "evolution",
                    "error": str(e),
                    "error_type": type(e).__name__,
                    "timestamp": datetime.now(UTC).isoformat(),
                }
            )
            await _emit_phase_failure(state=state, emitter=emitter, phase="evolution", error=e, context="evolution")
            # Even on failure, try to submit best solution if available
            if state.evolution_state and state.evolution_state.best_solution:
                return SubmissionNode()
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message=f"Evolution failed: {e}",
                    phases_completed=list(state.phases_completed),
                )
            )

SubmissionNode `dataclass`

Bases: BaseNode[MissionState, GraphContext, MissionResult]

Submission phase node.

Final submission of best solution.

Transitions:
    - Success → End(success)
    - Failure → End(failure)

@notice: | Submission phase node.

@dev: | See module for implementation details and extension points.

@pattern:
    name: graph-node
    rationale: "Encapsulates submission phase logic in the mission graph."
    violations: "Submission logic outside nodes causes transition drift."

@collaborators:
    required:
        - agent_k.core.protocols:PlatformAdapter
        - agent_k.ui.agui:EventEmitter
    optional:
        - agent_k.agents.evolver:EvolverAgent
    injection: GraphContext
    lifecycle: "Instantiated per graph run."

@concurrency:
    model: asyncio
    safe: false
    reason: "Mutates mission state during execution."

@invariants:
    - "timeout > 0"

Source code in agent_k/mission/nodes.py

@dataclass
class SubmissionNode(BaseNode[MissionState, GraphContext, MissionResult]):
    """Submission phase node.

        Final submission of best solution.

        Transitions:
            - Success → End(success)
            - Failure → End(failure)

    @notice: |
        Submission phase node.

    @dev: |
        See module for implementation details and extension points.

        @pattern:
            name: graph-node
            rationale: "Encapsulates submission phase logic in the mission graph."
            violations: "Submission logic outside nodes causes transition drift."

        @collaborators:
            required:
                - agent_k.core.protocols:PlatformAdapter
                - agent_k.ui.agui:EventEmitter
            optional:
                - agent_k.agents.evolver:EvolverAgent
            injection: GraphContext
            lifecycle: "Instantiated per graph run."

        @concurrency:
            model: asyncio
            safe: false
            reason: "Mutates mission state during execution."

        @invariants:
            - "timeout > 0"
    """

    timeout: int = SUBMISSION_TIMEOUT_SECONDS

    async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> End[MissionResult]:
        """Execute submission phase."""
        state = ctx.state
        emitter, _http_client, platform_adapter = _require_context(ctx.deps)
        competition = state.selected_competition
        if competition is None:
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    error_message="No competition selected for submission",
                    phases_completed=list(state.phases_completed),
                )
            )

        with logfire.span("graph.submission", competition_id=state.competition_id):
            await emitter.emit_phase_start(
                phase="submission",
                objectives=["Generate final predictions", "Submit to Kaggle", "Retrieve final score and rank"],
            )

            state.current_phase = "submission"
            state.phase_started_at = datetime.now(UTC)

            try:
                min_improvements_required = (
                    state.evolution_state.min_improvements_required if state.evolution_state else 0
                )
                improvement_count = state.evolution_state.improvement_count if state.evolution_state else 0
                if min_improvements_required > 0 and improvement_count < min_improvements_required:
                    error_message = (
                        f"Minimum improvements not reached ({improvement_count}/{min_improvements_required})"
                    )
                    logfire.warning(
                        "submission_blocked_min_improvements",
                        improvement_count=improvement_count,
                        min_improvements_required=min_improvements_required,
                    )
                    state.errors.append(
                        {
                            "phase": "submission",
                            "error": error_message,
                            "error_type": "min_improvements",
                            "timestamp": datetime.now(UTC).isoformat(),
                        }
                    )
                    await emitter.emit_phase_error(phase="submission", error=error_message, recoverable=True)
                    await emitter.emit_phase_complete(
                        phase="submission", success=False, duration_ms=self._elapsed_ms(state.phase_started_at)
                    )
                    _cleanup_session_data(state.mission_id)
                    return End(
                        MissionResult(
                            success=False,
                            mission_id=state.mission_id,
                            competition_id=state.competition_id,
                            error_message=error_message,
                            phases_completed=list(state.phases_completed),
                        )
                    )

                # Get best solution
                best_code = ""
                if state.evolution_state and state.evolution_state.best_solution:
                    best_code = state.evolution_state.best_solution.get("code", "")
                elif state.prototype_code:
                    best_code = state.prototype_code

                if not best_code:
                    _cleanup_session_data(state.mission_id)
                    return End(
                        MissionResult(
                            success=False,
                            mission_id=state.mission_id,
                            error_message="No solution available for submission",
                            phases_completed=list(state.phases_completed),
                        )
                    )

                with tempfile.TemporaryDirectory() as work_dir:
                    work_path = Path(work_dir)
                    competition_id = state.competition_id or competition.id
                    state.competition_id = competition_id
                    train_path, test_path, sample_path = await _prepare_session_data(
                        platform_adapter, state.mission_id, competition_id
                    )
                    staged = stage_competition_data(
                        train_path, test_path, sample_path, work_path, competition_id=competition_id
                    )
                    schema = infer_competition_schema(staged["train"], staged["test"], staged["sample"])
                    profile = build_problem_profile(competition, schema)
                    technique_policy = build_technique_policy(profile, state.criteria)
                    best_code, notes = apply_solution_policy(best_code, technique_policy)
                    if notes:
                        logfire.warning("submission_policy_injection_failed", notes=notes)

                    submission_path = work_path / "submission.csv"
                    execution = await execute_solution(
                        best_code,
                        work_path,
                        timeout_seconds=self.timeout,
                        use_builtin_code_execution=True,
                        model_spec=evolver_settings.model,
                    )

                    if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                        fallback_code = state.prototype_code
                        if fallback_code and fallback_code != best_code:
                            fallback_code, notes = apply_solution_policy(fallback_code, technique_policy)
                            if notes:
                                logfire.warning("submission_policy_injection_failed_fallback", notes=notes)
                            execution = await execute_solution(
                                fallback_code,
                                work_path,
                                timeout_seconds=self.timeout,
                                use_builtin_code_execution=True,
                                model_spec=evolver_settings.model,
                            )

                        if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                            _write_fallback_submission(
                                train_path=staged["train"],
                                test_path=staged["test"],
                                sample_path=staged["sample"],
                                metric=competition.metric,
                                output_path=submission_path,
                            )

                    if not submission_path.exists():
                        _cleanup_session_data(state.mission_id)
                        return End(
                            MissionResult(
                                success=False,
                                mission_id=state.mission_id,
                                error_message="Failed to generate submission file",
                                phases_completed=list(state.phases_completed),
                            )
                        )

                    # Submit via platform adapter
                    submission = await platform_adapter.submit(
                        competition_id, str(submission_path), message=f"AGENT-K mission {state.mission_id}"
                    )

                state.final_submission_id = submission.id

                # Wait for score
                for _ in range(10):  # Poll for score
                    await asyncio.sleep(5)
                    status = await platform_adapter.get_submission_status(competition_id, submission.id)
                    if status.public_score is not None:
                        state.final_score = status.public_score
                        break

                if state.final_score is None:
                    best_fitness = None
                    if state.evolution_state and state.evolution_state.best_solution:
                        best_fitness = state.evolution_state.best_solution.get("fitness")
                    fallback_score = _score_from_fitness(best_fitness, competition.metric_direction)
                    if fallback_score is not None:
                        state.final_score = fallback_score
                        logfire.info(
                            "submission_score_fallback",
                            competition_id=competition_id,
                            source="fitness",
                            score=fallback_score,
                        )
                    elif state.prototype_score is not None:
                        state.final_score = state.prototype_score
                        logfire.info(
                            "submission_score_fallback",
                            competition_id=competition_id,
                            source="prototype",
                            score=state.prototype_score,
                        )

                # Get rank
                leaderboard = await platform_adapter.get_leaderboard(competition_id, limit=10000)
                for entry in leaderboard:
                    if entry.score == state.final_score:
                        state.final_rank = entry.rank
                        break

                best_fitness = None
                if state.evolution_state and state.evolution_state.best_solution:
                    best_fitness = state.evolution_state.best_solution.get("fitness")
                tracker = create_experiment_tracker()
                metadata = extract_solution_metadata(best_code)
                tracker.record_experiment(
                    ExperimentRecord(
                        competition_id=competition_id,
                        phase="submission",
                        model_name=metadata.model_name,
                        model_family=metadata.model_family,
                        hyperparameters=metadata.hyperparameters,
                        feature_set=metadata.feature_set,
                        feature_engineering=metadata.feature_engineering,
                        target_transform=metadata.target_transform,
                        metrics={
                            "fitness": best_fitness,
                            "public_score": state.final_score,
                            "rank": state.final_rank,
                            "total_teams": len(leaderboard),
                        },
                        public_score=state.final_score,
                        submission_id=submission.id,
                        rank=state.final_rank,
                        code_signature=hashlib.sha256(best_code.encode()).hexdigest()[:12],
                        dataset_fingerprint=competition_id,
                    )
                )

                state.phases_completed.append("submission")

                # Emit submission result
                await emitter.emit_submission_result(
                    submission_id=submission.id,
                    generation=(len(state.evolution_state.generation_history) if state.evolution_state else 0),
                    cv_score=(
                        state.evolution_state.best_solution.get("fitness", 0)
                        if state.evolution_state and state.evolution_state.best_solution
                        else 0
                    ),
                    public_score=state.final_score,
                    rank=state.final_rank,
                    total_teams=len(leaderboard),
                )

                await emitter.emit_phase_complete(
                    phase="submission", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
                )

                _cleanup_session_data(state.mission_id)

                # Calculate total duration
                total_duration_ms = int((datetime.now(UTC) - state.started_at).total_seconds() * 1000)

                return End(
                    MissionResult(
                        success=True,
                        mission_id=state.mission_id,
                        competition_id=state.competition_id,
                        final_rank=state.final_rank,
                        final_score=state.final_score,
                        total_submissions=(
                            len(state.evolution_state.leaderboard_submissions) if state.evolution_state else 1
                        ),
                        evolution_generations=(
                            len(state.evolution_state.generation_history) if state.evolution_state else 0
                        ),
                        duration_ms=total_duration_ms,
                        phases_completed=list(state.phases_completed),
                    )
                )

            except Exception as e:
                logfire.error("submission_failed", error=str(e))
                state.errors.append(
                    {"phase": "submission", "error": str(e), "timestamp": datetime.now(UTC).isoformat()}
                )
                _cleanup_session_data(state.mission_id)
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        competition_id=state.competition_id,
                        error_message=f"Submission failed: {e}",
                        phases_completed=list(state.phases_completed),
                    )
                )

    def _elapsed_ms(self, start: datetime | None) -> int:
        return int((datetime.now(UTC) - start).total_seconds() * 1000) if start else 0

run `async`

run(ctx: GraphRunContext[MissionState, GraphContext]) -> End[MissionResult]

Execute submission phase.

Source code in agent_k/mission/nodes.py

async def run(self, ctx: GraphRunContext[MissionState, GraphContext]) -> End[MissionResult]:
    """Execute submission phase."""
    state = ctx.state
    emitter, _http_client, platform_adapter = _require_context(ctx.deps)
    competition = state.selected_competition
    if competition is None:
        return End(
            MissionResult(
                success=False,
                mission_id=state.mission_id,
                error_message="No competition selected for submission",
                phases_completed=list(state.phases_completed),
            )
        )

    with logfire.span("graph.submission", competition_id=state.competition_id):
        await emitter.emit_phase_start(
            phase="submission",
            objectives=["Generate final predictions", "Submit to Kaggle", "Retrieve final score and rank"],
        )

        state.current_phase = "submission"
        state.phase_started_at = datetime.now(UTC)

        try:
            min_improvements_required = (
                state.evolution_state.min_improvements_required if state.evolution_state else 0
            )
            improvement_count = state.evolution_state.improvement_count if state.evolution_state else 0
            if min_improvements_required > 0 and improvement_count < min_improvements_required:
                error_message = (
                    f"Minimum improvements not reached ({improvement_count}/{min_improvements_required})"
                )
                logfire.warning(
                    "submission_blocked_min_improvements",
                    improvement_count=improvement_count,
                    min_improvements_required=min_improvements_required,
                )
                state.errors.append(
                    {
                        "phase": "submission",
                        "error": error_message,
                        "error_type": "min_improvements",
                        "timestamp": datetime.now(UTC).isoformat(),
                    }
                )
                await emitter.emit_phase_error(phase="submission", error=error_message, recoverable=True)
                await emitter.emit_phase_complete(
                    phase="submission", success=False, duration_ms=self._elapsed_ms(state.phase_started_at)
                )
                _cleanup_session_data(state.mission_id)
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        competition_id=state.competition_id,
                        error_message=error_message,
                        phases_completed=list(state.phases_completed),
                    )
                )

            # Get best solution
            best_code = ""
            if state.evolution_state and state.evolution_state.best_solution:
                best_code = state.evolution_state.best_solution.get("code", "")
            elif state.prototype_code:
                best_code = state.prototype_code

            if not best_code:
                _cleanup_session_data(state.mission_id)
                return End(
                    MissionResult(
                        success=False,
                        mission_id=state.mission_id,
                        error_message="No solution available for submission",
                        phases_completed=list(state.phases_completed),
                    )
                )

            with tempfile.TemporaryDirectory() as work_dir:
                work_path = Path(work_dir)
                competition_id = state.competition_id or competition.id
                state.competition_id = competition_id
                train_path, test_path, sample_path = await _prepare_session_data(
                    platform_adapter, state.mission_id, competition_id
                )
                staged = stage_competition_data(
                    train_path, test_path, sample_path, work_path, competition_id=competition_id
                )
                schema = infer_competition_schema(staged["train"], staged["test"], staged["sample"])
                profile = build_problem_profile(competition, schema)
                technique_policy = build_technique_policy(profile, state.criteria)
                best_code, notes = apply_solution_policy(best_code, technique_policy)
                if notes:
                    logfire.warning("submission_policy_injection_failed", notes=notes)

                submission_path = work_path / "submission.csv"
                execution = await execute_solution(
                    best_code,
                    work_path,
                    timeout_seconds=self.timeout,
                    use_builtin_code_execution=True,
                    model_spec=evolver_settings.model,
                )

                if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                    fallback_code = state.prototype_code
                    if fallback_code and fallback_code != best_code:
                        fallback_code, notes = apply_solution_policy(fallback_code, technique_policy)
                        if notes:
                            logfire.warning("submission_policy_injection_failed_fallback", notes=notes)
                        execution = await execute_solution(
                            fallback_code,
                            work_path,
                            timeout_seconds=self.timeout,
                            use_builtin_code_execution=True,
                            model_spec=evolver_settings.model,
                        )

                    if not submission_path.exists() or execution.returncode != 0 or execution.timed_out:
                        _write_fallback_submission(
                            train_path=staged["train"],
                            test_path=staged["test"],
                            sample_path=staged["sample"],
                            metric=competition.metric,
                            output_path=submission_path,
                        )

                if not submission_path.exists():
                    _cleanup_session_data(state.mission_id)
                    return End(
                        MissionResult(
                            success=False,
                            mission_id=state.mission_id,
                            error_message="Failed to generate submission file",
                            phases_completed=list(state.phases_completed),
                        )
                    )

                # Submit via platform adapter
                submission = await platform_adapter.submit(
                    competition_id, str(submission_path), message=f"AGENT-K mission {state.mission_id}"
                )

            state.final_submission_id = submission.id

            # Wait for score
            for _ in range(10):  # Poll for score
                await asyncio.sleep(5)
                status = await platform_adapter.get_submission_status(competition_id, submission.id)
                if status.public_score is not None:
                    state.final_score = status.public_score
                    break

            if state.final_score is None:
                best_fitness = None
                if state.evolution_state and state.evolution_state.best_solution:
                    best_fitness = state.evolution_state.best_solution.get("fitness")
                fallback_score = _score_from_fitness(best_fitness, competition.metric_direction)
                if fallback_score is not None:
                    state.final_score = fallback_score
                    logfire.info(
                        "submission_score_fallback",
                        competition_id=competition_id,
                        source="fitness",
                        score=fallback_score,
                    )
                elif state.prototype_score is not None:
                    state.final_score = state.prototype_score
                    logfire.info(
                        "submission_score_fallback",
                        competition_id=competition_id,
                        source="prototype",
                        score=state.prototype_score,
                    )

            # Get rank
            leaderboard = await platform_adapter.get_leaderboard(competition_id, limit=10000)
            for entry in leaderboard:
                if entry.score == state.final_score:
                    state.final_rank = entry.rank
                    break

            best_fitness = None
            if state.evolution_state and state.evolution_state.best_solution:
                best_fitness = state.evolution_state.best_solution.get("fitness")
            tracker = create_experiment_tracker()
            metadata = extract_solution_metadata(best_code)
            tracker.record_experiment(
                ExperimentRecord(
                    competition_id=competition_id,
                    phase="submission",
                    model_name=metadata.model_name,
                    model_family=metadata.model_family,
                    hyperparameters=metadata.hyperparameters,
                    feature_set=metadata.feature_set,
                    feature_engineering=metadata.feature_engineering,
                    target_transform=metadata.target_transform,
                    metrics={
                        "fitness": best_fitness,
                        "public_score": state.final_score,
                        "rank": state.final_rank,
                        "total_teams": len(leaderboard),
                    },
                    public_score=state.final_score,
                    submission_id=submission.id,
                    rank=state.final_rank,
                    code_signature=hashlib.sha256(best_code.encode()).hexdigest()[:12],
                    dataset_fingerprint=competition_id,
                )
            )

            state.phases_completed.append("submission")

            # Emit submission result
            await emitter.emit_submission_result(
                submission_id=submission.id,
                generation=(len(state.evolution_state.generation_history) if state.evolution_state else 0),
                cv_score=(
                    state.evolution_state.best_solution.get("fitness", 0)
                    if state.evolution_state and state.evolution_state.best_solution
                    else 0
                ),
                public_score=state.final_score,
                rank=state.final_rank,
                total_teams=len(leaderboard),
            )

            await emitter.emit_phase_complete(
                phase="submission", success=True, duration_ms=self._elapsed_ms(state.phase_started_at)
            )

            _cleanup_session_data(state.mission_id)

            # Calculate total duration
            total_duration_ms = int((datetime.now(UTC) - state.started_at).total_seconds() * 1000)

            return End(
                MissionResult(
                    success=True,
                    mission_id=state.mission_id,
                    competition_id=state.competition_id,
                    final_rank=state.final_rank,
                    final_score=state.final_score,
                    total_submissions=(
                        len(state.evolution_state.leaderboard_submissions) if state.evolution_state else 1
                    ),
                    evolution_generations=(
                        len(state.evolution_state.generation_history) if state.evolution_state else 0
                    ),
                    duration_ms=total_duration_ms,
                    phases_completed=list(state.phases_completed),
                )
            )

        except Exception as e:
            logfire.error("submission_failed", error=str(e))
            state.errors.append(
                {"phase": "submission", "error": str(e), "timestamp": datetime.now(UTC).isoformat()}
            )
            _cleanup_session_data(state.mission_id)
            return End(
                MissionResult(
                    success=False,
                    mission_id=state.mission_id,
                    competition_id=state.competition_id,
                    error_message=f"Submission failed: {e}",
                    phases_completed=list(state.phases_completed),
                )
            )

agent_k.mission.nodes