LLM-driven AutoSolver System

让 Agent 自己发明 solver

一个面向复杂组合优化任务的自适应智能求解系统:它通过大模型理解问题,通过 LangGraph 编排求解流程,通过沙箱验证约束正确性,通过评分与记忆机制持续进化求解策略。

AutoSolver Product Architecture Actual module map · CLI → Agent → Runner → Workflow → Validation → Memory Feedback
LIVE ARCHITECTURE
ENTRY & ORCHESTRATION LANGGRAPH WORKFLOW CORE EXECUTION / VALIDATION / FEEDBACK CLI / API 统一调用入口 AutoSolver LangChainAgent TASK UNDERSTANDING Runner 多轮实验调度 AutoSolver Workflow STATE GRAPH LangGraph: classify → generate → validate_and_score → finalize 将大模型生成、程序执行、约束验证与结果评分组织成可追踪状态流 classify generate validate_and_score finalize FrameworkStore 策略框架 / 方法论 MemoryStore 记忆 / UCB bandit ArtifactStore 日志 / 产物 / 报告 LLMCode Generator planning · coding · repair Toolbox PlannerTool Solver candidate code feedback loop: Validator → Runtime → Scorer → Memory / Artifact / Final Solver
LLM AgentLangGraph WorkflowProgram SynthesisSandbox ValidationScoring FeedbackFrameworkStoreMemoryStoreUCB BanditArtifactStore LLM AgentLangGraph WorkflowProgram SynthesisSandbox ValidationScoring FeedbackFrameworkStoreMemoryStoreUCB BanditArtifactStore
实例画像

识别问题规模、约束密度、资源分布和潜在瓶颈,为策略选择提供结构化上下文。

策略合成

根据实例特征与历史经验自动生成候选 solver,而不是固定调用单一算法。

验证评分

通过沙箱执行、约束检查、异常捕获和目标函数评分筛选高质量候选。

记忆进化

将实验结果沉淀进 MemoryStore 与 FrameworkStore,驱动下一轮策略优化。

Closed-loop Intelligence

不是“生成一次代码”,而是构建一条实验驱动的智能闭环

Agent 会把大模型提出的候选方案转化为真实可运行的 solver,再通过沙箱验证、评分器评估和记忆系统反馈进行多轮迭代。这使系统从普通文本生成升级为可执行、可验证、可进化的算法设计流程。

五阶段自进化流程

系统以 Generate、Validate、Score、Reflect、Evolve 为核心循环,每一轮都在真实实验反馈的基础上修正策略,而不是盲目相信大模型的单次输出。

01Generate
02Validate
03Score
04Reflect
05Evolve
Verifier-in-the-loop 真实执行反馈 多轮候选搜索 策略自修正

智能体像自动化研究员一样工作

它会观察输入实例,提出算法假设,生成候选代码,运行实验,比较结果,并将成功与失败经验沉淀为下一轮推理的知识基础。

agent.classify(case)
agent.generate(candidate_solver)
sandbox.validate(candidate)
score.rank(candidate)
memory.update(feedback)
finalize(best_solver)

FrameworkStore

保存问题建模范式、算法模板、启发式策略和可复用组件,是 Agent 的长期方法论知识库。

MemoryStore

记录每轮实验得分、失败原因和历史最优策略,并通过 UCB bandit 平衡探索与利用。

ArtifactStore

管理候选 solver、执行日志、评分报告和最终产物,保证求解过程可追踪、可复现、可比较。

Research Positioning

把 LLM 的创造性,接入优化系统的严谨性

该系统不是简单的大模型应用,而是 LLM Agent、AutoSolver、程序合成、神经符号推理、在线学习和自动化实验平台的融合。它的价值在于让大模型不只“会写”,还要“能跑、能验、能比较、能进化”。

Dimension 传统固定求解器 AutoSolver Agent
算法来源 由人工预先设计,策略固定,对不同实例的适应性有限。 根据实例特征自动生成、组合、改写并筛选候选 solver。
优化过程 依赖人工调参、人工测试和手动比较实验。 通过沙箱执行、评分反馈和多轮迭代形成自动化实验闭环。
可靠性机制 通常依赖人工测试,缺少统一的执行隔离与约束验证。 候选代码必须经过隔离运行、约束检查、异常捕获和量化评分。
长期能力 经验难以结构化迁移,每个问题往往重新开始。 通过 FrameworkStore、MemoryStore 和 ArtifactStore 积累可迁移经验。

本项目的核心不是“用大模型写一个 solver”,而是构建一个能够自动理解问题、生成 solver、验证 solver、比较 solver,并在多轮实验中持续进化的智能求解体。

它将大语言模型的创造性、传统优化系统的严谨性和自动化实验平台的可复现性统一到一个闭环架构中。