Asia/Shanghai
博客May 29, 2026

Demo 之后的 AI 工程

当 AI 原型需要变成可用系统时,工程工作会发生什么变化
Li Zimu
Demo 之后的 AI 工程
一个 AI Demo 可以很简单:输入提示词,调用模型,展示结果。 可用的 AI 系统不是这样。它需要处理模糊输入、长任务、部分失败、成本限制、延迟、安全边界和用户预期。模型只是系统的一部分。 当原型需要承受真实使用时,工程工作才真正开始。 AI 系统依赖上下文。关键不只是放入多少上下文,而是哪些上下文可靠、相关、并且适合当前任务使用。 好的上下文设计通常需要区分长期用户意图和临时任务状态。它还需要判断:哪些内容应该让模型知道,哪些应该由应用确定性计算,哪些应该完全排除。 工具调用很强大,因为它让模型通过软件行动,而不只是生成文本。但每个工具都需要清晰契约:输入、输出、失败行为、权限和可审计性。 没有这个契约,工具调用会很难调试。一次失败可能来自模型、Schema、权限,也可能只是下游系统的正常失败。 AI 产品在本地 Demo 中看起来通常更轻松,因为没人盯着时间和账单。在生产环境里,延迟和成本都是产品约束。 有些请求应该流式返回,有些应该后台运行,有些应该缓存,有些根本不应该调用模型。 真正的问题不是“AI 能不能做”,而是“系统能不能以合理速度、合理成本、可靠地做”。 当 AI 功能表现异常时,你需要足够的证据理解原因。这意味着记录合适的元数据、追踪工具调用、测量延迟、识别上游错误,并保留足够的调试信息,同时避免泄露敏感数据。 系统应该让失败可读。否则每次事故都会变成猜测。 AI 功能变化很快,但生产系统仍然需要稳定的发布纪律。一个可用的部署路径应该包括健康检查、canary 验证、清晰配置和真正能用的回滚命令。 第一个 Demo 证明可能性。生产版本证明责任感。 这就是我关注的 AI 工程:不只是让系统看起来惊艳,而是让它可用、可观察、可维护。
Share this post: