附录 · Appendix

AI 原生应用设计

#tutorial#appendix#8-artificial-intelligence
6 min read

💡 前言

为什么有些 AI 产品让人惊艳,而有些只是"套壳 ChatGPT"? 差别不在于用了多强的模型,而在于产品是否从底层就围绕 AI 的特性来设计。AI 原生应用不是在传统应用上"加个聊天框",而是重新思考用户交互、系统架构和产品逻辑的全新范式。

这篇文章会带你学什么?

学完这章后,你将获得:

  • 范式认知:理解 AI 原生应用与传统应用的本质区别
  • 设计原则:掌握 AI 原生产品设计的核心原则
  • Prompt 工程:了解如何设计高质量的 Prompt 来驱动 AI 能力
  • 交互模式:认识 AI 时代的新型用户交互范式
  • 架构思维:理解 AI 应用的请求处理流程和系统架构
章节内容核心概念
第 1 章架构对比传统应用 vs AI 原生应用
第 2 章设计原则AI-First 思维、不确定性设计
第 3 章Prompt 工程系统提示词、模板设计
第 4 章交互模式流式输出、多模态、Agent
第 5 章请求流程AI 应用的完整生命周期

0. 全景图:从"加个 AI"到"AI 原生"

过去几年,很多产品的 AI 化路径是这样的:有一个现成的应用,然后在某个角落加一个"AI 助手"按钮。这种做法就像在马车上装一个引擎——能跑,但远不如从头设计一辆汽车。

AI 原生应用是一种全新的产品思维:从第一行代码开始,就把 AI 作为核心能力来设计,而不是事后附加的功能。

💡 传统应用 vs AI 原生应用

  • 传统应用:用户操作 → 确定性逻辑 → 确定性结果。每次点击"提交订单",流程完全一样。
  • AI 原生应用:用户意图 → AI 理解 → 概率性结果。同样的问题,每次回答可能略有不同。
  • 核心转变:从"编写规则"到"描述意图",从"确定性"到"概率性",从"操作界面"到"对话界面"。

1. 架构对比:两种完全不同的世界

传统应用的架构是"请求-响应"模型:用户点击按钮,后端执行确定性逻辑,返回确定性结果。整个过程可预测、可测试、可复现。

AI 原生应用则引入了一个全新的角色——大语言模型。它像一个"智能中间层",接收自然语言输入,输出自然语言结果。这带来了架构上的根本性变化。

维度传统应用AI 原生应用
输入方式表单、按钮、下拉框自然语言、图片、语音
处理逻辑if-else、规则引擎LLM 推理、Prompt 驱动
输出特性确定性、可复现概率性、每次可能不同
延迟特征毫秒级秒级(需要流式输出)
错误处理明确的错误码幻觉、拒绝回答、答非所问
成本模型固定计算资源按 token 计费,成本波动大

💡 架构演进的三个阶段

  1. AI 增强型:在现有应用中嵌入 AI 功能(如自动补全、智能推荐)
  2. AI 协作型:AI 作为核心交互方式,但仍有传统 UI 兜底(如 Notion AI、GitHub Copilot)
  3. AI 原生型:整个产品围绕 AI 构建,去掉 AI 产品就不成立(如 ChatGPT、Cursor、Midjourney)

2. 设计原则:AI 原生产品的"宪法"

设计 AI 原生应用不能照搬传统软件的设计思路。AI 的概率性、延迟性和不可预测性,要求我们建立一套全新的设计原则。

💡 五大核心设计原则

  1. 拥抱不确定性:AI 的输出不是 100% 可靠的,产品设计必须考虑"AI 可能出错"的情况。提供编辑、重试、反馈机制,让用户始终拥有控制权。
  2. 渐进式信任:不要一开始就让 AI 做高风险决策。先从低风险场景建立用户信任,再逐步扩展 AI 的自主权。
  3. 透明可解释:让用户知道 AI 在做什么、为什么这么做。展示推理过程、引用来源、标注置信度。
  4. 人机协作:AI 不是替代人,而是增强人。最好的设计是让 AI 做初稿,人做终审。
  5. 优雅降级:当 AI 服务不可用或结果不理想时,产品仍然可用。永远有 Plan B。

3. Prompt 工程:AI 应用的"编程语言"

在传统应用中,你用代码告诉计算机做什么。在 AI 原生应用中,你用 Prompt 告诉模型做什么。Prompt 就是 AI 时代的编程语言——写得好,AI 表现惊艳;写得差,AI 胡说八道。

💡 Prompt 设计的四层结构

  1. 系统提示词(System Prompt):定义 AI 的角色、能力边界和行为规范。这是"宪法"级别的指令,用户看不到但始终生效。
  2. 上下文注入(Context):通过 RAG 检索到的相关文档、用户历史记录等,为 AI 提供回答所需的背景信息。
  3. 用户输入(User Message):用户的实际问题或指令。
  4. 输出格式约束(Format):指定 AI 的输出格式(JSON、Markdown、特定模板),确保结果可被程序解析。
Prompt 技巧说明效果
角色设定"你是一个资深前端工程师"提升专业领域回答质量
Few-shot 示例给出 2-3 个输入输出示例让模型理解期望的格式和风格
思维链(CoT)"请一步步思考"提升复杂推理的准确性
输出约束"用 JSON 格式回答"确保输出可被程序解析
负面指令"不要编造不确定的信息"减少幻觉和错误信息

4. 交互模式:AI 时代的用户体验

AI 原生应用催生了一批全新的交互模式。传统应用的交互是"点击-等待-查看",而 AI 应用的交互更像是"对话-观察-调整"。

💡 四种核心交互模式

  1. 流式输出(Streaming):AI 生成内容时逐字显示,而不是等全部生成完再展示。这大幅降低了用户的感知等待时间,也让用户可以在生成过程中判断方向是否正确。
  2. 多轮对话(Multi-turn):通过上下文记忆实现连续对话,用户可以逐步细化需求。关键挑战是上下文窗口管理和对话历史压缩。
  3. 多模态交互(Multimodal):支持文本、图片、语音、文件等多种输入方式,AI 也能输出图片、代码、表格等多种格式。
  4. Agent 模式(Agentic):AI 不只是回答问题,而是自主规划、执行多步骤任务。用户给出目标,AI 自行拆解步骤并逐一完成。

5. 请求流程:一次 AI 调用的完整生命周期

当用户在 AI 应用中发送一条消息,背后发生了什么?理解这个完整流程,是构建可靠 AI 应用的基础。

💡 请求处理的六个阶段

  1. 输入预处理:校验用户输入、内容安全审核、敏感信息脱敏
  2. 上下文组装:拼接系统提示词、检索相关文档(RAG)、加载对话历史
  3. 模型调用:将组装好的 Prompt 发送给 LLM API,开启流式响应
  4. 输出后处理:格式化输出、内容安全过滤、结构化数据提取
  5. 结果缓存:对常见问题缓存结果,降低成本和延迟
  6. 监控记录:记录 token 用量、响应时间、用户反馈,用于持续优化
阶段关键考量常见问题
输入预处理注入攻击防护、长度限制Prompt 注入、越狱攻击
上下文组装token 预算分配、信息优先级上下文溢出、关键信息被截断
模型调用超时处理、重试策略、流式传输API 限流、网络超时
输出后处理格式校验、幻觉检测输出格式不符预期
缓存策略语义缓存 vs 精确缓存缓存命中率低
监控告警成本监控、质量评估token 成本失控

总结

AI 原生应用设计不是简单地在传统应用上叠加 AI 功能,而是从架构、交互、工程实践等维度进行全面重构。

回顾本章的关键要点:

  1. 架构转变:从确定性逻辑到概率性推理,AI 原生应用需要全新的架构思维
  2. 设计原则:拥抱不确定性、渐进式信任、透明可解释、人机协作、优雅降级
  3. Prompt 是核心:Prompt 工程是 AI 应用的"编程语言",直接决定产品质量
  4. 交互革新:流式输出、多轮对话、多模态、Agent 模式重新定义了用户体验
  5. 全链路思维:从输入预处理到监控告警,每个环节都需要针对 AI 特性专门设计

延伸阅读


📄 This content is adapted from the Easy-Vibe project by Datawhale, licensed under CC BY-NC-SA 4.0. You are free to share and adapt this material with attribution, for non-commercial purposes, under the same license.

📄 License & Attribution

This content is adapted from the Easy-Vibe project by Datawhale, licensed under CC BY-NC-SA 4.0.

You are free to share and adapt this material with attribution, for non-commercial purposes, under the same license.

🔗 View original on Easy-Vibe →