原文:What We Learned from a Year of Building with LLMs (Part I)
译文:https://baoyu.io/translations/llm/what-we-learned-from-a-year-of-building-with-llms-part-1
校对:Sydney
现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。
我们已经总结了一些关键但常常被忽视的经验和方法,这些方法通过机器学习得出,对于开发基于 LLMs 的产品至关重要。了解这些概念可以让你在无需机器学习专业知识的情况下,相对于大多数同行获得竞争优势!在过去的一年里,我们六个人一直在基于 LLMs 构建现实世界的应用。我们意识到有必要将这些经验教训汇总在一起,分享给整个社区。
我们来自不同的背景,并在不同的角色中工作,但我们都亲身经历了使用这项新技术带来的挑战。我们中的两个人是独立顾问,帮助许多客户将 LLM 项目从初始概念变成成功的产品,见证了决定成败的模式。我们中的一人是研究人员,研究机器学习和 AI 团队的工作方式以及如何改进他们的工作流程。我们中的两个人是应用 AI 团队的领导者:一个在科技巨头公司,另一个在初创公司。最后,我们中的一人教授了数千人学习深度学习,现在致力于让 AI 工具和基础设施更易于使用。尽管我们的经历不同,但我们对所学经验中的一致性感到震惊,并且惊讶这些见解没有得到更广泛的讨论。
我们的目标是将这本指南打造成围绕 LLMs 构建成功产品的实用手册,借鉴我们的亲身经验,并引用业界的例子。过去一年中,我们亲自动手实践,获得了宝贵的教训,很多时候是通过艰难的方式学到的。虽然我们不敢自称代表整个行业,但在这里我们分享了一些建议和经验,供任何构建 LLMs 产品的人参考。
这项工作分为三个部分:战术、运作和战略。这是其中的第一部分,深入探讨了使用大语言模型 (LLM) 的战术细节。我们分享了关于提示设计、设置检索增强生成、应用流程工程以及评估和监控的最佳实践和常见陷阱。无论你是使用 LLM 的从业者还是在周末进行项目开发的开发者,这一部分都是为你而写的。请在接下来的几周内留意运作和战略部分。
准备好深入了解了吗?让我们开始吧。
在本节中,我们分享了大语言模型核心组件的最佳实践,包括提高质量和可靠性的提示设计、评估输出的策略、改进基础的检索增强生成理念等。我们还探讨了如何设计人类参与的工作流程。尽管技术仍在快速发展,我们希望这些经验教训——我们集体进行的无数实验的成果——能够经受住时间的考验,并帮助你构建和发布稳健的 LLM 应用。
我们建议在开发新应用时从提示设计开始。它的作用既容易被低估也容易被高估。被低估是因为正确的提示技术使用得当可以带来显著效果。被高估是因为即使是基于提示的应用也需要大量的工程工作才能运行良好。
有几种提示技巧在各种模型和任务中都能显著提高性能:n-shot 提示与上下文学习、链式思维提示,以及提供相关资源。
通过 n-shot 提示进行上下文学习的核心思路是给大语言模型 (LLM) 提供一些示例,这些示例展示了任务要求,并引导模型输出符合预期。一些提示: