人工智能世界入门:初学者指南
探索人工智能世界:初学者指南 引言 欢迎来到迷人的人工智能 (AI) 世界。如果你曾好奇智能助手、图像生成器或自动化日常任务的工具是如何运作的,那么本指南就是为你准备的。 它的目标是通俗地解释关键概念——从大型语言模型 (LLM) 等基础知识,到视频生成等高级应用。 人工智能是人类创造的最强大的工具之一。 了解其基础知识是当今一项关键技能,它为无数的可能性打开了大门。 本文将帮助你建立坚实的基础,并激发你进一步学习和实验的兴趣。让我们开始这段旅程吧。 1.
基础知识:什么是生成式人工智能? 1.1.
生成式AI(Gen AI)的定义 生成式人工智能(Gen AI)是一种专注于 创建新的、原创内容 的AI类型。 与仅分析或分类数据的传统AI不同,Gen AI能够生成: 文本(文章、电子邮件、代码) 图片和图形 音频和音乐 视频 1.2.
系统核心:大型语言模型(LLM) 大多数Gen AI系统的核心是 大型语言模型(LLM) 。 可以将它们描述为先进的计算机程序,这些程序通过机器学习过程在巨大的文本数据集(书籍、文章、网站)上进行训练。 这一阶段被称为 无监督学习 ,使模型能够独立学习语言的模式、依赖关系和结构。 为了理解文本,模型利用了 分词化(tokenization) 过程,该过程涉及将句子分解成称为 标记/词元(tokens) 的小单元(单词、词的一部分或标点符号)。 这可以比作将一个句子分解成单个乐高积木——模型不是一次性看到整个句子,而是分析每个“积木”以及它们之间的关系,从而能够构建语法和逻辑上正确的回答。 LLM拥有许多强大的能力,这些能力具有实际应用价值: 总结: 能够快速摘要长篇、复杂的文档、报告或文章。 解决问题: 有助于生成创意想法、进行头脑风暴并为复杂问题寻找解决方案。 翻译: 能够在保留上下文的情况下,瞬间将文本翻译成数十种语言。 编辑和分类: 它能够实现自动语法校正、文本风格更改以及根据设定的标准对内容进行分类。 1.3.
替代方案:小型语言模型 (SLM) 除了强大的LLM之外,小型语言模型 (SLM) 越来越受欢迎。 这些模型具有较少的参数数量,为需要专业化和更高隐私性的任务提供了一个有趣的替代方案。 下表展示了这两种方法之间的关键区别: 标准 大型语言模型 (LLM) 小型语言模型 (SLM) 基础设施 通常在云端运行,需要强大的资源。 可以在标准的本地硬件上运行。 数据隐私 数据发送给外部提供商,引发隐私担忧。 提供完全的隐私保护——数据绝不会离开本地基础设施。 成本 使用 API 的费用,通常按处理的 token 数量计算。 一次性购买基础设施的成本,没有 token 费用。 个性化 有限;定制困难且昂贵。 可以在自己的特定数据上进行精确微调 (fine-tuning)。 能耗 高。 显著更低。 实际上,这意味着 LLM 在云端提供了通用计算能力,而 SLM 则为企业在专业任务中提供了完全的控制权、隐私和较低的运营成本。 SLM 的一个例子是 Bielik 模型,它非常适用于生成在线商店产品转化描述等专业任务。 要充分利用大型和小型的模型潜力,必须学会有效地与它们“对话”。 这就将我们带入了提示工程的世界。 2.
如何与AI对话?提示工程基础知识 (Prompt Engineering) 与语言模型互动是一个迭代过程——它类似于持续的对话,在这个过程中,我们逐步完善我们的指令,以获得最佳结果。 成功的关键是构建一个好的提示(prompt),也就是给AI的指令。 2.1.
优秀提示的构成要素 一个结构良好的提示应包含三个关键要素: 任务描述: 精确说明模型需要做什么。 上下文: 额外的信息,对于正确理解问题和期望是必不可少的。 示例: 展示预期格式、风格或答案结构的说明。 我们来看一下它在实践中的运作方式,以寻找侄女礼物为例。 差的提示: “给我一些低于100 zł的礼物点子。” 模型不知道关键的上下文信息:孩子的年龄和性别、兴趣爱好,以及场合。因此它给出的建议是笼统的,可能不准确。 好的提示: “给我一些为一位喜欢紫色、是马和独角兽迷的十岁女孩准备的生日礼物点子。我的预算是100 zł。” 得益于精确的上下文,模型将生成更准确、更个性化的建议。 2.2.
基本提示技术 根据任务的复杂程度,我们可以采用不同的提示技术。以下是三种基本方法: 技术 描述 关键益处 零样本提示 (Zero-shot Prompting) 向模型提供纯粹的指令,不包含任何示例。 在简单任务中速度快且简单。 单样本提示 (One-shot Prompting) 提供一个示例来说明预期的答案。 帮助模型更好地理解用户的意图和输出格式。 少样本提示 (Few-shot Prompting) 提供几个多样化的示例,展示不同的答案变体。 显著提高回答的准确性和质量,尤其是在复杂任务中。 2.3.