人工智能世界入门：初学者指南

探索人工智能世界：初学者指南引言欢迎来到迷人的人工智能 (AI) 世界。如果你曾好奇智能助手、图像生成器或自动化日常任务的工具是如何运作的，那么本指南就是为你准备的。它的目标是通俗地解释关键概念——从大型语言模型 (LLM) 等基础知识，到视频生成等高级应用。人工智能是人类创造的最强大的工具之一。了解其基础知识是当今一项关键技能，它为无数的可能性打开了大门。本文将帮助你建立坚实的基础，并激发你进一步学习和实验的兴趣。让我们开始这段旅程吧。 1.

基础知识：什么是生成式人工智能？ 1.1.

生成式AI（Gen AI）的定义生成式人工智能（Gen AI）是一种专注于创建新的、原创内容的AI类型。与仅分析或分类数据的传统AI不同，Gen AI能够生成：文本（文章、电子邮件、代码）图片和图形音频和音乐视频 1.2.

系统核心：大型语言模型（LLM）大多数Gen AI系统的核心是大型语言模型（LLM）。可以将它们描述为先进的计算机程序，这些程序通过机器学习过程在巨大的文本数据集（书籍、文章、网站）上进行训练。这一阶段被称为无监督学习，使模型能够独立学习语言的模式、依赖关系和结构。为了理解文本，模型利用了分词化（tokenization）过程，该过程涉及将句子分解成称为标记/词元（tokens）的小单元（单词、词的一部分或标点符号）。这可以比作将一个句子分解成单个乐高积木——模型不是一次性看到整个句子，而是分析每个“积木”以及它们之间的关系，从而能够构建语法和逻辑上正确的回答。 LLM拥有许多强大的能力，这些能力具有实际应用价值：总结：能够快速摘要长篇、复杂的文档、报告或文章。解决问题：有助于生成创意想法、进行头脑风暴并为复杂问题寻找解决方案。翻译：能够在保留上下文的情况下，瞬间将文本翻译成数十种语言。编辑和分类：它能够实现自动语法校正、文本风格更改以及根据设定的标准对内容进行分类。 1.3.

替代方案：小型语言模型 (SLM) 除了强大的LLM之外，小型语言模型 (SLM) 越来越受欢迎。这些模型具有较少的参数数量，为需要专业化和更高隐私性的任务提供了一个有趣的替代方案。下表展示了这两种方法之间的关键区别：标准大型语言模型 (LLM) 小型语言模型 (SLM) 基础设施通常在云端运行，需要强大的资源。可以在标准的本地硬件上运行。数据隐私数据发送给外部提供商，引发隐私担忧。提供完全的隐私保护——数据绝不会离开本地基础设施。成本使用 API 的费用，通常按处理的 token 数量计算。一次性购买基础设施的成本，没有 token 费用。个性化有限；定制困难且昂贵。可以在自己的特定数据上进行精确微调 (fine-tuning)。能耗高。显著更低。实际上，这意味着 LLM 在云端提供了通用计算能力，而 SLM 则为企业在专业任务中提供了完全的控制权、隐私和较低的运营成本。 SLM 的一个例子是 Bielik 模型，它非常适用于生成在线商店产品转化描述等专业任务。要充分利用大型和小型的模型潜力，必须学会有效地与它们“对话”。这就将我们带入了提示工程的世界。 2.

如何与AI对话？提示工程基础知识 (Prompt Engineering) 与语言模型互动是一个迭代过程——它类似于持续的对话，在这个过程中，我们逐步完善我们的指令，以获得最佳结果。成功的关键是构建一个好的提示（prompt），也就是给AI的指令。 2.1.

优秀提示的构成要素一个结构良好的提示应包含三个关键要素：任务描述：精确说明模型需要做什么。上下文：额外的信息，对于正确理解问题和期望是必不可少的。示例：展示预期格式、风格或答案结构的说明。我们来看一下它在实践中的运作方式，以寻找侄女礼物为例。差的提示： “给我一些低于100 zł的礼物点子。” 模型不知道关键的上下文信息：孩子的年龄和性别、兴趣爱好，以及场合。因此它给出的建议是笼统的，可能不准确。好的提示： “给我一些为一位喜欢紫色、是马和独角兽迷的十岁女孩准备的生日礼物点子。我的预算是100 zł。” 得益于精确的上下文，模型将生成更准确、更个性化的建议。 2.2.

基本提示技术根据任务的复杂程度，我们可以采用不同的提示技术。以下是三种基本方法：技术描述关键益处零样本提示 (Zero-shot Prompting) 向模型提供纯粹的指令，不包含任何示例。在简单任务中速度快且简单。单样本提示 (One-shot Prompting) 提供一个示例来说明预期的答案。帮助模型更好地理解用户的意图和输出格式。少样本提示 (Few-shot Prompting) 提供几个多样化的示例，展示不同的答案变体。显著提高回答的准确性和质量，尤其是在复杂任务中。 2.3.