AI red teamer (人工智能红队)系列20 – 人工智能基础 – 生成式人工智能简介

你是慕鸢呀~ 发布于 1 天前 11 次阅读 1712 字 预计阅读时间: 8 分钟


AI red teamer (人工智能红队)系列20 – 人工智能基础 – 生成式人工智能简介

生成式人工智能(Generative AI)机器学习中一个让人疯狂且发展迅速的领域,其重点是输出类似于人类生成的新内容或数据。与旨在识别模式、分类数据或进行预测的传统人工智能系统不同,生成式人工智能侧重于生成原创内容,从文本和图像到音乐和代码。

已经成为了现实:一位艺术家利用自己的技能和想象力创作出一幅画。同样,生成式人工智能模型利用其学习到的知识来生成新的和创造性的输出,会表现出惊人的独创性和逼真性。

生成式人工智能如何工作

生成式人工智能的核心是复杂的算法,通常基于神经网络,可学习给定数据集的基本模式和结构。这种学习过程使模型能够捕捉数据的统计属性,从而生成具有类似特征的新样本。

这一过程通常包括:

  1. 训练: 模型在一个大型示例数据集(如文本、图像或音乐)上进行训练。在训练过程中,模型会学习数据中不同元素之间的统计关系,捕捉定义数据特征的模式和结构。
  2. 生成: 训练完成后,模型可通过从所学分布中采样生成新内容。这包括从随机种子或输入开始,然后根据学习到的模式不断改进,直到产生令人满意的输出。
  3. 评估: 生成的内容通常根据其质量、原创性以及与人工生成输出的相似性进行评估。这种评估可以是主观的,依赖于人类的判断,也可以是客观的,使用衡量生成内容特定属性的指标。

生成式人工智能模型的类型

目前已开发出各种类型的 生成式人工智能模型,每种模型都有其优缺点:

  • 生成式对抗网络(GANs): GANs 由两个神经网络组成,一个是生成器,另一个是鉴别器,它们相互竞争。生成器创建新样本,而鉴别器则区分真实样本和生成样本。这种对抗过程会推动两个对抗网络不断改进,从而生成越来越逼真的内容。
  • 变分自编码器(Variational Autoencoder,VAEs):变分自编码器学习压缩的数据表示,并利用该表示生成新样本。它们在捕获数据的潜在结构方面特别有效,从而实现更加可控和多样化的生成。
  • 自回归模型: 这些模型根据前面的元素,一次生成一个元素,按顺序生成内容。它们通常用于文本生成,根据前面的单词生成每个单词。
  • 扩散模型: 这个模型会逐渐向数据中添加噪音,直到数据变成纯噪音。然后,它们学会逆转这一过程,从噪声开始生成新样本,并对其进行改进。

重要的生成式人工智能概念

生成式人工智能涉及一系列独特的概念,这些概念对于理解这些模型如何学习、生成内容和进行评估非常重要。

其中一些最重要的概念:

潜空间(Latent Space)也被称为潜特征空间嵌入空间

latent space 是一种隐藏的数据表示,它以压缩的形式捕捉数据的基本特征和关系。把它想象成一张地图,在这张地图上,相似的数据点被聚拢在一起,而不相似的数据点则相距较远。像 变分自编码器 (VAEs) 这样的模型会学习 latent space,通过从这种压缩表示中采样来生成新内容。

采样/取样 (Sampling)

采样是从已学分布中抽取生成新内容的过程。它包括为 latent Space中的变量选择值,然后将这些值映射到输出空间(例如,从 latent Space中的一个点生成图像)。生成内容的质量和多样性取决于模型学习底层分布的效率以及采样过程捕捉分布变化的程度。

模式坍缩(Mode Collapse)

模式坍缩发生在生成器只学会生成有限种类的输出时,尽管训练数据可能包含更广泛的可能性。这可能导致生成的内容缺乏多样性,生成器被困在一种 "模式 "中,无法探索数据分布的其他模式。

过拟合 (Overfitting)

过拟合机器学习中的一个常见困扰,也适用于生成式人工智能。当模型对训练数据的学习效果太好,甚至能捕捉到噪音和不相关的细节时,就会出现这种情况。这可能会导致泛化效果不佳,即模型难以生成与训练示例明显不同的新内容。在生成式人工智能中,过拟合会限制模型的创造力和原创性。

评估指标 (Evaluation Metrics)

生成式人工智能中,评估生成内容的质量和多样性至关重要。为此设计了各种指标,每种指标都侧重于生成输出的不同方面。一些常见的评估指标包括:

  • 初始分数 (IS): 该分数通过评估图像的清晰度和预测类别的多样性来衡量生成图像的质量和多样性。
  • 弗雷歇初始距离 Fréchet Inception Distance (FID):将生成图像的分布与真实图像的分布进行比较,FID 分数越低,表示相似度越高,质量越好。
  • BLEU(Bilingual Evaluation Understudy)评分:是通过与人工翻译的参考文本进行比较来评估机器翻译文本质量的指标 。 它量化了机器翻译输出与参考译文之间的相似度,分数越高表示质量越好。 从本质上讲,它衡量的是机器翻译的文本与参考译文在 n-grams (n 个单词的序列)方面的匹配程度。

这些指标对生成内容的质量和多样性进行了量化评价,有助于研究人员、开发人员评估 Generative AI 模型 的性能,并进一步的改进。

我本桀骜少年臣,不信鬼神不信人。
最后更新于 2025-06-15