首页 > 资讯
带您了解什么是生成式人工智能!
蓝桥未来2024-09-20

  随着ChatGPT、文心一言等AI产品的火爆,生成式AI已经成为了大家茶余饭后热议的话题。在人工智能领域,生成式人工智能作为一种重要的技术分支,正逐渐展现出其巨大的潜力和广泛的应用前景。

  

什么是生成式AI

  如果将人工智能按照用途进行简单分类的话,AI其实要被划分为两类:决策式AI和生成式AI。

  决策式AI:专注于分析情况并做出决策。它通过评估多种选项和可能的结果,帮助用户或系统选择最佳的行动方案。

  例如,在自动驾驶车辆中,就是通过决策式AI系统决定何时加速、减速或变换车道。

  生成式AI:专注于创造全新内容。它可以根据学习到的数据自动生成文本、图像、音乐等内容。

  例如,你可以将几篇论文发给生成式AI,他可以生成一篇文献综述,囊括了这几篇论文的关键思想、重要结论。

  看到这里,大家大概知道什么是生成式AI了吧!

生成式AI工作原理

  生成式AI是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容,全面超越了传统软件的数据处理和分析能力。制作一个生成式AI,就像把一个泥人变成天才,一共需要四步:捏泥人→装大脑→喂知识→有产出。

  Step1:捏泥人——硬件架构的搭建

  要打造一个生成式AI的泥人,首先要考虑的就是底层硬件。底层硬件构成了生成式AI的算力和存力。

  算力——泥人的骨架。生成式AI需要进行大量的计算,尤其是在处理如图像和视频时。

  存力——泥人的血液。生成式AI需要处理和存储大量的数据。

  泥人捏好了,但现在只是一个提线木偶,没有任何能力,所以要给他装上大脑。

  Step2:装大脑 —— 软件架构构建

  软件架构是泥人的大脑,它决定了这个泥人将以什么样的方式对数据进行思考推理。

  从仿生学的角度,人类希望AI能够模仿人脑的运行机制,对知识进行思考推理——这就是通常所说的深度学习。

  随着算力的发展,生成式AI的网络架构发展越来越成熟,也开始各有侧重:

  Transformer架构:是目前文本生成领域的主流架构,GPT、llama2等大语言模型都是基于Transformer实现了卓越的性能。

  GANs架构:在图像生成、视频生成等领域有广泛应用,能够快速生成高质量的图像和视频内容。

  Diffusion架构:在图像生成、音频生成等领域取得了很好的效果,能够生成高质量、多样化的内容。

  网络架构搭建好了,泥人的脑子是有了,但是脑子里还是空白的,所以我们要通过数据训练给这个人造大脑喂知识。

  Step3:喂知识 —— 数据训练

  目前有两种训练方式:预训练和 SFT(有监督微调)

  预训练:是指将一个大型、通用的数据集作为知识喂给 AI 进行初步学习。

  经过预训练的模型叫作“基础模型”,它对每个领域都有所了解,但是无法成为某个领域的专家。

  SFT:SFT 是指在预训练之后,将一个特定任务的数据集喂给 AI,进一步训练模型。

  例如,在已经预训练的语言模型基础上,用专门的医学文本来微调模型,使其更擅长处理医学相关的问答或文本生成任务。

  Step4:有产出 —— 内容生成

  AI经过大量数据的投喂之后,会对这些数据进行“理解”,之后就可以生成内容了。

  比如常见的问题:我在餐厅吃×。× 填个字,你会填什么?根据你既往的经验,大概率你会填“饭”。其实,× 还可以是“饼”、“面”、“蛋”等等。

  像人一样,生成式 AI 也会根据它第三步中学到的经验,给这些字加上概率。然后选择概率高的词作为生成的内容。接着,AI 将重复这一过程,选择下一个可能性最高的词语,从而生成更多内容。

阅读:
分享
用微信扫描二维码分享
请点击右上角分享给微信朋友或朋友圈