Transformer通关秘籍

董董灿

订阅数：178

文章数：65

专栏类型：买断制

发布于 April 18, 2024

Transformer通关秘籍

作者董董灿，致力于帮助小伙伴快速入门AI算法，公众号《董董灿是个攻城狮》主理人。基于Transformer的大模型已经成为AI的顶流，该架构可以处理文本、语音和图像，基于此技术的AI应用也层出不穷。本专栏将围绕Transformer系统从零讲解背景与算法技术，帮你打通理解该架构的最后一公里，祝你通过 Transformer 架构。本专栏已完成更新，内容非常多，也有不少好玩的大模型应用的体验方法。祝你学有所成，收获满满。扫描下方二维码后查看置顶文章，有更详细的介绍哦。

查看专栏详情

邀请你加入 AI 学习圈，学 AI 不孤单~~

大家好啊，我是董董灿。

我创建了一个《小而精的 AI 学习圈》知识星球，邀请你的加入。

为什么我要创建这样一个知识星球？

第一，提供一个学习 AI、大家共同......

Qwen2 的模型结构和细节

Qwen2（千问）是由阿里云开发的人工智能大模型，可用于智能对话，是一个典型的 Decoder-Only 结构。

该模型在很多任务上有着非常不错的表现，很多公司都会基于......

GPT 和 BERT 的模型结构

上一节介绍了什么是 Decoder-Only 结构，并且提到，目前绝大多数的大模型采用的都是 Decoder-Only 结构。虽然如此，仍然一些模型会用到 Encoder 部分作为主要架构，典型......

什么是 Decoder-Only 结构

在《Attention is all you need》这篇论文中，作者给出了 Transformer 架构的完整图示。

一般来说，上图中左侧的部分被称为编码器，右侧的部分被称为解码......

后处理：预测得分的温度参数和 Softmax 计算

如果你调用过大模型的 API，或者创作过智能体的话，大概率你调整过一些用来控制模型生成效果的参数。

下图展示的是我在微调某个智能体时后台的参数设置界面，里面有一个多样性......

后处理：预测得分的 Top_p 采样

在上一节介绍了 Top_k 采样之后，接下来再看另一个非常常用的采样方法，叫做 Top_p 采样。

Top_p 采样中的 “p” 是 “probability”（概率......

后处理：预测得分的 Top_k 采样

在对大模型的输出 Logits 的后处理过程中，除了上一节提到的对分数进行重复惩罚之外，采样也是一个非常重要的步骤。

合理的采样算法和采样阈值的设置，可以使模型生成的内......

后处理：为什么要对预测得分进行惩罚？

从本节开始，会对大模型的后处理部分用到的一些经典的算法原理进行介绍。

所谓后处理，是指在大模型生成文本后，对生成的结果进行一系列的调整和优化，以确保输出的文本具有更好的......

如何实现 KVCache？

在上一节了解了 KVCache 提出的背景之后，本节来看一下如何实现 KVCache。

Q/K/V 都可以用矩阵来表示。在一个二维矩阵中，表示 K 和 V 的方式是一样......

大模型的推理过程：KVCache 的引入(Prefill 和 Decode)

在前面介绍完位置编码后，我们来从模型的视角看一个大模型中非常重要的技术，那就是 KVCache 缓存技术。

乍一看这个技术好像很深奥，又是 KV 又是缓存的，但是，如果......

查看专栏详情

小七姐的 AI 提示词

AI数字人从制作到变现

AI赚钱的100种思路（含指令）

AI 绘画一本通（365个AI绘画案例）

100本百万财富书单

AI+公众号爆文写作

【全面讲解】100个超强机器学习模型

Midjourney进阶创意库｜2023

ChatGPT应用宝典：新手实战指南

AI 提示词实战指南

50个零代码AI应用制作案例

ChatGPT 辅助自媒体

5分钟搞定ChatGPT

AI拆书入门到变现

大模型应用开发 | API 实操

AI写真入门到变现

AI提示词与职场提效

AI 知乎入门到变现

小红书绘画万粉计划

GPTs 新鲜度指南

AIGC周刊

你的第一本 AIGC 创作指南

Sora，从入门到精通

玩转ChatGPT秘籍指南

ChatGPT精进指南

Ai工具玩法和变现案例【精华】

剑心のAigc手记2023（已完结）

AI绘画人像修炼手册

ChatGPT实用场景365案例一本通

ComfyUI工作流一本通

AI变现案例库

人人都能用的AI工具库

AI 绘画变现案例库

小白玩转ChatGPT

AI绘图与视频实操手册

豆包AI零基础教程

AI爆款公众号案例及提示词模板

ChatGPT+N

50个ChatGPT低门槛商业变现指南

SD 全面实战

AI绘画项目实战专栏

ChatGPT提问指南

AIGC工具百宝箱

AIGC风向标

Midjourney Logo绘练营

AI-ChatGPT-MORE（合集）

科林-地表最强AIGC实操应用

AIGC探索之旅

AI实践案例库

AI通识手册大全

ChatGpt实战案例

ChatGPT俱乐部

普通人如何利用ChatGPT风口

ChatGPT写作教程

AIGC从入门到精通

Sora头条

5分钟搞定 AI绘画

Prompt 实践

人人都懂ChatGPT

人工智能模型武器库

AI写爆文提示词仓库和AI绘画咒语堂

人工智能 AI 进阶攻略

打工人的AI武器库

GPT + AI 应用案例库

AI视频一本通（实操指南+技巧解读）

ChatGPT入门到精通

超低门槛的小红书AIGC做号指南

100个ChatGPT必备插件

ChatGPT增强指南

SD+Midjourney绘画百科

卖家秘籍：ChatGPT!

AIPwn

AI绘画(MJ+SD)+GPT教程与变现

AI黑科技小纸条

ChatGPT赚点小钱

Midjourney魔法师养成记

AI联盟

AI写作专栏

小报童专栏: Transformer通关秘籍