- >3-5 词向量的价值
- >3-6 小试牛刀 词向量实战
- >3-7 预训练模型(BERT、GPT)
- >3-8 小试牛刀 预训练模型实战
- >4-1 大模型的文本切分与Token
- >4-2 大模型的Tokenizer
- >4-3 深入理解Tokenizer的作用及影响
- >4-4 【小试牛刀】Tokenizer实战
- >4-5 深入理解BPE算法训练和编码过程
- >4-6 【实战】手撸BPE算法训练代码
- >4-7 初步了解大模型中的位置编码
- >4-8 大模型的输出流程介绍
- >4-9 大模型解码原理详细介绍
- >4-10 【实战】寻找大模型最佳推理参数实战(1)
- >4-11 【实战】寻找大模型最佳推理参数实战(2)
- >5-1 Transformer基础知识准备
- >5-2 【实战】手撸LayerNorm 代码
- >5-3 【实战】手撸softmax代码
- >5-4 深入理解注意力机制
- >5-5 掩码自注意力机制


