- >6-3 手撸旋转位置编码ROPE(1)
- >6-4 手撸旋转位置编码ROPE(2)
- >6-5 手撸旋转位置编码ROPE(3)
- >6-6 旋转位置编码的核心参数及其影响
- >6-7 旋转位置编码的变种
- >7-1 大语言模型经典训练框架介绍
- >7-2 大模型预训练(目标与任务)
- >7-3 大模型预训练(MTPL多Token预测)
- >7-4 大模型预训练(预训练数据和处理)
- >7-5 大模型预训练(预训练过程)
- >7-6 大模型的评估体系
- >7-7 大模型代码能力的评估
- >7-8 大模型数学能力的评估
- >8-1 大模型预训练的数据搜集过程(数据集1)
- >8-2 大模型预训练的数据搜集过程(数据集2)
- >8-3 大模型预训练的数据搜集过程(预训练数据构造流程)
- >8-4 大模型预训练的数据处理过程(数据处理流程)
- >8-5 大模型预训练的数据处理过程(数据过滤+去重+审核)
- >8-6 大语言模型预训练的多领域数据配比与学习顺序
- >8-7 大模型安全问题


