- >6-7 旋转位置编码的变种
- >7-1 大语言模型经典训练框架介绍
- >7-2 大模型预训练(目标与任务)
- >7-3 大模型预训练(MTPL多Token预测)
- >7-4 大模型预训练(预训练数据和处理)
- >7-5 大模型预训练(预训练过程)
- >7-6 大模型的评估体系
- >7-7 大模型代码能力的评估
- >7-8 大模型数学能力的评估
- >8-1 大模型预训练的数据搜集过程(数据集1)
- >8-2 大模型预训练的数据搜集过程(数据集2)
- >8-3 大模型预训练的数据搜集过程(预训练数据构造流程)
- >8-4 大模型预训练的数据处理过程(数据处理流程)
- >8-5 大模型预训练的数据处理过程(数据过滤+去重+审核)
- >8-6 大语言模型预训练的多领域数据配比与学习顺序
- >8-7 大模型安全问题
- >8-8 大模型安全挑战:新型攻击与防御
- >8-9 LLM预训练领域数据配比DoReMI深度解读
- >9-1 大模型的分布式训练集群介绍
- >9-2 大模型的分布式训练集群(参数服务器架构和去中心化架构)


