文章来源地址https://uudwc.com/A/vmW6O
文章目录
- GLM-130B:开放的中英双语预训练模型
-
- 摘要:何为 GLM-130B?
- 快速上手
-
- 环境配置
- 自回归文本生成 / 中间文本填空
-
- Example 1
- Example 2 (Chinese)
- Example 1
- Example 2 (Chinese)
- 评估
- 使用 FasterTransformer 加速推理速度(高达 2.5 倍)
- 何为GLM-130B?
-
- 架构
-
- 1. 训练目标:自回归文本填空
- 2. 位置编码:旋转位置编码
文章来源:https://uudwc.com/A/vmW6O