CoLLiE.utils¶
Dist Utils¶
CoLLiE 的环境变量,可以从中获取各种并行的 world_size 和 rank。 |
设置分布式环境。 |
|
启动 DeepSpeed 引擎。 |
|
设置随机数种子。 |
|
从 |
|
用于加载 ZeRO stage 3 的模型参数。 |
|
判断是否启用了 ZeRO stage 3。 |
Utils¶
打印出垃圾回收区的所有张量。 |
|
递归地对 |
|
使用字典作为参数输入的辅助函数 |
|
拼接 |
包装了 |
Data Provider¶
BaseProvider 为异步数据提供器的基类,提供了一些基本的接口 |
|
基于 Gradio 的异步数据提供器,会在本地启动一个 Gradio 服务,将用户输入的文本作为模型的输入 |
|
基于 Dash 的异步数据提供器,会在本地启动一个 Dash 服务,将用户输入的文本作为模型的输入 |
Monitor¶
BaseMonitor是一个基础的监控器类,用于记录模型训练过程中的统计信息 |
|
用来记录每个step的时间 |
|
用来记录每秒每张 GPU 可训练的 token 数 (token / s / GPU) |
|
用来记录每个step的内存占用 |
|
用来记录每个step的loss |
|
用来记录每个step的eval结果,仅支持 int 和 float 类型的结果 |
|
用来记录每个step的learning rate |
Padder¶
CoLLie 中的通用 |