Zihan Ye
|
25f89717f1
|
调整为动态指标,并将奖励归一化
|
2026-01-13 17:32:31 +08:00 |
Zihan Ye
|
9fa47127ab
|
修复单独测试时无法正常保存的bug,修改ctm模型运算单位
|
2026-01-13 15:34:47 +08:00 |
Zihan Ye
|
e8f32f9942
|
训练后自动进行测试,自动删去不必要的文件
|
2026-01-06 13:57:39 +08:00 |
Zihan Ye
|
8a2194039c
|
将每次运行参数及结果独立保存
|
2026-01-05 21:43:04 +08:00 |
Zihan Ye
|
2cecf7804f
|
移除uv.lock
|
2026-01-05 21:25:52 +08:00 |
Zihan Ye
|
c735b011c8
|
添加并行运行环境、训练频率降低以提升交互次数
|
2026-01-05 21:25:40 +08:00 |
Zihan Ye
|
39b0134609
|
添加随机种子,自动保存最优模型
|
2026-01-05 17:04:27 +08:00 |
Zihan Ye
|
fd0dc80a91
|
First runnable
|
2026-01-05 16:15:53 +08:00 |