我看到当前最新版本的verl框架支持设置 trainer.device=npu,但是thinkless中的 verl 似乎不行?
我看到当前最新版本的verl框架支持设置 trainer.device=npu,但是thinkless中的 verl 似乎不行?