在之前的文章里,教学了部署和请求的时候去给参数从而关闭thinking:https://www.dong-blog.fun/post/2053
但是还是麻烦,能不能默认就把这个thinking给关闭,从代码层面直接关闭? 可以的!
在Qwen3-30B-A3B中,有个文件是 tokenizer_config.json 。
也就是这个文件:https://modelscope.cn/models/Qwen/Qwen3-30B-A3B/file/view/master/tokenizer_config.json?status=1
其中有个对话模板:
"chat_template": "{%- if tools %}\n {
{- '<|im_start|>system\\n' }}\n {%- if messages[0].role == 'system' %}\n {
{- messages[0].content + '\\n\\n' }}\n {%- endif %}\n {
{- \"# T