开源模型 Phi-4-reasoning-plus,微软开源的推理模型,从 Phi-4 微调而来,对思维链跟踪和强化学习数据集进行监督微调 Phi-4-reasoning-plus,微软开源的推理模型,从 Phi-4 微...