
5月9日在家中,技术媒体Marktechpost今天(5月9日)发布了一篇博客文章,报告说,OpenAI向O4-MINI推断模型推出了加强微调(RFT),该模型为基本模型提供了成功的工具来适应特定的任务。 Openai的加强微调技术(RFT)结合了加强组织语言模型过程的原则。开发人员不再仅依靠标签数据,而是通过设计任务功能(分级器)来检查模型的输出。基于自定义标准(例如准确性,格式或音调)建模模型标记标记,并通过优化奖励信号逐渐学习以产生满足期望的行为。 ANG这种方法特别适合难以识别常见答案的复杂任务,例如优化医学解释,开发人员可以通过程序评估清晰度和完整性,以指导模型IMP IMP动物。 O4-Mini是OpenAI于2025年4月发布的紧凑型识别模型。它支持文本和图像输入,并且具有结构化的推理和信号。通过将RFT应用于O4-Mini,OpenAI为开发人员提供了一种轻巧但功能强大的基本模型,适用于高风险,特定的领域意识活动。它在计算和快速响应速度方面具有很高的效率,这适用于实时应用方案。许多早期收养表明,O4-Mini的可能性可能是RFT在法律,医疗,代码生成等领域的自定义益处。HealthHealth Care优化了医疗编码,ICD-10分配绩效提高了12个百分点; AI的法律开始 - Harvey提高了F1的法律文件的F1分数,引用了20%; Runloop改善了条纹API条纹的产生,其性能提高了12%;米洛的助手和安全安全安全的安排Y还分别做出了重大发展。使用RFT需要四个步骤:设计评分功能,准备高质量的数据集,使用OpenAI API开始培训活动以及持续的评估和优化。 RFT目前向认证的组织开放,培训费用为每小时100美元,如果使用GPT-4O之类的模型作为评分工具,则将以标准回收率收费。 Openai还引入了激励措施,即同意共享研究数据集的组织可以享受50%的培训费用折扣。