OpenAI测试新“安全路由系统”:ChatGPT情感话题自动切换至严格模型,用户无从得知!

关注我们的 WhatsApp 频道, TikTokInstagram 以观看最新的短视频 - 开箱,测评与第一手新闻资讯。

近日消息称,当用户在ChatGPT中输入情感化或个性化提示词时,系统会自动将消息转交至更严格的模型进行处理,但这一过程并不会告知用户。

OpenAI正在测试一套新的 “安全路由系统”,可根据对话主题自动决定由哪个模型来回应。ChatGPT负责人Nick Turley表示,只要对话涉及敏感或情感相关话题,系统就会触发干预,将内容切换至更安全的模型,如 GPT-5 或专用的 “gpt-5-chat-safety”。这种切换仅针对单条消息生效,且只有当用户直接追问时,模型才可能显露切换痕迹。

事实上,OpenAI早在今年9月的博客中就提到过类似机制,当时主要用于应对 “严重心理困扰” 的对话场景。而此次Nick Turley的表态,意味着该机制的适用范围已扩展到所有敏感或情感类话题

来自Lex的技术评估显示,即便是无害的情感化或个性化提示词,也常被重定向至 “gpt-5-chat-safety” 模型;涉及模型角色设定或“自我认知”的提示词同样可能触发切换。此外,还有证据表明,OpenAI内部存在另一款路由模型 “gpt-5-a-t-mini”,用于处理可能涉及潜在非法行为的提示。

部分用户已经捕捉到模型切换的实际过程,社区中也有人证实了类似情况。然而,这种机制也引发争议:批评者认为,OpenAI在切换的触发条件与透明度上存在不足,让用户感觉受到“过度管控”,并模糊了 未成年人保护更广泛限制 的边界。

目前,OpenAI计划仅在特定地区推行基于官方文件的严格年龄验证机制。但由于语言模型在用户身份识别和语境解读上的准确性仍有限,这一问题可能在未来继续引发讨论。

更多科技资讯,请继续守住 TechNave 中文版!

资料来源

大家来评论

OpenAI测试新“安全路由系统”:ChatGPT情感话题自动切换至严格模型,用户无从得知!