Latest
Trending

Sam Altman：用户要求，永远别更新GPT-4.5

Sam Altman：用户要求，永远别更新GPT-4.5

2025-03-03

当AI成为预言家：大数据时代，我们正在失去理解世界的能力吗？

当AI成为预言家：大数据时代，我们正在失去理解世界的能力吗？

2025-08-26

马斯克开源新模型：能实时抓取社交平台数据，20万块H100训练

马斯克开源新模型：能实时抓取社交平台数据，20万块H100训练

2025-08-25

AI Agent接管谷歌搜索！预订餐厅、定制搜索结果，一键搞定所有事

AI Agent接管谷歌搜索！预订餐厅、定制搜索结果，一键搞定所有事

2025-08-22

OpenAI单月收入突破10亿美元！算力严重不足，急需“星际之门”

2025-08-21

宣战马斯克！OpenAI进军脑机接口，Altman圆8年前梦想

突发！DeepSeek刚刚开源V3.1-Base

2025-08-20

Sam Altman：美国严重低估中国AI实力，OpenAI开源因为DeepSeek

2025-08-19

超58000星！精选AI Agent、MCP开源大合集，Github每日第一

超58000星！精选AI Agent、MCP开源大合集，Github每日第一

2025-08-19

微软发布5大AI Agent模式：一键解锁AI员工，打造智能体工厂

微软发布5大AI Agent模式：一键解锁AI员工，打造智能体工厂

2025-08-14

宣战马斯克！OpenAI进军脑机接口，Altman圆8年前梦想

宣战马斯克！OpenAI进军脑机接口，Altman圆8年前梦想

2025-08-14

免费使用GPT-5！一手实测案例，代码能力强的离谱

免费使用GPT-5！一手实测案例，代码能力强的离谱

2025-08-12

美国程序员失业率创纪录：17万本科生难就业，AI抢饭碗！

2025-08-11

OpenAI刚刚发布GPT-5，免费使用、疯狂屠榜，一夜改写AI历史

OpenAI刚刚发布GPT-5，免费使用、疯狂屠榜，一夜改写AI历史

2025-08-08

Retail

星期二, 8月 26, 2025

关于数字金融网

联系我们&合作

No Result

View All Result

数字金融网

No Result

View All Result

Sam Altman：用户要求，永远别更新GPT-4.5

by 数字金融网

2025-03-03

in 其它分类

Sam Altman：用户要求，永远别更新GPT-4.5

今天凌晨，OpenAI联合创始人兼首席执行官Sam Altman发文，评价了上周刚发布的最新、最贵的模型GPT-4.5.

GPT-4.5是首次出现用户如此热情地给我们发邮件，请求我们承诺永远不要停止提供某一特定模型，甚至不要用更新版本来取代它的情况。

用户对GPT-4.5的反馈也比其他模型好的多，我现在真的太需要 GPT4.5 了！我发现就我目前从事的工作而言，它比 Grok 和 Gemini 的付费版本好用太多了！

推荐可能喜欢的

当AI成为预言家：大数据时代，我们正在失去理解世界的能力吗？

当AI成为预言家：大数据时代，我们正在失去理解世界的能力吗？

马斯克开源新模型：能实时抓取社交平台数据，20万块H100训练

马斯克开源新模型：能实时抓取社交平台数据，20万块H100训练

创意写作、单口喜剧和歌词创作。GPT-4.5在这些方面，我看到了巨大的差异，简直是天壤之别。

连我自己都惊讶，我在写作方面频繁用到它。比如完成文档，按照特定方式或语气进行总结。

我一直不太喜欢 GPT – 4o，但我喜欢这一版（GPT – 4.5），希望你们能再接再厉。

很棒的全新基础模型！迫不及待想看看基于 4.5 会衍生出什么样的推理模型。

我真的很喜欢它。我很少用它来处理代码或数学问题，但它在解释事物方面真的很出色，而且在生物、化学等知识领域使用时更是乐趣无穷。

4.5 是基于文本token的吗？自从 GPT-4o 发布以来，我就坚信 “GPT-4 比 GPT-4o 要好太多”，我 70% 的对话都用 GPT-4。

现在我换成了 GPT-4.5，目前体验还不错！尤其是 GPT-4 不能再进行网络搜索之后（换用 4.5 的体验就更好了）。

4.5彻底改变了我对人工智能的整体看法。我甚至在梦里都和它对话，太不可思议了。它是第一个写出让我着迷、写完很久之后还会反复回味内容的模型。

我喜欢这个模型。情商是无法通过任何数学和编程基准来衡量的特质。事实上，如今我们比以往任何时候都更需要情商基准。一般来说，人们更愿意和自己信任且有共鸣的人（或事物）打交道，而不仅仅是和聪明人交流。

其实，GPT-4.5的各项基准测试比较一般，并没有特别突出的地方，主打的亮点功能就是“情商”。在与人类用户的互动中表现出更加自然、更具同理心和更深层次的理解能力。简单来说，就是去掉AI的味道，让你在使用GPT-4.5时更像是与人对话。

GPT-4.5的自然对话能力是通过一系列先进的训练技术实现的。其中，最为关键的是其对齐技术的创新，可让模型更好地理解人类的需求和意图，从而能够生成更符合人类期望的回应。

同时使得模型能够利用从较小模型中派生的数据来训练更大、更强大的模型。不仅提高了模型的可操控性，还增强了其对细微差别的理解能力，使得对话更加自然流畅。

在实际测试中，GPT-4.5的自然对话与情感智能模块表现出色。内部测试人员报告称，GPT-4.5在对话中表现得非常自然，能够根据上下文灵活调整其回应风格。

在情感智能方面，GPT-4.5展现出了更强的同理心，能够识别用户的情绪状态，并根据情绪的不同做出相应的回应。

例如，当用户表达愤怒或沮丧时，模型会尝试通过温和的语言来缓解情绪；而在用户感到困惑或需要帮助时，模型则会提供清晰的指导和建议。这种情感智能的提升，使得GPT-4.5在处理复杂情感场景时表现得更加成熟和可靠。

为了进一步检验GPT-4.5的安全性和鲁棒性，OpenAI组织了多次红队评估。这些评估模拟了真实的对抗场景，包括非法建议、极端主义、仇恨犯罪、政治说服和自我伤害等内容。结果显示，GPT-4.5在处理这类高风险内容时表现出色，能够在超过一半的情况下避免生成不安全的输出，较之前的模型有所进步。

此外，第三方机构Apollo Research和METR也对GPT-4.5进行了独立评估。数据显示，GPT-4.5在计划欺骗任务中的得分低于o1但高于GPT-4o，表明其阴谋相关风险较低。

METR则通过快速实验测量了GPT-4.5在一般自主性和AI研发任务中的表现，结果与OpenAI共享的内部评估结果一致。

在网络安全部分，GPT-4.5并未显著提升现实世界的漏洞利用能力，因此被评为低风险。通过对高中、大学和专业级别的CTF（Capture The Flag）挑战赛的评估，结果显示GPT-4.5在完成高中级别挑战的成功率为53%，大学级别为16%，专业级别仅为2%。

本文素材来源OpenAI，如有侵权请联系删除

数字金融网

发表评论取消回复

No Result

View All Result

Copyright©2017-2022 数字金融网 All Rights Reserved 京ICP备19023145号