• Latest
  • Trending
OpenAI神秘模型,再次被Sam Altman提及

OpenAI神秘模型,再次被Sam Altman提及

2024-05-06
微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂

微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂

2025-08-14
宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想

宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想

2025-08-14
免费使用GPT-5!一手实测案例,代码能力强的离谱

免费使用GPT-5!一手实测案例,代码能力强的离谱

2025-08-12

美国程序员失业率创纪录:17万本科生难就业,AI抢饭碗!

2025-08-11
OpenAI刚刚发布GPT-5,免费使用、疯狂屠榜,一夜改写AI历史

OpenAI刚刚发布GPT-5,免费使用、疯狂屠榜,一夜改写AI历史

2025-08-08
数字化深水区里,中国企业到底需要怎样的AI应用底座?

快手提出强化学习创新框架RLEP,突破大模型推理瓶颈

2025-08-07
海外炸场的开源狠角色,MoE + 原生智能体,国产最强实锤?

海外炸场的开源狠角色,MoE + 原生智能体,国产最强实锤?

2025-08-01
数字化深水区里,中国企业到底需要怎样的AI应用底座?

数字化深水区里,中国企业到底需要怎样的AI应用底座?

2025-07-29
重塑浏览器!微软在Edge加入AI Agent,自动化搜索、预测、整合

重塑浏览器!微软在Edge加入AI Agent,自动化搜索、预测、整合

2025-07-29
Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工

Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工

2025-07-25
200万个AI芯片!OpenAI扩大5000亿美元投资,打造全球第一AI基建

200万个AI芯片!OpenAI扩大5000亿美元投资,打造全球第一AI基建

2025-07-23
碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一

碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一

2025-07-22
Retail
星期二, 8月 19, 2025
关于数字金融网
联系我们&合作
  • 首页
  • 隐私计算
  • 数字风控
  • 数据治理
  • 数智平台
  • 营销与新零售科技
  • 人物观点
  • 活动|峰会
  • 报告|调研
  • 关于数字金融网
    • 联系我们
No Result
View All Result
数字金融网
No Result
View All Result

OpenAI神秘模型,再次被Sam Altman提及

数字金融网 by 数字金融网
2024-05-06
in 其它分类
A A
0
OpenAI神秘模型,再次被Sam Altman提及

5月6日,OpenAI首席执行官Sam Altman在社交平台分享了一条推文“我是一个优秀的GPT-2聊天机器人”。

而在4月30日,Altman就提起过该模型非常喜欢GPT-2。按道理说一个只有15亿参数在2019年发布的开源模型,被反复提及两次就很不寻常。

更意外的是GPT-2曾短暂上榜LMSYS的聊天机器人竞技场性能媲美GPT-4、Claude Opus等模型。

很多人猜测,难道这是OpenAI即将发布的GPT-4.5、GPT-5?但在5月2日的一场公开演讲中,Altman否认了这个说法。

推荐可能喜欢的

微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂

微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂

2025-08-14
宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想

宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想

2025-08-14

GPT-2开源地址:https://github.com/openai/gpt-2

论文地址:https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf


从GPT-2展示出的性能来看有一点是可以肯定的,OpenAI掌握了一种新的训练、微调模型方法,可将小参数模型的性能训练的和大参数模型一样优秀,就像微软刚发布的Phi-3系列模型。

所以,这可能是一款针对手机、平板等移动设备的高性能、低消耗模型。因为,微软、谷歌、Meta等科技巨头都发布了针对移动端的大模型,唯独OpenAI迟迟没有发布。

加上苹果正在与OpenAI、谷歌洽谈希望在iOS 18中使用GPT系列模型来增强用户体验和产品性能。非常善于营销的Altman用这种“新锅抄旧菜”的方法进行病毒式宣传来赢得苹果的信任。

一方面,可以极大展示自己模型的性能与技术实力;另一方面给谷歌造成压力,虽然其Gemini系列是针对移动端的,但在市场应用方面并没有太多的反响。

开发移动端的大模型都有一个非常相似的技术特点,就是参数都非常小。例如,微软刚发布的Phi-3系列模型,最小的只有13亿参数;谷歌的Gemini系列模型最小的只有18亿。

这是因为,参数越大模型的神经元就越多对硬件的要求也就越高。如果想部署在移动端的大模型需要考虑电池、存储空间、算力、延迟、推理效率等因素,才能在有限的硬件空间内发挥出最大的性能。例如,直接使用一个1000亿参数的模型,可能还没问几下电池先耗尽了。

此外,在移动设备对推理的效率要求也很高。目前手机端的延迟大概是web、PC端的数倍,如果想更好地使用语音助手、实时翻译、文本问答这些功能,也是使用小参数模型的主要原因之一。


所以,OpenAI使用在2019年开源的15亿参数GPT-2模型来实验最合适不过了,并且架构也是基于Transformer,基本上是GPT-3、GPT-4的先辈模型。

当然,如果未来OpenAI真的发布面向移动端的小参数模型,名字肯定不会再叫GPT-2,大概会起GPT-4 mini/little一类的吧。

本文素材来源OpenAI,如有侵权请联系删除

数字金融网

数字金融网

发表评论 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

数字金融网

聚焦金融(银行、证券、保险)行业数字化转型的科技生态平台,关注信用科技、数字货币/区块链、支付科技、监管与反洗钱、隐私计算、数字孪生等科技在金融领域的发展与应用,面向金融行业从业者,解读金融政策、分享最新金融技术应用,输出有影响力的白皮书/报告,组织数字金融科技活动等,为金融机构实现数字化转型提供智库支持。

北京企智未来教育科技有限公司

service@rpa-cn.com

最新文章

  • 微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂
  • 宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想
  • 免费使用GPT-5!一手实测案例,代码能力强的离谱
  • 美国程序员失业率创纪录:17万本科生难就业,AI抢饭碗!
  • OpenAI刚刚发布GPT-5,免费使用、疯狂屠榜,一夜改写AI历史
  • 快手提出强化学习创新框架RLEP,突破大模型推理瓶颈
  • 海外炸场的开源狠角色,MoE + 原生智能体,国产最强实锤?
  • 数字化深水区里,中国企业到底需要怎样的AI应用底座?

内容分类

  • 人物观点
  • 其它分类
  • 报告|调研
  • 数字风控
  • 数据治理
  • 数智平台
  • 活动|峰会
  • 营销与新零售科技
  • 隐私计算
  • 关于我们
  • RPA中国
  • LowCode低码时代
  • 隐私政策
  • 联系我们

Copyright©2017-2022 数字金融网 All Rights Reserved 京ICP备19023145号

No Result
View All Result
  • 首页
  • 隐私计算
  • 数字风控
  • 数据治理
  • 数智平台
  • 营销与新零售科技
  • 人物观点
  • 活动|峰会
  • 报告|调研
  • 关于数字金融网
    • 联系我们

Copyright©2017-2022 数字金融网 All Rights Reserved 京ICP备19023145号