国内类似ChatGPT的大模型应用有哪些？发展情况如何了

心满意足 · 发表于 2023-7-14 19:23:48

导读：

先澄清大语言模型应用的概念、再介绍国内外的主要大模型应用及进展，最后提供一些扩展阅读材料
共计1500字左右，阅读大概需要4分钟

<hr/>一、几个容易混淆的概念

很多人，包括很多粉丝的科技博主，经常把ChatGPT和预训练大模型混为一谈，因此有必要先做一个澄清。预训练大语言模型属于预训练大模型的一类，而ChatGPT、文心一言又是预训练大语言模型的一个具体应用（如下图所示）。

而我们今天讨论的主要是预训练大语言模型的应用，也就是我们能看得见摸得着的东西。
二、国外预训练大语言模型典型应用

1. 大名鼎鼎的ChatGPT。OpenAI于2022年11月30日发布了ChatGPT，背后是微软（主要投资方）。ChatGPT一经发布就惊艳了四方，而且仅仅2个月就突破了1亿用户，打破世界纪录成为彻底的网红产品。相比较而言TikTok（抖音国际版）达到1亿用户用时9个月，Instagram（照片墙）则花了两年半的时间，Facebook当时也花了852天，可见ChatGPT有多强。
2. 谷歌：Bard。谷歌在2023年2月9日，在巴黎发布了Bard，是专门为对抗ChatGPT出的聊天机器人产品。然而，谷歌给大家期望过高，这个产品发布会上竟然不慎翻车了，出现了一个明显的事实错误。大家可自行搜索百度，了解详情。谷歌在AI领域的领导者地位毋庸置疑，期待后续改进。

三、国内预训练大语言模型典型应用及近期行业进展

1. 百度：文心一言。2023年3月16日百度发布了文心一言，类似于ChatGPT的产品。百度做搜索引擎起家，是最早布局大模型的公司之一，因此能够实现国内率先的发布。不过，在前一天3月15日，ChatGPT进行了迭代和发布，给文心一言的发布造成不小压力。

2. 阿里：通义千问。阿里于4月7日发布了“通义千问”，但并未大张旗鼓的召开新闻发布会，而是采用了邀请客户体验的方式。目前通义千问已经有人体验了，知乎上有人和文心一言做了对比测试，大家可以自行搜索。
3. 华为：盘古大模型。华为于2023年4月8日在由中国人工智能学会主办的人工智能大模型技术高峰论坛上展示了盘古大模型的进展及其应用。不过这次是大模型，并没有类似ChatGPT的应用出来。

4. 腾讯：混元大模型。同样这次说的是大模型，并非ChatGPT类似的应用。腾讯总裁刘炽平表示，腾讯不会匆忙推出产品，而是将花费时间打造一个经过多次迭代后的长期发展机会。
5. 京东：ChatJD。2月5日，京东宣布将于未来发布类似于ChatGPT的应用——ChatJD，聚焦的是产业版。但发布时间未知。
6. 商汤：4月10日下午举办了技术交流日活动，分享人工智能技术的前沿进展，并公布其在大模型方面的最新情况。
7. 科大讯飞：科大讯飞将于5月发布认知智能大模型。
此外，旷世、快手等也有大模型方面的布局，近期没有消息，这里就不一一列举。
四、对国内AI发展应怀有敬畏之心

不得不承认，不管是百度的文心一言还是阿里的通义千问，跟ChatGPT相比还是有些差距的。但大可不必抱着喷的心态来看待这个问题。在我国，现在即便是大厂，做这件事情本身也挺不容易。主要有如下原因：
1. 训练用的芯片被美国卡脖子。根据升级后的美国禁令条例，英伟达超算和云端训练产品A100 和H100、AMD的MI250和MI250X等GPU产品均在禁售范围之内。尤其是Nivida H100系列，这么强的芯片根本就不卖给中国；现在连A100都给限制了。为了曲线救国，国外芯片厂商也得是调整参数后才能卖给我国。因此，大家只能用之前的存货或其他算力低的芯片。（参考《美国出口管理条例》）
2. 研发成本高。根据艾瑞咨询，ChatGPT计算资源成本很高，迭代训练一次需要460万美元。以及需要高端人才、科学家等研发成本。对国内公司而言，这一样是真金白银、每天都在烧钱。
3. 使用成本高。目前，国内的ChatGPT类应用还没有探索出来商业化之路，每一次交互都会耗费底层大量的算力资源。毕竟研发完成以后还要跑起来的。
因此，相互理解最好，多给国内公司点个赞。模型毕竟会不断迭代的，相信未来的产品会越来越好！我们在AI的赛道上也有自己的东西！

<hr/>下期预告：
点赞数过5，就写下一篇文章介绍国内主要大模型、发布时间及模型参数等
（转载注明出处即可）

恶魔之泪 · 发表于 2025-7-5 15:52:44

我了个去，顶了

市政公所 · 发表于 2025-7-6 13:19:21

一直在看

馀生不喜不悲 · 发表于 6 天前

元芳你怎么看？