AI大模型是人工智能迈向通用智能的里程碑技术-《数字化报》

数字经济创新门户网站

下载APP

扫一扫

下载数字化报APP

在线投稿

网站首页

数智化

资讯

科技

能源

工业

贸易

保险

公益

行业洞察

旅游

酒店

消费

生活方式

家居

母婴

零售

体育

教育

农业

汽车

地产

健康医疗

航空

文娱

游戏

艺术

智慧经营

食品·餐饮

支付

电商

企业

经营

人物

品牌

科技金融

经济

财经

人工智能

区块链

在线投稿

扫一扫

下载数字化报APP

首页企业正文

AI大模型是人工智能迈向通用智能的里程碑技术

数字化报 2023-02-20 6.94w

学习或挑战ChatGPT的“正确姿态”可能仍然在更基本、更底层的原始创新中找到力量。一些中国公司继续投资芯片、操作系统、人工智能大型模型等，并产生了一些产出。ChatGPT的出现也是中国人工智能公司加快运营，迎来新一轮发展的机遇。

近期，AI(人工智能)圈一股“ChatGPT以美国“硅谷”为核心的热潮涌入中国。

2022年11月底，创业公司OpenAI发布了一款名为ChatGPT的对话聊天机器人模型，一经推出，就在网络上迅速走红。美国科技公司微软创始人比尔·盖茨高度评价这项技术，认为它不亚于互联网和个人电脑（PC）的出现。

2023年，微软推新，谷歌进入，“ChatGPT“热潮迅速升温，国内科技巨头纷纷涌入潮流。ChatGPT发布后，百度、科大讯飞、JD.COM等多家企业宣布了自己在人工智能领域的布局。

最近，360创始人周鸿毅在一次直播中表示，如果企业不能乘坐ChatGPT，它很可能会被淘汰。事实上，ChatGPT作为一种非凡的应用程序（模型）的出现给人工智能领域的技术发展和产业布局带来了新的变化。

回顾ChatGPT的出现，不难发现，这是一个创业团队首先“生存”，然后实现“服务所有人”目标的故事。这也是一个从闭环研发到整个市场开源的人工智能模型。它也是一种利用超大数据、超强计算率和超强算法“喂养”的跳跃人工智能产品，是量变引起质变的产物。

整理人工智能产业的历史和现实，我们可以看到数据背后是一个常见的应用场景，计算率依赖于完善的信息基础设施，这需要强大的人力资源。中国已经为这些方面做好了准备，甚至积累了巨大的数据、计算率和人才优势。但当中国的GPT浪潮汹涌时，盲目地跟随公众，“CopyToChina“早已落伍，甚至在使用上“坐车”也显得不合时宜。

ChatGPT潮涌

“今天我们推出了ChatGPT，试着在这里和它交谈”。

2022年11月30日，热潮来袭。OpenAICEO山姆·阿尔特曼当天发布了一条推特。除了以上文字，推特还包括一个链接。每个人都可以点击链接，注册账户，免费与ChatGPT交谈。

与Siri、像小艾这样的语音助手，ChatGPT也是一种人机交互。然而，在与ChatGPT“对话”的过程中，人们发现它的“智能水平”远远超过其他人工智能机器人。除了聊天，ChatGPT还被网民用来写文案、翻译文本、纠正代码错误，甚至编写代码。

根据OpenAI官方网站，ChatGPT可以继续回答问题、承认错误、质疑不当和拒绝不当请求。”第一次，它（指ChatGPT）回答错误，我告诉它正确的信息，然后问同样的问题，它的答案被纠正了。”一位试图与ChatGPT对话的程序员对记者说：“它甚至对我说‘对不起’。”

ChatGPT凭借出色的表现，仅两个月就吸引了1亿多用户的关注，成为20年来互联网领域增长最快的消费应用。

北京时间2月7日凌晨，美国科技巨头谷歌紧急进入，宣布基于LaMDA大型人工智能对话机器人“Bard“内部测试正在进行中。第二天，微软宣布推出最新版本的Bing搜索引擎和Edge浏览器，由ChatGPT支持，热潮升温，立即接触中国。

就在谷歌正式宣布Bard内测的那天下午，百度正式宣布了大模型新项目“文心一言”（ERNIEBot），并表示预计将在3月份完成内部测试。阿里巴巴和360在接下来的一段时间里、科大讯飞、腾讯等国内公司对人工智能技术的发展表示了关注。2月10日，京东云宣布，燕西人工智能应用平台将推出工业版本的ChatGPT--ChatJD。

中国公司竞争人工智能跑道，从科技巨头到龙头企业，AIGC(利用人工智能技术生成内容)等人工智能概念在股市飙升。虽然监管出售后迅速平息，但涨幅依然存在。中信证券研究报告认为，全球ChatGPT的普及正在加快人工智能产业化，这将引领创新人工智能的新变化。

“ChatGPT“热潮汹涌，人工智能投资和产业布局正处于平静期，迎来了小阳春。

用大数据、大算率、强算法“喂”

企业进入，资本关注。"ChatGPT“在繁荣的背后，是人工智能大模型的场景着陆。”中国信通研究所云计算与大数据研究所的优势何宝红最近在一篇评论文章中写道：“中国信通研究所GPT的成功代表了人工智能大模型道路的发展和完善。”。

人工智能大模型是人工智能向通用智能转变的里程碑技术。该模型可以自动从数据中学习知识，提高性能。GPT是OpenAI推出的AI大模型系列。从2018年到2022年，OpenAI迭代并推出GPT-1、GPT-2、GPT-3、InstructGPT，此次发布的ChatGPT是在GPT-3的基础上通过指令微调获得的。

2022年初，OpenAI团队开始用GPT-3构建ChatGPT。据《财富》杂志报道，通过GPT-3训练ChatGPT的过程并不顺利，对话效果也不理想。因此，OpenAI决定将ChatGPT放在“野外”供公众使用。

结果，ChatGPT在2022年底实现了非凡的传播，超出了制作团队的预期。“这绝对令人惊讶。”OpenAI首席技术官米拉·穆拉蒂在接受采访时表示。OpenAI在GPT大模型迭代中完成了一场自我革命，在对话场景中爆发。

“ChatGPT以一种非常简单的对话方式构建了一个非常好的应用场景。”360创始人周鸿祎认为，ChatGPT提供的这些应用领域非常接近大多数人的日常需求和痛点，因此可以流行起来。

中国信通院云计算与大数据研究所人工智能部副主任董晓飞表示：“爆炸是偶然的，但ChatGPT的成功并非偶然。”。在GPT系列模型的基础上，OpenAI对算法、计算率、数据等人工智能关键要素进行了一定的升级和优化。

在算法方面，ChatGPT的前提是世界上强大的LLM(大语言模型)之一——GPT-3.同时，引入了基于人类反馈的强化学习方法，提高了对话质量。董晓飞说：“就GhatGPT的性能而言，其准确性和整体性能效果确实有所提高。”。

同时，人工智能的实践和使用也需要强有力的计算支持。ChatGPT的实践在微软云中进行，在全球云计算市场中，微软云的市场份额排名第二。高水平、高市场份额和芯片技术的蓬勃发展为ChatGPT的出现奠定了坚实的计算基础。

除了算法和算率，AI大模型的进步迭代还需要大量的数据来练习。2020年发布的GPT-3的训练参数已经达到了惊人的1750亿次。“大量数据被反复‘喂’给ChatGPT。”目前在北京大学从事人工智能研究的博士生告诉记者。

此外，ChatGPT的练习成本也很高。据Lambdalabs首席科学官Chuanli介绍，GPT-3一次训练费用为460万美元，参数1750亿次。在知乎上，网友们在讨论ChatGPT时也认为这是“烧钱”。因此，可以说，ChatGPT是一种以大规模数据“喂养”的人工智能模型，具有高计算率、高成本。

董晓飞指出，虽然国内外公司在算法研发方面基本保持相同的水平，但国内更注重大型模型技术与行业场景的结合，对数据标记、模型培训等高成本人力投资更加谨慎。

“我们真正缺乏的是技术积累，包括如何清理、标记数据和模型的结构设计，以及如何训练和推理。许多地方需要经验和积累。”网上流行的《ChatGPT专家深度解读》。

搜狐创始人张朝阳在一次直播中说：“ChatGPT的产生是一个从量变到质变的过程。它已经积累了很多年，涉及到服务器、知识库、标记等问题。如果没有这些能力的企业跟随潮流，它将消耗大量资源。”

抓住优势，竞争“生成人工智能”浪潮

热潮已经到来，有技术基础的公司正在大力突破，没有技术基础的公司准备努力工作，还有待进入。当热潮消退时，你是否能留在球场上，你仍然需要看到你自己的优缺点。

ChatGPT是AIGC的一种实现。董晓飞认为，国内公司在AIGC的大模型建设和应用方面具有相对的技术基础和创新环境优势。

首先，中国继续投资于大型模型研发，具有坚实的技术基础。目前，阿里达摩研究所的M6参数已达到10万亿，是世界上最大的人工智能预培训模型；华为盘古、百度文心等大型模型参数已超过1000亿，其中百度文心模型参数已达到2600亿，不低于GPT-3。”近年来，国内相关公司和研究机构在大型模型方面积累了技术积累。”董晓飞说。

其次，加快国内“产业数字化转型”、实现人工智能与实体经济相结合的政策为人工智能带来了改革创新的环境。近日，国务院国有资产监督管理委员会发布了《关于进一步扩大2023年中央企业投资管理有关事项的通知》、人工智能、数据中心和其他新的基础设施投资。近年来，中国发布了一系列支持人工智能核心技术研究、商品着陆应用和探索新模式和新路径的政策文件。

在掌握优势的同时，我们也应该看到目前面临的一些挑战。例如，人工智能领导者相对短缺，人工智能与实体经济的结合水平仍需进一步加深。在这方面，董晓飞建议我们应该特别关注一些底层技术的发展，如大型模型框架、算法等，并进一步扩大人工智能的应用场景。与此同时，他说，“这有利于人工智能的发展，”他说。

但董晓飞也指出，基于大型聊天机器人的成本投资非常大，“公司的早期投资需要谨慎，需要看到方向。”

根据中国新一代人工智能发展战略研究院发布的《中国新一代人工智能技术产业发展报告(2022)》，中国人工智能企业的布局侧重于网络层和技术

——【编辑：舒雯雯】

THE END

未经数字化报网授权，严禁转载或镜像，违者必究。

特别提醒：如内容、图片、视频出现侵权问题，请发送邮箱：tousu_ts@sina.com。

风险提示：数字化报网呈现的所有信息仅作为学习分享，不构成投资建议，一切投资操作信息不能作为投资依据。本网站所报道的文章资料、图片、数据等信息来源于互联网，仅供参考使用，相关侵权责任由信息来源第三方承担。

本文地址: http://szhww.com/news/1983.shtml

2025-03-19

揭秘外企高管的“低碳”日常！发现不一样的爱普生

2025-03-13