周鸿祎:AI 是赋能者,而不是单纯的颠覆者

liukang202420小时前热门吃瓜881

头图来历:极客公园

迷人的周鸿祎:AI 是赋能者,而不是单纯的颠覆者的视图

两年前,大模型刚鼓起时,周鸿祎开端用四个「你相不信任」呼吁现场树立 AI 崇奉,从此踏上「AI 布道者」之路。

上一年,作为国内第一批发布大模型的互联网公司,360 的战略调整为「All in AI」。本年,360 在 AI 范畴取得不少开展,1 月底上线 360 AI 查找;7 月发布国内首款儿童 AI 手表 360 儿童手表 A9 AI 红衣版;8 月宣告与国内 15 家大模型厂商达到协作,一同推出新一代 AI 产品「AI 帮手」……

现在,大模型技能的呈现,深化影响了各行各业的开展轨道,成为不行忽视的重要力气。但在周鸿祎看来,大模型不该被神化,而是应该被视为一种赋能东西。

在极客公园 IF2025 立异大会上,360 集团创始人周鸿祎在「在大模型年代年轻人值得干点什么」的主题讲演中谈到,AI 的实质是「赋能」,而非单纯的「推翻」。在 AI 年代,AI 的效果是为各个职业供给赋能、重构游戏规矩,而不是单纯打破现有的格式,AI 应该像电动机相同嵌入到各种运用场景中,推进产业革新。

周鸿祎总结了他眼中关于未来的六个趋势

  1. AGI(通用人工智能)和超级人工智能开展放缓;
  2. 大模型趋向专业化;
  3. 模型越做越小;
  4. 练习数据质量进步;
  5. 本钱下降;
  6. InfraStructure 建造根本完善。

一同,他也列出了六大运用方向,希望年轻人能够从大模型的六大运用方向中寻求到归于自己的时机。

  1. 人人智能;
  2. 从万物互联走向万物智能;
  3. 数转智改,助力传统产业打造新质出产力;
  4. 未来和新式产业;
  5. 打造科研新范式;
  6. AI 安全。

现在,大模型正在把一切职业、把一切赛道都重写一遍,年代的游戏规矩已改动,新的时机摆在了一切人面前。

以下为周鸿祎现场讲演实录,由极客公园收拾。

周鸿祎:今日在讲人工智能之前,先跟咱们说说我为什么拍短剧。我之前仅有看的一集短剧是《二十岁总裁爱上保洁阿姨》,看的时分有两个周鸿祎,一个理性的周鸿祎一边看一边吐,能这么拍?理性的周鸿祎说快点下一集。那么我为什么拍一部短剧呢?有些部分审阅了之后说:咱们发现你拍的不是短剧,彻底是广告片,所以咱们拍短剧的意图是什么,等下跟咱们共享一下。

国内把这个事说得太奥秘了,一说便是企业家做 IP,一说做 IP 在座许多人就觉得我又不是什么闻名人物,我有什么 IP 可做的?

但其实说白了在短视频和短剧年代,短视频和短剧现已把咱们脑筋格式化之后,曩昔传统公关部和商场部或许用户添加部要干的一件事便是要搞流量。

我前一段时刻去硅谷,跟许多创业公司谈,他们没有什么 IP 的概念,可是你问每个公司说怎样冷启动你的公司,怎样冷启动你的产品?答案都是共同的,便是做魔性的短视频,在国外短视频平台上获取免费流量,这是咱们拍短剧的意图。现在这个短剧也正在拍续集。

最近有一个概念叫 Founder Mode。在短视频年代,传达游戏规矩发生了改动,跟用户交流办法发生了改动,更大的改动是在于大模型,它的呈现改动了技能架构和商业方法。所以我现在是在带领 360 二次或许三次创业。

我今日共享一下我对大模型开展的考虑,关于在大模型年代年轻人值得干点什么。

许多互联网职业的「老兵」或许会以为,AI 与互联网的开展规则相似,乃至会发生一种失望感,觉得互联网现现已历了二十年的开展,许多时机和格式现已开端成型。前几天,马云在蚂蚁集团的讲话中说到的一个观念我十分附和——AI 是比互联网更大的时机。因而,互联网年代的规矩和思想办法纷歧定适用于 AI 年代。假如咱们在 AI 年代仍然沿袭互联网年代做 APP 或 Web 的思想来开发 AI,那就像守株待兔。

举个简略的比方,互联网能否进步出产力?互联网的确能够进步交流功率,但这并不是互联网的实质。互联网的中心在于衔接——衔接人与信息、衔接人与人。

周鸿祎在极客公园 IF2025 立异大会|图片来历:极客公园

互联网彻底跟实际国际无关,而是创造了一个虚拟的时空,在互联网里又发生了许多共同的交际、社区方法。而人工智能的最大不同之处在于,它是一种直接进步出产力的东西,并且出产力更强。

硅谷的一些人从前挖苦互联网,称自己原本希望得到的是一艘世界飞船或一辆会飞的轿车,却终究得到了一个 140 字的推特。互联网是很牛,可是互联网许多事干不了,当今日人工智能能够研讨蛋白质的结构,能够让主动驾驶、无人驾驶成为或许性,包含推进机器人的开展。

所以这是我第一个共享的内容——人工智能应当被视为一种赋能东西。之前一个经济学家陈龙宣布过一篇文章,我认同他的观念。曩昔,互联网常被视为一种「推翻性」力气,我也写了一本书叫《推翻者》。但在 AI 年代,咱们有必要供认,AI 是赋能者,而不是单纯的推翻者。至于它究竟能否推翻,这个问题能够今后再评论。

关于未来的六个趋势:

网络上有许多关于 AI 将推翻各行各业的焦虑文章,但我以为最重要的是,AI 正在把一切职业、把一切赛道都重写一遍。所以这或许是各位和咱们最大的时机,所以不要守株待兔。

先说几个猜测/趋势:

第一个猜测是AGI(通用人工智能)和超级人工智能开展放缓。我从前十分看好 AGI 的远景,乃至觉得它会在 2025 或 2027 年呈现。不过现在看起来这个开展脚步正在放缓。

周鸿祎在极客公园 IF2025 立异大会|图片来历:极客公园

这两天 Ilya 有一个新的讲演,可是 GPT5 还没发布,包含最近呈现的一些新模型仍然侧重于多模态才干的进步,尤其是在编程和推理才干方面。OpenAI 开端方针是愿望结构一个全世界超级无敌通用人工智能,能够在各个方面逾越人类,现在我觉得这个事在逻辑上不太建立。

曩昔许多人以为,Transformer 模型模拟了人类的多层神经网络推理,只需供给满意的核算才干和数据,AGI 就会「自然而然」地呈现。可是从现在来看,Ilya 供认互联网上能用的数据用得差不多了,如同 AGI 也没有到来。

有人说不是能够组成数据吗?组成数据是能处理一部分问题,像数理化的推理组成数据能够。可是有个问题是,人类常识往高处走,越泛化仍是越专业?当你从硕士到博士,再到教授,再到院士时,科技树的走向通常是越来越专业化。

比方说怎样写一个操作体系,怎样造一个战斗机?怎样造一个航母?怎样造一个发动机?这种常识并不在互联网上,不是靠互联网阅览满意多的网页和八卦就能够把握的,并且现在组成数据不能包含这个范畴。

有人说 O1 推理才干很强,可是 O1 没有那么奥秘,其实国内现已有好几家公司做出了相似的东西,中心便是经过思想链和强化学习,让模型进行屡次推理,并在得出开端答案后,反向反应,查看是否有过错。乃至咱们实验过让百度先给答案,阿里的来驳斥它,头条来收拾残局,终究 360 和和稀泥。你们能够试一下 PlayGround,就让国内大模型相互 PK 一下,每个智力都会进步许多。

所以 O1 的推理才干不细究了,我的观念不代表真理。不过 O1 的推理才干比较难泛化是一个问题。由于要做强化学习就要有价值函数,价值函数便是得先判别对和错,数学题却是挺简略判别对和错的,可是怎样写一个操作体系是一个好的操作体系,乃至说问题再小一点,怎样写一个浏览器,它的价值函数怎样判别?

终究 AGI 我觉得必定会来到的,可是或许不是在本年下一年。

第二个趋势:大模型进一步开展,不管练习仍是推理,都在往专业化开展。

除了少量几家巨子公司,许多其他公司也在往愈加专业的范畴开展。王小川转向医疗范畴,但仍是有点广泛。最近许多人评论的 MOE(专家混合模型)架构,实际上也是经过多个专家模型来组合才干。

我最近从头考虑了谷歌的战略,忽然发现谷歌的战略如同有些后发先至的意味。咱们能够想想,DeepMind 这家公司开发的 AlphaFold 在蛋白质结构解析方面简直无与伦比,AlphaGo 也曾打败了人类围棋的超九段高手。但咱们并没有看到 AlphaGo 能写诗,AlphaFold 能解奥数题,这些体系有其局限性。包含 AlphaChips,它专心于芯片规划,听说现已逾越了人类规划师。那咱们为什么还要寻求一个既能写诗又能解奥数题的大模型呢?

第三个趋势是模型越做越小。一年前假如站在台上我必定不是这个观念,大模型刚出来时,咱们都在比拼参数量:你有千亿,我有万亿,咱们普遍以为只需参数越大,才干带来更多的才干。

但经过这一年的开展,许多小规划参数的大模型架构开端锋芒毕露。小模型的界说变得越来越含糊,实际上咱们正进入一个模型轻量化的年代。最典型代表是面壁智能,他们姓名起得土一点叫小钢炮。

包含今日模型要上手机,苹果在手机上也会有一个十分小的模型,微软也在探究 1B、2B 参数规划的模型。所以模型纷歧定越做越大,由于越做越大的话就变成马斯克的游戏了,他的确有钱,一说便是 10 万卡集群,要买个核电站,假如模型都是这个玩法,那跟大多数人就没有太大联系。

第四个趋势:练习数据质量进步。曩昔有一个误区,咱们觉得模型越大才干越强,但仍是面壁智能提出一个才干密度的概念,实际上是常识密度,便是咱们发现曩昔以为模型越大,才干越强,才会出现。但现在发现模型尽管小,只需常识含量高、常识纯度、常识质量高,也能展示出强壮的才干。

比方把大模型幻想成人,有两个大学同学,一个特别聪明,脑子容量特别大,天天在网上看八卦,你问他谁跟谁出什么事他都一览无余。别的一个同学大学一年级只做高数题,就把高数 3000 个题做得滚瓜烂熟,谁的高数推理才干强?必定是后一个同学,可是你问他汤姆汉克斯的妈妈是谁,他或许答复不了这个问题。

现在,全球做大模型的人都认识到这个问题了,咱们把互联网上的八卦拼命学进去之后,变成了一个快速问答的常识小能手,可是推理才干并没有特别强。所以 O1 走的便是别的一条路,它许多问题答复不了,可是不影响它的推理才干很强。

所以真实常识今日不在互联网,而是在许多专家脑子里,在许多公司内部事务流程里,那现在这些常识或许是通用大模型的厂商搞不到的。所以大模型的才干增强需求依靠其他途径。

小模型才干增强办法便是多推理几回,咱们原本觉得 Scaling Law 碰到了妨碍,咱们以为老黄的显卡卖不动了,又创造一个办法——不依靠快速考虑,而是经过慢考虑来增强才干。慢考虑并不是让模型当即答复问题,而是让它自己在内心中重复推理,耗费更多算力,这也能明显进步小模型的推理才干。

吴恩达教师有一次讲:假如我用 gpt 3.5+一个 Agent 结构,才干能够超越 gpt 4.0,开端我没有了解什么意思,后来发现当大模型经过快速考虑直接答复问题时,其答案质量或许不如经过一个较小的模型,先进行反思、重复推理,并自我纠正后得到的答案。

终究一个好消息,大模型开展趋势之五——本钱越来越低,现在职业里还有人整理开源好,闭源就好吗?腾讯混元都开源了,千问开源一向做得不错,开源越做越好,才干上来了,开源本钱根本为 0,尽管练习和推理的本钱仍然存在。

生动的周鸿祎:AI 是赋能者,而不是单纯的颠覆者的照片

国外和 GPT4 等效的模型价格下降了数百倍,国内抓紧时刻用他们的 AGI,比方说混元开源了,你自己布置一套,自己本钱比直接接他们 API 都要贵许多。

他们投了那么多 Infra,投了那么多显卡,三年今后就折旧折完了,不必也是白搭,他们给的 API 价格都是低于本钱价,所以咱们能够用起来。

第六个趋势,InfraStructure 出资现已差不多告一段落。为什么?看看英伟达股价就知道,英伟达卖了许多显卡。为什么有人在置疑人工智能有没有泡沫呢?实际上咱们花了几千亿美金买这么多显卡,实际上是给了一个信号——基础设施现已预备好,该做运用了,这一点很像互联网第一次泡沫破碎的时分,思科卖了许多路由器,各个国家拉了许多海底光纤,可是没有运用,第一轮互联网泡沫就破碎了,而依据这些基础设施的许多互联网运用做了起来。

现在开源才干和 API 才干必定是预备好的,所以 2024 年是运用场景之年,2025 年是 Agent 之年。

咱们现在谈大模型,许多事混在一同谈不清楚的,我仍是希望分红两条路:一条是 AGI 之路,这条路承载了人类愿望,让有钱人持续卷数据、卷算力,朝着万亿十万亿参数开展,最近 X.AI 三个月就搞了十万卡集群,我国仍是万卡集群。可是这条路跟咱们没什么联系,横竖咱们都面对人生苦楚的问题便是没钱。

他们有些公司就没有搞清楚自己究竟是做 AGI,仍是在做运用。这条路不要摇晃,要坚定地挑选一条路走到黑,别做着做着说我是在大模型的通用才干,做着做着说我又做了一个场景运用来证明我的才干,这彻底是两件作业。

我有一个观念,咱们都说大模型要掀起一场工业革新,但怎样掀起工业革新呢?就得把大模型拉下神坛,大模型要往产业化、笔直化、场景化、运用化开展,所以做场景、做产品,我觉得一点都不丢人,正由于有许多的运用,互联网才干起来,不然互联网光靠海底光缆、靠思科的高端交换机,是没有任何含义的。

AGI,我今日就不谈了,这是少量巨子的游戏。我这次去美国也见了一个 VC,现已没有人在投做通用大模型的公司了,Anthropic 后边是亚马逊,OpenAI 背面是微软,再加上老黄、马斯克等,你能数得出来在美国做这样的公司不会超越 10 家,并且这个格式的确对「门票」的要求太高。咱们国内有些创业者仍是很聪明的,表面上看来在做通用大模型,实际上他的钱都拿来做投进了,这是十分 smart 的做法,由于投进好歹能弄来用户数据,你说预练习,训了大模型,还不如开源微调的好,这钱不是白花了嘛。

走运用之路,我的意思是让大模型从「原子弹」变成「茶叶蛋」,别再卷算力、卷数据、卷参数了,说白了,我觉得走运用之路的一个十分重要的理念,便是不要希望大模型什么都精干,咱们前面被误导太久了,咱们陷入了迷思,天天出来「秀肌肉」,便是大模型什么都精干,如同无所不能才叫大模型,你公司里雇过这样的职工吗?请了一个司机,又能当警卫,又能当司机,又能当保姆,还能煮饭,还能给你揉脚,还能写程序,还能做公关,还能拍短视频,还能编排,要碰到这样一个人,他自己就创业了。

所以要做专业大模型。上一年看了一个电影,有句话说的特别真理,说「处理问题的要害,便是找到要害的问题」,我觉得处理问题的要害便是抛弃对大模型的执念,不要高估它的才干,当然咱们也不轻视它的潜力,让一个大模型就干一件事,换这样的思路去想一想,会发现模型更小、算力更少、本钱更低,并且运用难度更低。

大模型是才干,不是产品

所以大模型是什么?我从一开端赌错了许多东西,仅有赌对的东西便是我一向不信任大模型是产品,我也一向不信任大模型是操作体系,你把什么东西比方成操作体系这就坏了,全国际就需求 3-4 套,还有你什么事?

大模型不是操作体系,有人老喜爱拿云核算做比方,我后边会讲到大模型也不是电力,咱们一想到电力就想到了云核算,就应该在云端,但大模型更像一个电动机,所以大模型是才干,不是产品,才干是什么概念?

周鸿祎在极客公园 IF2025 立异大会|图片来历:极客公园

才干很好,可是要结合运用场景才干产品化,大模型是要藏在产品后边,所以我最喜爱的产品司理是谁你们知道吗?你们喜爱周星驰吗?看过他很闻名一部教人怎样做产品的电影吗?叫国产《007》,我就常常检讨,它里边最经典的比方是这看起来像一个刮胡刀,实际上是一个吹风机。

今日不管各位女士用的吹风机,仍是男人的刮胡刀,仍是电牙刷,仍是扫地机,里边都藏着一个电动机,但你认识到电动机的存在吗?不存在。会有人买个电动机回来接上电说:来,给我转个 27000 转吗?也不会。

实际上你买了一个电动机你要装上轮子才干变成轿车,装上扇叶才干变成鼓风机,装上齿轮才干变成传送带,大模型这个东西挺庸俗的,它便是个电动机。

我今日讲的便是要把大模型拉下神坛,不供着它,不顶礼膜拜,如同干大模型就活跃巨大,其实这东西要变的很庸俗。

当年 IBM 做出超级电脑之后,就跟今日的超算相同,说全国际五台就够了,终究超算真实没有掀起信息革新,掀起信息革新的是谁?是 PC。PC 最早从苹果 2 开端算,到 IBM PC 到微软的成功,把这玩意做得跟玩具似的,今日咱们做的服务器端都是 PC,PC 进入了百行千业,进入了千家万户,这才干掀起工业革新。

AI 能不能推翻?必定终究是能推翻的,由于啥都能推翻,你把东西做的比他人廉价许多也能推翻,你能在晚上不需求开仓储,在网上直播带货,一分钟能卖出 1 个亿的东西也叫推翻。

可是从 AI 来讲,我的主张是不要一上来就想着推翻这个、推翻那个,先想想赋能,便是当你有了一个电动机之后,怎样替代本来的蒸汽机,怎样替代本来手艺干的作业,能不能润物细无声的嵌入到运用场景中,不是不行以做新东西,但这儿边最大的时机是有了 AI 之后,有了出产力进步、出产力赋能东西,许多产品能够重做一遍。

走运用之路,我觉得要对大模型的才干从头做一个区分,由于我觉得曩昔两年里边,咱们都被自己误导了,你看各公司一说大模型,出来讲事例,都是讲它的两层根本才干,都是讲写诗作画写文章、阅览了解、翻译、编程,实际上我把这个界说成它的根本才干。

比方说大模型的 AIGC 这面,有可灵、海螺、vidu、即梦,这两天 Sora 出来了不过没有那么冷艳,这些模型是落在创作和营销才干。可是多模态才干值得咱们重视,这两天 Gemini 2.0 它把多模态才干展示到极致,可是多模态才干和 AIGC 仍是要区分隔,由于两个用途不相同,所以要结合场景,而不是抽象地说能够处理图象、视频、声响是多模态,本来我以为能发生视频图画也是多模态,这个概念不相同,我觉得了解十分重要,由于它是让大言语模型从看见、看懂到了解的重要不同。

事务才干的对接也至关重要,特别是怎样与企业的中心事务相结合。比方,情报剖析、常识办理、事务主动化以及安排协作等,这些才干曩昔常常被忽视,但它们正是人工智能能够进步企业出产力的要害范畴。特别是在主动驾驶这种新式产业里边,具身智能这些立异才干,实际上供给了新的作业范式。

还有一个场景是 AI for Science,在座诸位也有人在这个范畴能够考虑一下,未来科学研讨或许有一些专业模型来辅佐,AlphaFold 便是是一个比方。

所以假如有人在这个基础上把模型才干分得层次更细,分得更多是没有问题,用户购买的并不是东西自身,而是一个实在能够处理问题的成果。所以大模型曩昔两年里边,咱们自嗨太多了,不断说这个才干那个才干,今日要搭一个桥,而是要看这些才干究竟给企业、用户创造什么价值。

六个方向里,有哪些时机?

我大约列了六大运用方向,看看咱们是不是能够在这六大方向中寻觅创业和立异的时机。

第一是人人智能。

我一向以为 AI 是人类有史以来创造最重要的出产力东西,除了对企业进步出产力之外,对个人来说,我觉得它能够解锁你许多不具备的才干,乃至让咱们个人具有超才干,比方说不会做音乐的也能发生音乐,不会作画的也能把主意变成海报,所以大模型要进步每个人的出产力,打造个别的超才干,这儿边有许多时机。

大模型在第一步,尽管咱们都想着做东西的人挺吃亏的,赚东西的钱还不如做社区的,做社区有网络效应,东西的话用完就走,可是大模型首要东西特点仍是十分重的。所以在这一块,咱们能够想一想,当然不要仅仅去卖课,卖课是不成功的方法。

360 在这做的是纳米 AI 查找和 AI 作业大全,是瞄准了协助个人来进步个人获取信息、剖析信息的才干,这一块有许多时机,就看能不能深化研讨,人还有哪些才干能够被 AI 去进步。

第二个方向:从万物互联走向万物智能。万物互联的观念,IoT 的概念现已很成熟了。现在 AI 的开展从云端到终端,从云端到边际,模型越来越小,现在像苹果手机的战略是手机上有个小模型跟云端模型星座,荣耀的照明说,手机算力、芯片开展到 2027 年手机上上个百亿的模型是没有问题的。除了轿车,下一年今后没有大模型上车的车或许卖不掉了,联想也在给 PC 上模型。

咱们想的更广一点,一切的智能硬件假如都跟大模型发生联系,可是不是把一个通用大模型连上来,而是在一切智能硬件上有一个专业模型添加一两个才干会怎样样?

比方说半夜里肚子饿了,翻开冰箱找瓶啤酒,冰箱能够跟你说话,它看见你,它告知你太胖了,不要在晚上再喝啤酒了,并且它会主动给你的监护人发个短信。

那有人老说要做新的硬件,AI Pin 咱们都知道比较失利了,他们弄巧成拙非要带一个投影仪,还要做手势,手机被证明是人类比较能承受的随身携带的物品。还有戒指、手表、眼镜,Meta 最近做了一个眼镜,也是蛮成功的,我也预备推出咱们的纳米眼镜,这不是打趣,由于苹果做 Vision Pro,老是想做 VR 和 AR,这个搞得眼镜太重,功用太多。可是咱们发现假如眼镜跟 AI 查找结合起来和摄影结合起来,变成轻量级的,听说 Meta 眼镜卖了好几百万副眼镜了。在大模型的推进下,元世界、虚拟实际有或许愿望成真,咱们想想智能硬件是不是会有时机?

第三个时机是,在我国做作业要顺势而为,国家很重要的战略是传统产业数字化,有一个词叫数转智改,也是新质出产力,大模型特别合适进步打造新质出产力。

怎样协助企业数转智改?大模型能够发挥很重要的效果。现在通用大模型必定不合适给企业去用,我问过许多企业家和政府领导,通用大模型由于并不了解内部事务,所以说的话比较泛泛而言,并且这种谈天你们假如做过企业级运用就知道,这种 Coplot 的方法是企业最不能承受的。假如你们做过企业级运用就知道天天请一个谈天机器人回去,头三天还能有爱好聊,长时刻对作业功率进步没有含义的。

在企业内部我也讲不要愿望用一个大模型处理一切的问题,企业内部将来必定是多个事务智能体的组合,背面是多个事务大模型,这现在是最大的商场,并且这个商场需求你沉到职业里,沉到客户里,,由于很难有通用的处理计划,这儿边供给了比 SaaS 更大的时机。

第四个方向是未来和新式产业。

比方说生物医药、具身智能(人形机器人)、低空经济(无人机),无人机是推翻式的立异,还有便是智能网联车的主动驾驶到无人驾驶。这个职业里边假如不必大模型,这些职业都做不起来,由于咱们想想为什么最近特斯拉 FSD 能够完结端到端的主动驾驶,端到端有两个解说,咱们学术上是说依据练习学习的办法替代了依据规矩的办法,用一个黑盒子体系,从输入到输出。也有人把它解说为从一个泊车位到另一个泊车位,不知道哪个解说更好。

第五个时机是打造科研新范式。大模型作业范式很简略,便是给我好的比方,经过满意学习之后就能发生触类旁通的出现了解,今后就能仿照;而依据规矩,我从前跟做主动驾驶的人聊过,他们大约主动驾驶的规矩,像萝卜快跑便是依据规矩做的,听说规矩有几十万条,所以你要想吓唬一个萝卜快跑,只需把自己化装成熊猫在马路上过,我打赌百度必定没有写规矩,假如遇到熊猫在路上是撞上去仍是应该泊车。可是我在学驾照进程中深化领悟到人的泛化才干,不管是否放个纸箱子,仍是放一个塑料墩子,我都能灵敏地绕曩昔。

包含具身阶段没有大模型的加持也是不行能的,本来深圳有一家公司叫优必选,大模型出来之前,它快成玩具公司了,他们机器人主要在体现团体操,可是有了大模型之后,这个公司就迅速地顶风而起,所以新式职业对大模型的学习是十分多的。

AI for Science,我只能说个方向,这个详细我也不明白,可是值得重视,便是它是科研的新范式。

大模型的实质在于对言语、图画、视频和声响的了解,但其中心原理是将练习数据转化为一种序列,称为 Token。尽管「Token」这个词的翻译或许存在歧义,但从实质上来看,假如你能将需求处理的数据转化为 Token 序列,那么就有或许经过猜测下一个 Token 来取得有含义的成果。这也是为什么 AlphaFold 能够成功的原因。它将蛋白质的结构视为一种序列,而人类现已研讨出这些序列的规则,能够作为样本进行学习和微调。接着,AlphaFold 运用 Diffusion 办法随机生成各种或许的结构,并对这些结构进行判别。

这种思路不只能够运用于蛋白质结构猜测,也能够扩展到其他范畴。例如,天气预报、股市猜测、交通剖析,乃至工业范畴中的出产操控,都能够经过将职业数据序列化来进行处理。这时,并不需求依靠大言语模型的言语处理才干,而是要找到一种办法,将职业数据转化为能够进行序列化的方法。一旦数据能被序列化,Transformer 模型就能够用来测验猜测和推理。

自然的周鸿祎:AI 是赋能者,而不是单纯的颠覆者的视图

我从前发过一个关于人类长命的视频,提出人类有或许活到 150 岁。尽管这个观念听起来如同很极点,但美国在医学范畴的观念也支撑这一主意。英伟达的创始人黄仁勋屡次举例说到,人的细胞终究也会以一种序列的方法表达,而人类基因的表达相同能够视为一个序列,乃至新药分子的分子结构也能以序列的办法体现。研讨人员以为,只需能够将某个范畴的内容转化为序列,Transformer 和 Diffusion 等技能就能进行有用的猜测和推理。

在我国,重视这个范畴的人还相对较少。微软研讨院的前院长马维英博士,现在在清华大学专心于医学和生物范畴。我信任,未来会有更多的范畴等待着经过 Transformer 和相似的技能进行改造和立异。

第六个场景,便是安全场景。

为什么要加这个场景?由于我是做安全的。这儿边谈的主要是 AI 安全。在许多场景中都涉及到大模型的运用,AI 的安全性显得尤为重要。趁便提一下,最近 Ilay 提出了一些耸人听闻的观念,他以为未来的智能必定依靠于推理,而推理睬带来不确定性,不确定性会导致错觉,错觉进一步演变为认识。因而,他强调了人工智能安全性的问题。但我个人以为,专业范畴的大模型不太或许发生认识,就像你雇佣一个专业职工,他不太或许会炸毁你的公司事务相同。有超级人工智能才会对人工智能的安全构成终极要挟。通用人工智能方面只需几个问题:

一是数据隐私维护和数据投毒污染的问题;二、注入进犯的问题;三、错觉;四、AIGC发生的虚伪信息问题。

咱们提出的思路是以模制模,用魔法抵挡魔法,用专业安全大模型抵挡安全问题,所以安全问题不是今日要点。

现在,开展专业大模型的中心现已不再是大模型自身,而是找场景。找场景对咱们最大的应战,是要对某个职业、某个事务有深化的了解和了解,假如事务不了解,天天在玩大模型,天天用大模型做一些屠龙之技,在炫技,这个很可怕,再怎样炫,OpenAI 明日发布一个新功用,把技能一下就覆盖了,OpenAI 和这些巨子今日他们最缺的是职业和范畴常识,这在美国也不破例,比方说现在美国有许多创业公司是悄然无声的在做金融的处理计划、医疗的处理计划。

我简略提出四个开展方向,或许说四个「十倍」方针:

一个方向是对上,满意老板和高管的需求,比方说这次张鹏引荐的做面试的一家美国公司,他们两端通吃,他们做了两个范畴,先做人人智能范畴,做了一个做弊东西,你面试的时分能够帮你在旁边提示怎样答复面试官问题。他们又做了一个数转智改的运用场景,协助老板处理怎样使用机器,HR、主管面试个人的问题,所以想想都很美,咱们都用他的软件,机器人面试机器人,但他挣了两份钱。

第二个方向是对下,是面向职工,看职工有什么痛点和刚需?

第三个方向是往内看,企业内部怎样进步自己的功率,内部有什么办理事务流程;

第四个方向是往外看自己的产品和服务体系能否找到企业的卡点,卡点的一个衡量方针是说能不能削减 10 倍的人力、下降 10 倍的本钱、进步 10 倍的功率、进步 10 倍的体会。

我跟河北钢铁企业在谈的时分,谈到集体才智,曩昔你想干、干不了的事,今日大模型精干了;曩昔你想处理、处理不了的困难,今日大模型能处理了,就找这种卡点和堵点,这便是大模型应该发力的当地。所以必定要细分场景,包含要把事务流程拆解的满意细,大模型初期的时分,我至少做了 100 个失利的案件,你们别听今日许多人上来说六小虎接了多少大模型的比方,其实许多项目都难以交给,我也吃过这种亏,刚开端咱们对大模型都极端崇拜,有人来找我说,鸿祎,咱们做个养猪大模型,也会有人说咱们做个钢铁大模型,还有人说做个医疗大模型,你反诘他一个问题,大哥,你要处理什么问题?你把他给问死了,由于都不知道要处理什么问题怎样做?最重要的是必定要细分场景。

举两个比方,河北省的钢铁是最兴旺的,咱们都知道我国的钢铁含量不含河北,河北的钢铁产值不含唐山,唐山的钢铁产值不含迁安,咱们就到迁安去了,他们最开端也说要进步钢铁的出产功率、进步钢铁的质量,咱们都认同这个方针,但他们说要做钢铁大模型,我想没有钢铁大模型,只需细分的场景,所以他们就把钢铁的整个进程列出来了,把流程划成了 142 个场景,分的特别细,这 142 个场景,或许有些场景都能独自训一个大模型出来,或许独自做一个智能体,你要分到这么细的程度才或许处理传统企业数转智改的问题,不然只做一个问答、只做一个 Copilot、只做一个作业,这些通用计划都能够处理他们的问题,假如真的要直接进步出产力就得剖析到这种程度,但这种程度,我觉得巨子一个都干不了,实在太详尽了,OpenAI 也干不了,由于它没有这样的数据和常识。

再举个更简略的事例。这次我在美国见了一家跟王小川做同行的作业,但做法是不相同的,你们能够听听不同,比照一下,觉得是小川的好,仍是这家公司的好,这家公司是我国小伙子兴办的,他们跟斯坦福医疗中心签了一个约,美国治病跟我国治病不相同,我一会要去治病,直接到医院挂个号就行了,我想到斯坦福医学院挂号,人家不给我挂号,说需求你的家庭医师或许社区医师先看过,然后发传真,把你的病况状况介绍给咱们,咱们再预定某一个时刻来治病,他们把这个场景分的很细,发现了三个卡点或许三个堵点:

斯坦福医学院有 100 多人的部队每天收传真,美国现在还在用传统的传真,传真才有法令功率,医师写字是全国际最马虎的,所以看传真的人都很吃力,所以要打电话来回屡次承认才干把你挂号到数据库里,还要给患者打电话预定治病的时刻,患者看完病之后要到保险公司报销,这也是一个应战。

保险公司会拒赔,他们要请很有经历的专家有理有据的写一个为什么我这个病,依据我的治疗进程,写终究能够报销多少,这家公司做了三个 Agent,适当所以三个大模型,第一个是多模态大模型 OCR 辨认传真,现在比人做的好,能够把 100 多人看传真的部队给撤销掉了。

第二个场景是数字人用语音和患者打电话,由于这个打电话不是通用客服,是来回预定时刻。

第三件事,他们把医院里前史上给患者写过的十几个万份给保险公司的报销陈述练习成一个常识模型,人家不是一个通用写作产品,不是说给我写一篇小说,便是专门写怎样给保险公司报销的。

他们就做这三件事,便是一个很了不得的项目,这便是典型的协助传统企业数转智改,为什么医院乐意付钱?医院能算出节约的人力、能算出进步的功率、能算出作业量,这和咱们本来做东西有个最实质的不相同,比方说许多时分企业买了咱们的软件,为啥我国的 SaaS 付费一向做不起来,一个很重要的原因是你的软件有没有也不是特别重要,所以进步功率也很难算。

本来咱们做的软件是什么概念,仍是人的东西,但今日AI在这些要害点上,AI 依据一个大模型,封装出来了 Agent,实际上是一个数字专家,是一个数字职工,彻底能够直接替代人的作业才干,这个企业的付费志愿就比本来进步了许多。

怎样做好专业大模型?

做专业大模型,最重要的有这几个点:

1. 常识办理。许多失利的比方,是由于客户的数字化做的欠好,没有满意多的常识,比方说斯坦福假如收到的一切传真都毁掉掉了,没有曩昔前史的数据做练习,这个事纷歧定能做到,假如曩昔写的保险公司的陈述都没有了,或许也无从练习,所以常识十分重要。

2. 事务大模型打造。这就比较简略了,用通用大模型进行蒸馏变成基座大模型,并且从现在的趋势来看,微调用的越来越少,RAG 用的越来越多。

3. 构建智能体。Agent 就不打开讲了,由于 Agent 曩昔是一个技能辅佐,但今日 Agent 成了咱们今日给企业做做运用的中心诉求,最近我预备把我做的 APP 都改成 Agent,你卖一个 APP 给企业,听起来就像卖了一个软件,软件不值钱,可是我的 APP 全都变成了 Agent 之后,我卖的便是数字人,你雇一个人得 2 万块钱,我这一个月才 1000 块钱,多廉价,价值感立刻就不相同了。

4. 交融作业流。为什么咱们现在谈 Workflow?你们都知道 comfyui,它的功用强壮,便是由于它知道许多节点只能完结单个使命和单个技能,许多时分咱们要把技能组合起来才需求 Workflow,所以 Workflow 会变的很重要,由于没有 Workflow 你就做不出杂乱的智能体,就做不出协作的智能体。

5. 常识办理。咱们要有思想预备,这比训大模型还困难,真到一个企业之后,发现他的常识都是暗常识、浅常识,有些常识藏在大数据里,需求把大数据进行加工,有的常识存在人的脑子里,有的常识存在职工的硬盘里,有的常识存在作业流程中。比方咱们常常说一看你便是新职工,一看这个人便是老职工,为什么?由于他有许多公司潜规矩的常识,怎样把这些常识能够训到你的大模型里去,怎样能收集出来?所以我提出一个概念叫常识捕获,收集都纷歧定收集得到。

6. 事务大模型打造,要做 RAG。

7. 构建智能体。智能体最早是调 API,我问个问题向咱们讨教,最近 Claude 推出 MCP,我的了解是用大模型做一个黑盒子,自己调 API,我觉得这个方法应该不 work,最好的方法仍是应该由 Agent 来调 API,Agent 来调大模型,由 Agent 来做全体的协作,为什么?

由于 Agent 有个很重要的价值,要完结慢考虑才干,这个才干是由 Agent 屡次调一个或调多个大模型,当多个大模型协作的时分,Agent 它担任建议协作并在大模型之间进行有用的调度。

2025 年是 Agent 之年,包含把日常重复性的事务流程构成 Agent,自主性的呼应。

8. 交融作业流。能够以为是 Agent 操作体系,就像今日人会用钉钉、企微,别的我听到上一个 Speaker 讲一人公司、两人公司,我这儿吐槽一下,我以为不行能,别被这种东西忽悠,你们读一读赫拉利的书,智人之所以成功,由于智人是最懂得集体协作的,人必定需求团队协作。

所以咱们企业级的,今日钉钉也好、飞书也好,并不是为 Agent 打造的,仍是为人打造的,这在未来也是一个巨大的方向,适当所以 Agent OS,怎样把 Agent 作业流能够做好,当然我不能泄漏咱们在做。

咱们有一点要向美国的创业者和出资人学习的,他们编的词特别感动企业客户。他们在从头界说 SaaS,SaaS 本来的界说是什么?Software as-a Service,现在他们从头谈了一个新概念,叫Service as-a Software,这就像绕口令相同,什么叫 Service as-a Software 呢?

曩昔有许多事是软件干不了的,或许软件只能起到辅佐东西的效果,比方说看传真,尽管有了传真机,还得有人在读传真,往数据库里录入,写保险公司报销陈述,或许律师给你写个文件,都是人写的,这个商场叫 Service 商场。

美国的 Software 商场大约是 1 万亿美金,可是 Service 人力商场是 10 万亿美金的商场。有了大模型之后,在一个细分的节点上,它能够替代人,或许能够该本来干不了的事,能够处理本来处理不了的困难了,意味着这个 Service 能够用软件来干了,意味着软件从本来 1 万亿美金的商场在往 10 万亿的商场上在腐蚀,这给咱们做软件的人供给了一个 10 倍的时机,从企业级商场到智能软件反扑服务商场。

曩昔咱们交给的是软件,今日直接交给的是才干,换句话说,直接交给的是人力,我觉得未来 APP 还会在,看最近智能手机的演示,Siri 能够直接操作各种 APP,乃至是智能体和 APP 最大的不同,APP 做的再牛,仍是给人用的、是人的辅佐东西,但 Agent 能够自主或许应人类要求独登时完结一个使命,换句话说,曩昔是东西辅佐人创造价值,未来 5-10 年会变成AI直接创造价值,这便是各位最大的时机。

最近网上撒播一个视频是在斯坦福的内部录像,主持人讲了一个故事,我能够把这个故事共享出来作为我的讲演结束。大模型不是中心化云化的电力,大模型是去中心化的电动机。

周鸿祎在极客公园 IF2025 立异大会|图片来历:极客公园

他讲了最早工业革新在电动机替代蒸汽机,用了 30 年,为什么用了 30 年?由于蒸汽机一般的企业很难用得起,所以一个工厂假如有一座蒸汽机,蒸汽机给工厂里一切需求动力的当地都供给动力,可是蒸汽机是经过很长的连杆来输出动力,所以连杆的强度有限,不能太长,工厂的布局是以蒸汽机、锅炉房为中心,来做工厂的布局和事务流程的规划。电动机刚创造之后,老板仅仅把蒸汽机换掉,换等了电动机,功率一点没有进步,也没有发生额定的价值,由于一切的东西都没有改变。

后来经过了 30 年的技能开展,人们的认识和技能才干忽然发现能够把电动机做小,今日小到一个电动牙刷里也是一个电动机,实际上它和小米轿车用的电动机是一个基因开展出来的,可是一个 27000 转繁荣有力,一个便是给你刷牙用。

人们把电动机做小之后、做廉价之后,忽然发现工厂里的动力不需求中心驱动了,变成单元驱动了,一切需求动力的当地装一个自己的电动机就好了,就像我说的,乃至工厂的格式都改变了,工厂能够变成不同的车间、不同的 Location,不同的 Location 之间能够用出产线、流水线连起来,工厂的鼓风机,包含纺织机都有各自的动力。

所以你们想想,假如不是这样的革新,假如咱们家里买一个电动机,这电动机一方面给咱们当电扇用,又给咱们当吹风机用,一会还给我刷牙,还给我刮胡子,能够幻想一下多可怕,买了一个大电动机,啥活都干…… 这样一来,整个工厂的事务流程、办理体系,乃至商业方法都逐渐地发生了改变。

假如这儿把电动机换成大模型,是不是很恰当?咱们干嘛必定要信任用一个 API 也好,或许用一个中心的超级无敌通用的大模型来处理咱们在企业内部不同当地遇到的不同的事务问题呢?

现在大模型的本钱很低,有开源的,有免费的,咱们把每个大模型只干一件作业,就当电扇用,就当传送带用,就当鼓风机用,这种新式的架构是不是代表了大模型将来在企业和在职业内部的运用场景?横竖我是信任的。

告发/反应
友情链接: