AI Inspur记录丨与Liu Zhiyuan的对话:到达AGI并不容易
- 编辑:皇冠APP官方下载 -AI Inspur记录丨与Liu Zhiyuan的对话:到达AGI并不容易
当人工智能浪潮破坏世界时,言语的开放是北京成为具有现代技术大型AI模型领域的战略高地。从Zhiyuan研究所的“觉醒”模型的推出,再到顶级“天使投资人”模型学者,随着人工智能独角兽的越来越多的人工智能独角兽(例如月球,DeepSeek和Zhipu),这个城市不仅融合了边缘的技术,而且还融合了生态学技术。如今,北京正在积极建立“全球资本开源”,大量研发机构和企业正在积极拥抱开放资源,开放资源也渗透到许多行业,例如车辆和机器人。 AIWILL的发展是科学技术的漫长游行。北京新闻AI研究所正在深入采访此AI浪潮的证人和证人,讲述了新的AI竞争模式和故事Behind。 Liu Zhiyuan向记者解释了AI技术发展的历史。北京新闻壳财务记者Lu Yidan的照片。进入2025年,中国的AI(人工智能)处于战略高度,足以与美国竞争。今年,Liu Zhiyuan即将前往已经花了将近20年的AI。五年前,他是Tsinghua University的副教授,壁面智能的联合创始人兼首席科学家,他培训了中国预培训模型的第一个版本,他和他和Zhiyuan Research Institute发布的“ Hua Dao 2.0”成为了中国的第一个模型。那个时候,辩论的重点是大型模型的研发应该是“从大型模型到大型模型”。 2023年,Chatgpt打破了圈子,并宣布了“完善大型型号”的正确方法。今天,在处理DeepSeek的知名度时,Liu Zhiyuan说:“ 2024年,许多投资者问我,'您认为CHINA的AI即将接近美国,更远,更远,我的回答始终越来越近。从2023年到现在的大型中国的企业家,许多“小龙”和“小老虎”在中国出现了,大型模型已经盛开。新闻AI研究所,Liu Zhiyuan确信AI企业家的最终目的是追求AGI(GenERAL人工智能),但该过程并不顺利,并提醒需要更多耐心的市场:投资者投资“六个小”不正确的投资。中国难道不允许有10多种洞察力吗?您为什么不等待Deptseek的潜在增长?解释·成长和捕获。北京新闻AI研究所:您什么时候开始学习AI? AI大语言模型技术何时“您会第一次感到惊讶”? Liu Zhiyuan:当我在2006年毕业时,我开始从事自然语言处理研究。当时,该语言的自然处理仍在统计研究中,而深入研究的时期尚未到来。从2011年到2012年,我的老师Sun Maosong教授申请了973科学技术部。这个重大研究项目的资金价值已达到数千万元人民币,这是中国最早的特殊项目之一在自然语言处理方向上实现。如果有一个时间点对中国大型人工智能模型的发展产生深远影响,那么这就是其中之一。 Sun老师认为,由于您想进行5年的项目,因此您应该找到一个更加剪裁和向前的方向。为了确定该基金的特定用途,他组织了多个部门,包括北京大学,哈尔滨理工学院,中国科学技术自动化研究所,百度以及一半的领先学者在该国进行讨论的自然语言处理领域,并最终设定了一个指导:深入研究:深入研究。在该项目成功申请之后,2013年,Word2Vec方法在国外发布。换句话说,该词2VEC首先发现这些单词可以由向量表示。这是在语言的自然处理中应用-Depth研究的应用中的里程碑成功,也是E对我的深入研究“第一震惊”。因此,我们立即开始跟上。当时,距离我们国外的顶级距离差不多三到四年。实际上,学术界开始认识到一项大规模的深入研究,并于2015年达成共识,比2013年晚了两三年。但是,一般而言,我们讲话了,我们被抓到并被抓住了。北京新闻AI研究所:公众知道大型语言模型主要是在Chatgpt出现之后。学术界的“ ChatGpt时刻”是什么?您做了什么来满足新技术? Liu Zhiyuan:Chatgpt的出现确实没有给我们带来很多“震惊”,因为我们总是关注这个地方。在此之前,有两个用于技术突破的Morenodes。 2018年,Google发布了BERT模型,该模型总体上从重点完成了过渡。过去,我们必须为每个任务设计和准备数据,而模型只能执行此任务。伯特应用程序之后耳朵,该模型可以知道文本的所有知识,然后是完成更多任务的好语气。许多国内团队发现了此事的重要性。从2018年开始,我们决定将重点放在预培训的模型研究上,鼓励团队成员放弃任务所有权的狭窄方向,并专注于开发基本模型。到2018年底,该团队推出了第一个模型增强了预培训的知识,名为“ Ernie”,并于2019年初在ACL(国际计算语言学学会)提交了Presearch的结果。有趣的是,几乎同时,BIADU还发布了一种预先培训的模型,称为“ Ernie”。 (注意:Ernie和Bert都是美国卡通“芝麻街”中的角色)。这种团结吸引了ACL审稿人主席的注意,他发送了一封电子邮件,询问我们是否有联系,并且团队是否知道百度的工作。我们清楚地表明,我们在百度没有合作,而且我们没有知识其他政党研究的DGE。最终,该论文被接受,该论文成为了实践前模型领域中最受欢迎的研究之一。在2020年,GPT-3释放了,从小模型到大型模型完成了过渡。 Openai使用了10,000张卡片(注:GPU),这使我们能够看到间隔,然后出生时“醒来”了那个大型模型。当Chatgpt出现时,我们认为中国和海外之间的差距将近一年。直到Openai于2024年9月发布O1模型之前,我们认为该空间在半年内狭窄,因为DeepSeek在O1发起深思熟虑思考后半年后成功出现。对要点的调查,也不是著名或金钱,会见“天使投资者”。北京新闻AI研究所:OpenAI使用数千张卡来培训GPT-3。当时中国是否有这样的计算能力来源?如何在计算强度中解决“差距”? Liu Zhiyuan:出现GPT-3之后,我们感到如果我们不立即跟进,那么空间将越来越大。但是当时,即使是中国的一线球队也相对有限。当发布GPT-3时,该团队研究了只能使用一台机器,最多可以使用一台或三张GPU卡进行培训。那时,我在北京齐尤恩研究所担任年轻科学家。这是北京建立的新研发机构。它具有几个资源优势。在黄·特琼总统(Huang Tiejun)总统之后,我提交了一份报告,该报告详细介绍了大型模型领域发展的趋势。我希望在Zhiyuan支持下,我可以尝试以更大的参数量表来训练模型。幸运的是,Zhiyuan支持机制是非常适应的能力。几天后,它批准了该申请和资金来支持它。最后,它购买了10台配备了A100 GPU的机器,总投资数百万元。在decembe中使用垫子R 2020 R,我们的团队培训了CPM的第一版(中国预培训模型),这也使我有机会参加大型模型浪潮。北京新闻AI研究所:媒体将Zhiyuan研究所视为中国的“ Whampoa Morcial Academy”。您如何找到其在国内AI开发中的作用? Liu Zhiyuan:Zhiyuan研究所是由北京市长在2018年赞助的新研发机构。其主席最初是从该行业建立了Zhang Honghjiang的。该模型非常新颖。它期待这些概念。这个基本是使用新方法来促进人工智能的加速发展。研究所成立后,Zhiyuan学者项目已被提升,这与历史上的任何国内项目都不同。它促进了其余领导人的灵感,以自由探索,以增加原始改变科学的可能性。因此,t在“小型同行评论”之后,我们在对中国人工智能研究的每个重要方向上选择了其余学者的代表。与传统的科学机构不同,在类似的投资领域,Zhiyuan已成为一群领先的人工智能学者的“天使投资者”,该学者支持以更好和灵活的方式探索未来的科学研究。 This equates to "either name or money" to young scientists "it has been supported for three years. Compared to complex operations such as writing books, defenses and analysis commonly found in other scientific projects, thisof the type of project based on trust in people and the first support of China as a unit is very advanted. In 2021, Liu Zhiyuan was launching Zhiyuan's "intellectual 1.0". Around the "scope" of large factories and beginning in the local成熟技术的领域,尤其是在一些热产品出现之后,它肯定会推动开发田野的访问进入“快车道”。这是一个逐步加速的过程,我还可以看到今年更快。就我个人而言,在过去十年中,我的感受确实没有太大影响,因为我们的愿景始终比AI技术领先于工作,但是我们以前已经领先于学校。在2018年之后,我们认为AI具有一定程度的成熟度,可以为社会提供大量的应用,而NG研发也开始需要更强大的工程工程性能。在这种情况下,我们应该使用科学和技术企业家精神与做事和研究的结合,以领先于技术,并更快地前进。任何创造人类社会的人都是遥远的技术发展。例如,自1960年以来,信息采集技术已暴露,并且对于近2000次,该技术逐渐增长并且具有商业价值,并且对Hum有很大的好处整个社会的种族,导致雅虎和Google等公司。如果我们不遵循步伐,并以初创企业的形式或行业和研究的整合处于正确的位置,那么我们将无法真正促进技术发展。我们需要做的就是始终领先科学和技术变革。必需的我们的边界站在我们所在的任何地方。北京新闻AI研究所:与具有大型参数(例如DeepSeek)的大型模型相比,墙的智能集中在“小而美丽”的端端模型上。为什么这是一个轻微的差异 - 这种发展的方向以及它的目标是什么? Liu Zhiyuan:我的目标是在我们的模型中安装更多智能终端,而AI企业家的最终目标肯定会急于AGI(通用人工智能)。对于墙面,我们首先设置了英文名称“最佳模型”,也就是说,我们希望制作最佳模型。中文名称应使用M和B作为首字母,并且我们认为,墙壁的便利性与人工智能的目的更加一致,具有相同的科幻行为和对最高水平发展的感觉人的隐喻。促进了最终目标之后,您需要清楚,准确地预测并与自己的每一场战斗进行战斗。对于企业家来说,“旷日持久的战争”思想的本质是一个非常有价值的参考,因为朝着AGI本身奔跑也是“受保护的战争”。在此过程中,敌人不确定。您应该自己PK,与您的朋友一起使用PK,而PK则充满了不确定性。我们现在仍然很虚弱。我们怎么能变得更强大,而不是在AGI的漫长游行中落入最终成功?市场本身是巨大的,有些公司非常开放。在这种情况下,作为一家成立公司,当资源受到限制并且不可能拥有过多的一般性时,有必要在战略上进行fiND当地的战场,拥有福利的亲戚,并通过移动战,当地的上级部队专注于正确的时间和战场,并进行了一场良好的战斗。只有通过稳定赢得关键的战斗,我们才能占据基地。处理墙壁具有长期的视角,但应在战略上和阶段进行实施,尤其是避免了当前的主要制造商的“范围”,并从当地有用的领域逐步进行。北京新闻AI研究所:您如何看待快速发展人工智能和相应监管系统的风险和挑战?数据保护的优势是否是末端模型的定位,这是面部墙壁上端侧模型开发的机会之一? Liu Zhiyuan:人工智能和安全管理的快速发展是辅助的,需要快速,稳定的平衡。 Ang Mga Artipisyal na praktikal na katalinuhan ay hindi lAmang Dapat Gawing Muli Ang Kanilang Mga Pagsisikap na Komprehensibong itaguyod ang tipisyal na makabagagong teknolohiya ng intelektwal,pag -unlad ng Industriya,在pagpapalakas ng in Industriya -unlad sa parehong oras upang upang maisulong ang malusog在maayos na pag -unlad ng Artipisyal na katalinuhan sa sa isang isang kapaki -pakinabang,ligtas,ligtas,patas na direksyon。端侧大型模型位于最接近用户,所有数据计算数据都是本地的,它极大地保护了用户的隐私。连通性和弱网络服务保持稳定,并可能对人们的日常需求做出更敏感,高效和谨慎的态度。尤其是在常见情况下,例如汽车座舱,实时生成的大量声音,照片和视频流数据在车辆侧面进行当地处理,这需要确保不会发送汽车数据,并且用户更喜欢具有高个人隐私和DA的解决方案TA安全性。通往AGI的道路并不顺利,应该持有资本和市场的不信任。北京新闻AI研究所:2024年,除了“ AI六只老虎”之外,表面上的情报曾与DeepSeek一起进入“ 6+2”。您如何看待DeepSeek-R1今年春天的受欢迎程度? Liu Zhiyuan:DeepSeek的启示是面对计算能力限制,通过更改算法和良好的培训,有一些方法可以制作更多的模型,这是其价值。 2024年,许多投资者问我:“您认为中国的人工智能正在接近美国吗?”我的答案总是很接近,但是许多人仍然有担忧,认为一旦中国的计算能力是“ de -boteng”,它就没有追赶。 DeepSeek的出现是一个非常强大的信号,使人们可以看到中国的人工智能技术在世界舞台上占有一席之地。将来,AI开发的两个主要主题。一个是更高的能量EFFICITION,这实际上是密集过程(增加的密度),训练更好的大型模型,成本较低;其他人更强大,越来越聪明。将来的两个主要方向与每个方向接触,并一起向前迈进。去年,我们追求更高的密度模式。我们需要做的就是继续改善模型制造过程,并根据稠密定律继续提高模型能力的密度,并追求更陡峭的模型增长曲线。我们必须以这种方式实现模型的质量开发,以使模型在市场上具有竞争力。北京新闻AI研究所:当DeepSeek变得流行时,许多AI公司改变了其发展方向,一些声音问投资者“为什么不投资DeepSeek”。您如何看待它? Liu Zhiyuan:DeepSeek的出现是一个考验。如果您认为大型模型不是泡沫,为什么当槽发生时要出来呢?实际上是槽保持那些在大型模型中具有真正真实性的人。实施AGI路径并不容易。这是一场技术革命。这意味着我们不仅会遇到技术挑战,而且还存在各种现实的紧张局势。团队可以突然进行一年的发展,或者在两年内可能不会做出太多发展。目前,如果资本和市场的不信任可以受到限制,并且如果有战略决心,那将是对团队的考验。在2000年,互联网非常受欢迎,但最终在互联网上出现了一个泡沫,导致计算机部门的注册表标记比近10年来许多其他部门都要糟。每个人都认为这个行业是“没有未来”,但是中国有许多互联网巨头只有在B的互联网冬季之后才增长。中国大型模型行业的原因可以很好地取决于真正相信AGI的人,相信自己的工作价值,而不是轻松放弃。在历史悠久的河流中,通常很难做正确的事情。北京新闻AI研究所:DeepSeek的创始人Liang Wenfeng从事投资数量。有人认为,与其他初创公司相比,DeepSeek本身不是“不足的钱”。这是成功的主要因素吗? Liu Zhiyuan:这确实反映了我们国家今天要解决的一些问题:首先,他具有理想主义和长期AGI技术思想。其次,他并不缺钱,他可以在不被打扰的情况下做出更大的决定做事。考虑到同样的事情,他可以做得很好。现在,世界上大多数人都有金钱或技术,这是风险投资的需求。我认为DeepSeek对我们来说最大的表现是上述两个的整合将产生很棒的“化学反应”。如果一家成立公司在收到资金后面临太阳现实的问题,那么显然“无法接管”该州。 hOW确实与更好的资源和技术相匹配也是我们今天面临的问题。相比之下,美国科学和技术的生态系统可能更耐心。投资“ Liu Xiaohu”但未投资于Deptseek的投资者可能不一定是一个错误。中国不允许超过10个洞察力吗?您为什么不等待Deptseek增长的潜力?有时SMR。卢Xun说:“在要求出现天才之前,应该首先要求养育天才的人。”的确,我出生时我也是上帝。首先哭泣是一首好诗。记者联系电子邮件:[email protected]北京新闻壳牌财务记者Luo Yidan编辑Wang Jinyu校对Jia ning