世界今日讯!AI 基础软件,在大模型时代讲出新故事

2023-06-21 15:33:28 来源:ZAKER科技 分享到:
来源:猎云精选;文 / 孙媛

大模型热潮,让多家企业冲在 AI 产业底座的路上。


【资料图】

从交换机到高端 AI 服务器,再到云计算和数据中心都进入新增长周期。从 1 到 10 掀起 " 千模大战 " 的 AI 革命,将首先在软件和应用领域展开。

其中,算法作为实现 AI 功能的关键,基础软件为其提供运行的平台和工具。随着算力性能逐渐同质化和标准化,数据的差异性和企业需求的个性化逐渐加大,"AI 基础软件 " 作为模型训练效率和算力使用效率的决定性因素,地位更加凸显。

在企业迫切寻求生成式 AI 应用的加速工具和服务的需求下,一边 NVIDIA AI Enterprise 软件套件和 Azure 机器学习相结合,供开发者构建、部署和管理大型语言模型的 AI 应用;另一边在产业起跑发令枪尚未响起之时,有前瞻性的国内 AI 基础软件玩家也开始蠢蠢欲动。

沿着 " 把数据变成模型,让模型变简单,让模型真正用起来 " 的轴线发展,萌芽于硅谷车库,由两位前微软工程师创办于 2013 年的九章云极 DataCanvas,经历过去十年随着 AI 技术的不断普及和深入应用后,在这次大模型 moment 的爆燃之下,也欲发起新动作。

微软工程师回国创业,入局数据科学平台

作为 AI 赛道的早期入局者,九章云极 DataCanvas 背后站着两个男人:方磊和尚明栋。

两人在美国待了 10 年,不仅是美国雪城大学攻读计算机工程硕士时的同窗好友,后又都加入微软工作。2008 年,微软从各个团队中,抽取精明强将,组成了类 startup 的团队,晚亚马逊 2 年冲入云计算,方磊跟尚明栋便是其中之二。

彼时,身处内部,两人从工程师角度看到了很多趋势,比如早期微软只提供 PaaS 服务,后被市场教育,又变成了提供 SaaS 和 PaaS 服务。在大厂率先试错的过程中,2011 年,云上收入增长迅速,多家企业规模量级发生变化。

尚明栋观察到,一些传统的大公司,开始成批量把算力往云上去迁移,验证了当初杰夫贝索斯对云建设的初衷。

" 一开始有人嘲笑说云建设就是弄一堆 RDC 的机房,但贝索斯的愿景是以后接管所有企业的 IT,从底层计算存储一直到上层数据能力建设等各种基础能力的建设。企业不需要再有一个 IT 团队去维护,以非常低的成本就形成一套很复杂、高可用、高并发的架构。"

2013 年前后,美国的数据科学平台创业迎来爆发期,加之,公有云的技术环境形成,促使新一代数据和人工智能(Data AI)的公司不断孵化出来 ....Databricks、Snowflake 等一批后来崛起为头部的公司大都是从这个时候起步。

方磊和尚明栋顺势而为,决定回国在数据科学平台领域创业,九章云极 DataCanvas 由此成为国内最早入局自动化数据科学平台的供应商。

2014 年,方磊给投资人的邮件中表示:容器技术自 2012 年出现后,给分析行业带来了很大的改变,容器化的方式统一了分析流程的运行基础。而且,与容器结合后,机器学习、深度学习等不再只是在上层增光添彩的小工具,而成为了标准化的基础设施。

同年,这一创业设想便拿到了亚杰天使基金的天使轮投资。

聚焦 "AI 基础软件 " 扩大版图,超 20 家资本竞相押注

尚明栋也深知 AI 基础软件更清晰的定位以及上下游的合作,往往更适用于一个相对来说比较成熟的生态分工,绝非一蹴而就。

在花了两年时间打磨 DataCanvas 数据科学平台后,尚明栋意识到要把产品变成商品,需要对市场需求精准洞察,而技术创业的背景早期让其在市场化上也走过一些弯路。想要在国内把数据和算法变成生意,从有数据处理需求的大型企业入手成为了解法。

尚明栋坦言,模型作为数据资产的一部分,从大趋势上看,数据产生、能力构建是一个持续建设的过程,信息化能力建设最早的行业一定相对来说数据更刚需和密集。

彼时,金融行业的信息化程度远高于其他行业,银行是当时国内 IT 预算最高的企业之一,亦成为了九章云极 DataCanvas 瞄准金融行业的最先切入点。时至今日,中国前一百家银行里,九章云极 DataCanvas 客户占比超 50 家,验证了其 AI 创业以 "business" 的核心。

商业化验证的同时,为解决企业在进行数据分析时面临的 AI 建模难度门槛过高、以及 AI 推理等问题,九章云极 DataCanvas 也不断完善产品版图。

在 " 人工智能基础软件 " 的定位下,公司不仅通过 AutoML 自动机器学习、AutoDL 自动深度学习和 ModelOps 提供模型运行的全生命周期,更通过其研发的 HSAP 数据库 DingoDB 落地 Data-Centric AI。

此外,九章云极 DataCanvas 从 DAT 自动机器学习软件、DingoDB 实时交互式分析数据库,到去年 7 月发布的 YLearn 因果学习软件,不断以开源重器刷新了业界对开源基础软件的期望。后者作为全球首款一站式处理因果学习完整流程的开源算法工具包,填补了可信 AI、可解释 AI 高性能基础软件的市场空白,而这也正是推动 AI 技术实现从 " 预测 " 到 " 决策 " 的规模化应用的重要工具。

尚明栋表示,AI 基础软件不光是一个基础软件,还面向国内 toB 的生态合作。随着众多厂商协作产生的分工细化,在 toB 生态下,面对行业数据、结构的不同,企业更需要考虑在某一个能力层里进行长期的可复用、标准化。

这其中,越是偏底层的能力,他认为越应该参与到开源生态中,通过更多人适配变成整个标准化生态分工里的一环。

" 从这一点上来说,我们尊重且积极参与到开放生态,会开源一些比较底层的计算框架,而偏上面的行业应用,甚至是交互式的应用工具链,会更支持企业化特性。" 尚明栋表示,九章云极 DataCanvas 会保持对开源生态的兼容,处于中间层的位置,向上更靠近应用,向下更靠近底层。

据了解,九章云极 DataCanvas 软件产品收入占六成以上,除在金融行业客户渗透率不断提高外,其在通信、工业制造、政府、交通等多行业均有标杆客户落地。

10 年间,九章云极 DataCanvas 加速狂奔,资本的橄榄枝也接连不断。

去年 9 月,九章云极 DataCanvas 完成龙门资本领投的 C+ 轮融资,至此,已在 9 轮融资中获得超 20 家机构押注,其中中关村发展前沿基金、领沨资本、红点中国、赛富投资基金、襄禾资本等知名机构更是多轮加持。

以 " 大 + 小 " 方式,形成模型训练新范式

在技术快速发展和行业生态变迁下,如果说过去的产品矩阵是九章云极 DataCanvas 针对企业现有能力来进行伴生式的成长,那么大模型则是九章云极 DataCanvas 的诗和远方。

近两年,在跟规模体量特别大的客户沟通并构建大规模深度学习的分布式训练框架时,尚明栋就感受到面向未来的非结构化数据越来越多,只不过业内尚无大规模需求涌现。

而这些早期的个别需求让他在训练模型时,注意到随着模型由小变大,大模型训练成本高甚至可能还会进入到空转状态,形成大量成本浪费,故而需要一面训练,一面监控,一面动态调整训练参数,让其持续进入到收敛态。

尚明栋坦言,自 2019 年起,团队就开始挑可能通过长期投入来形成核心壁垒的点,作为大模型的投入重心。

在他看来,过去中小模型解决的是场景,现在大模型替代的是分工和角色。想让企业更认可大模型的价值,一要用大模型的能力,给企业带来更多收益,二要为企业节省更多人力成本。简而言之就是实现客户一些原先不能的,或者是原先效果不够好的能力,在能力建设和业务结合时做好开源节流。

基于这样的逻辑,九章云极 DataCanvas 将与行业生态结合得较紧密的需大量成本消耗的环节,作为可能被大模型所替代和驱动的目标。

当下,大模型虽表现优异,但对于各行业使用者来说,实际应用于业务场景仍然存在较高的技术和成本门槛。模型的参数标准并不统一,相对于参数级,模型的效果且是否能够支持快速迭代对于企业客户实际应用来说更为重要。客户能够在一个白盒大模型基础上快速地、低成本地微调和迭代出客制化的小模型,才能高效地实现丰富场景的大模型应用。而这正是 AI 基础软件工具链的重要性。

尚明栋表示,大模型未来可能和中小模型更趋同化,而大模型和小模型的融合使用,大模型的小型化,或者说以大模型为底座的小型化微调,也是一种趋势,能够以低廉的成本解决大量的问题。AI 基础软件通过大模型 + 小模型的方式,正形成模型训练新范式。

他指出,不管是大模型还是小模型,本质上都是模型,实际就是数据的浓缩,包含价值、逻辑密度。数据不开放,必然要搬运能力,而且是大模型所需的整个能力栈。

而通过过去啃下的技术 " 硬骨头 ",使得九章云极 DataCanvas 在大模型的落地和应用里,能快速找到能力组合的战略要点,打造更标准化的大模型工具链:不仅会在支持现有框架下,把构建大模型的能力引入行业的边界里去,而且还会给行业提供能力闭环。

" 作为 AI 生态链中基础软件环节的能力提供者,过去 10 年我们一直在验证从模型构建到模型推理生产化,甚至到后期的模型管理,形成一个基于以模型全生命周期作为起点和终点来进行的能力建设的闭环,来对行业产生价值,让客户为能力买单。"

而这样的闭环在大模型构建下,尚明栋预测会有新的能力建设随新的大闭环而产生。

在他看来,大模型很像新时代的制造业,大家在一个流水线上,下游负责算力、更底层的一些计算框架,九章云极 DataCanvas 负责好基础软件,模型的完整生命周期的构建和推理,并赋能于后面的应用,是一个更面向产业的闭环。

而其中,相较于专业能力分工更细致化,有前瞻性技术和能力构建的头部客户,真正进行大规模变现和赋能的是更偏向于最终应用的腰部企业,需要九章云极 DataCanvas 从基础软件往应用侧提供一部分服务,去把最后这一公里补齐。其透露,目前大模型方面已经开始有付费客户。

据 IDC 预测,到 2026 年,大规模基础模型将成为大型供应商提供的标准行业实用程序。随着各大厂商更加投入到底层基础软件的建设中,在时代推动和产业带动下,以九章云极 DataCanvas 为代表的 AI 基础软件公司又将有哪些变与不变,让我们拭目以待。

标签:

世界今日讯!AI 基础软件,在大模型时代讲出新故事

来源:ZAKER科技 2023-06-21 15:33:28

windows7硬件配置要求什么以上硬盘空间_windows7 硬件要求

来源:互联网 2023-06-21 15:08:53

安顺市委组织部相关负责同志就《贵州航空产业城专项人才政策若干措施(试行)》答记者问

来源:天眼新闻 2023-06-21 14:52:09

秘鲁新能源汽车市场份额仍处较低水平-世界快讯

来源:懂车帝 2023-06-21 14:58:47

全国铁路7月1日起实行新的列车运行图_实时焦点

来源:中国城市报 2023-06-21 14:50:01

2023贵州毕节市纳雍县考调纳雍县第一中学缺科教师笔试成绩公布有关事宜公告

来源:纳雍县人民政府 2023-06-21 14:40:40

临沧溜坡路的车祸是什么车祸

来源:法师兄 2023-06-21 14:26:25

罗紫琳和俄罗斯富翁(罗紫琳)|世界热门

来源:互联网 2023-06-21 14:12:38

成都罗盘村:乡村振兴文化先行的创意实践

来源:金台资讯 2023-06-21 14:18:01

cad布局怎么画图框? CAD块运用–图框制作-世界聚看点

来源:百科 2023-06-21 14:05:19

黄陵矿业二号煤矿以“精准”培训为出发点 切实提高员工业务操作水平和综合素质

来源:东方资讯 2023-06-21 13:34:36

阳煤化工:6月20日融资买入147.49万元,融资融券余额3.81亿元 当前短讯

来源:证券之星 2023-06-21 13:38:49

乘联会秘书长崔东树:新能源汽车购置税减免新政长期利好新能源市场 预期明年增速预期将更乐观_当前短讯

来源:金融界 2023-06-21 13:00:17

加拿大银行监管机构上调资本金要求以应对风险上升

来源:36氪 2023-06-21 11:56:29

坐标上海普陀区,娃小升初的时候,也试过鸡娃,实在卷不动_全球微动态

来源:观察网 2023-06-21 11:35:08

每日动态!李磊社媒晒为国出场照片,高准翼留言:棒死了

来源:互联网 2023-06-21 11:18:09

闽南话在线同声翻译(闽南语同声翻译)

来源:互联网 2023-06-21 11:22:41

【天天新要闻】【网络中国节·端午】厦门市市场监督管理局:抽检38批次粽子全部合格

来源:海西晨报 2023-06-21 11:00:17

环球热点!“童年不散场,最忆是青幼”——合肥市青阳路幼儿园开展大班毕业典礼活动

来源:安青网 2023-06-20 17:04:16

世界新消息丨理想汽车2024产品专员(销售)暑期实习招聘

来源:本地宝 2023-06-20 16:37:02

【世界速看料】猿题库如何退出学校 操作方法介绍

来源:历趣 2023-06-20 16:07:38

他们“化身”快递员,解锁关爱新就业群体新模式 天天时讯

来源:荆楚网 ​(湖北日报网) 2023-06-20 15:35:59

梅西哪个俱乐部球队最多_梅西哪个俱乐部球队

来源:互联网 2023-06-20 15:00:31

甘肃省人民代表大会常务委员会免职名单|每日资讯

来源:每日甘肃网-甘肃日报 2023-06-20 14:46:30

实时:老挝美女嫁大11岁广西光棍,生活幸福,姐妹眼红:我也想嫁中国人

来源:探索的智士 2023-06-20 13:56:51

环球速读:增加耕地不能做表面文章

来源:经济日报 2023-06-20 12:55:44

第二十届中国住博会在京举办 科技赋能建筑业高质量发展 通讯

来源:新华网 2023-06-20 12:25:51

环球播报:舞蹈老师点赞小s否认吸毒帖子 此前两人舞蹈视频引热议

来源:凤凰网 2023-06-20 12:00:38

多肉植物种植方法(多肉植物种植方法介绍)|世界新消息

来源:互联网 2023-06-20 11:18:05

【世界报资讯】恒生电子盘中涨停,软件ETF(159852)涨近2%丨ETF观察

来源:21世纪经济报道 2023-06-20 11:09:09

Copyright   2015-2022 每日知识产权网 版权所有  备案号:浙ICP备2022016517号-15   联系邮箱:5 146 761 13 @qq.com