天元 旷视宣布开源自研深度学习框架 MegEngine,天元开源有何目标?
wujiai
|量子比特报道 | 官方账号
经过6年的潜心打造和优化,如今已到了8.0版本,旷视技术体系的这一关键支柱正式开源。
刚刚,中国最早以深度学**为驱动的AI独角兽旷视科技宣布开源自研的深度学**框架(Brain++的核心组件之一),中文名天元,取自围棋棋盘的中心点。
发布会上,旷视联合创始人、CTO唐文斌透露,这也是一种对“人工智能”的致敬。
与以往开源的“前辈”框架不同,旷视科技开源AI框架,是其创业、成长,以及屡创行业纪录的核心驱动引擎。
那么旷视天元为什么要开源?目的是什么?又将给行业带来哪些改变?
在介绍天元开源时,唐文斌介绍了“天元”的另一层含义:万事万物的根本。
他说:“我们希望通过天元这样的深度学**框架,能够作为中国人工智能的基石,帮助中国的人工智能做得更好。”
聚焦旷视自身,开源也是其“以算法为核心向产业升级,打造AI基础设施”战略的延伸,近几年的一系列动作都是朝着这个方向的持续推进。
智能时代的生产力工具
2019年初,旷视科技发布AIoT操作系统“河图”,应用于物流场景,让更多硬件能够连接,实现平台的统一管控和调度。
同时,这个体系也能让更多的生态伙伴参与其中,发展自己的智能物流解决方案,创造场景价值。
“河图”发布后,虽然平台软件让更多硬件能够连接、AI+场景更加丰富,但旷视发现,一个更大的需求出现了——场景是无限的。
他们认为,这导致各种场景对算法的需求是无限的,但没有哪家公司能够创造所有的算法。要解决这个矛盾,激发整个行业的算法创新,需要一套对所有人开放的人工智能基础设施。
那么什么是AI基础设施?
唐文斌在发布会上表示,只有AI芯片平台、AI生产力平台才能称为AI基础设施。
其中,毫无疑问的是,AI计算需要有AI芯片平台支撑,而AI生产力则需要来自“框架”。
此前,我们在观察和评估AI框架的时候,也有更宏观的视角:
纵观人类社会三次生产力大爆发的时代,生产力的焦点都是规模工具的重要性,农耕文明时代的核心是犁的使用,使农业得以规模化发展。
工业革命的关键是蒸汽机的引入和推广,让机器得以大规模部署和应用,取代了手工作坊。而在智能时代,如何实现数据的大规模应用和处理,成为竞争力的关键。
通常,我们把技术视为第一生产力,但过于关注技术,往往会忽视“技术”大规模应用的工具。
如果我们回过头来看,就会发现这样的一个规律:谁掌握了时代的生产工具,谁就掌握了生产力,谁就有可能成为时代红利的最大受益者,在竞争中占据上风。
按照产业经济学理论,生产效率的本质在于减少消耗、增加产出,从而利用剩余推动进一步发展,并在每次增长瓶颈时抓住产业变革的奇点,实现范式转移和产能跨越,从而真正跨越周期。
具体到当前AI驱动的智能时代,打造人工智能算法框架无疑是降低消耗的利器:AI算法的大规模推行将促进产出,各行各业将进入新一轮能效转型战。
因此在产业智能化的大趋势下,算法开发框架的意义进一步凸显,成为构建数字基础设施、产生AI生产力的核心工具之一。
从这个角度来看天元,旷视科技开源天元,不仅是对技术社区的贡献,更是旷视科技引入开放创新、打造Brain++生产力平台、竞逐产业智能时代的战略举措。
唐文斌认为,任何一个行业,只有引发标准化、规模化的连锁反应,才能迎来真正的繁荣。
这是天元的设计哲学,直接体现在框架设计的功能和能力上。
天元框架四大特点
天元是旷视Brain++的核心组件之一,主要功能是借助友好的编程接口帮助开发者进行大规模深度学**模型的训练和部署。
按照旷视官方给出的总结,天元具备训练推理一体化、动静结合、包容性强、灵活高效等四大特点,可以媲美其他主流深度学**框架。
所谓训练推理一体化,是指通过天元训练得到的模型和产品,可以直接用于产品推理和封装,在部署时,还能帮助开发人员自动删除冗余代码,实现模型自动优化。
动静合一,意味着天元融合了“静态图形性能高、占用资源少、易部署”与“动态图形简洁灵活、易调试、易使用”的优势。
在充分发挥动态图模型训练优势的同时,开发者可以利用天元一键动静转换功能,以静态图的形式完成生产部署。此外,天元还支持动静混合编程,灵活性更高。
发布会上,旷视研究院高级技术总监田中博举了一个例子。
他说:“利用天元的动态图形功能的时候,大概一秒钟就能计算出来,如果转换成静态图像的话,可以支持到这个水平。”
但这还不是全部。
他还介绍说:“这种情况下如果要训练更大batch、更大的模型,可以使用亚线性自动内存优化技术,天元可以在不降低计算速度的情况下,实现训练能力。”
随着模型变得越来越大、越来越深,它会发挥更好的作用。
田中博透露,根据旷视内部的一些评估,对于一些大型模型,可以实现20倍以上的内存节省,而速度几乎没有变化。
兼容性体现在天元的易用性上,其API学**成本较低,对于**惯了传统机器学**的开发者来说,也很容易上手。此外,天元还支持直接导入模型的功能,迁移成本低,大大方便了模型复现。
灵活高效具体指天元对多平台、多设备的适应能力强,通过汇编、指令重排序等技术,天元内置的算子无论在推理还是生产环境中都能充分发挥多核的优势,灵活调用设备的算力,尤其适合大模型算法的训练。
那么问题来了,天元的能力和特性,其关键的秘密到底是什么呢?
建筑设计。
天元框架整体架构
从架构上看,天元分为计算接口、图形表示、优化编译、运行管理、计算内核五层。
在顶层计算接口上,天元配置C++及接口,解决框架学**接口不同,模型难以复现的问题;
在图表示层,天元内置动静转换功能,支持开发人员混合使用动态图和静态图模式进行编程;
在优化编译层,天元构建核心计算图以支撑高效的用户交互,并进一步优化和编译API中表达的计算,包括自动导数、图优化、图编译功能。
在运行时设备管理方面,天元配置了计算调度和内存管理两大模块,通过计算调度模块将设备抽象成执行流,通过调度器实现智能调度。
在内存优化方面,天元同时采用动态和静态内存分配方式,支持自动子线性内存优化,同时旷视自主研发了自动子线性内存管理优化器,让天元能够达到更优的内存优化效果。
天元底层(计算内核)拥有基于异构架构的计算内核,内置高效的计算机视觉算子,并具备对X86、CUDA等主流硬件设备的智能适配能力。
它可以利用内置算法根据设备本身启发式地选择最优内核,也可以让用户选择最适合计算的内核。
此外,天元配备高性能异构通信库,支持用户在不同的机器、计算卡之间进行高性能通信,实现多机多卡、大规模、分布式算法训练。
在实践中使用这样的框架会产生什么效果?
正如开篇所言,旷视科技能够成长为全球估值最高的AI独角兽之一,离不开这个框架的强大驱动。
核心中的核心
六年来,天元框架作为旷视“真核”Brain++的一部分,与深度学**云计算平台()、数据管理平台()一起支撑了旷视全部业务。
旷视科技首席科学家、研究院院长孙剑表示:“旷视科技1400名研发人员全部采用天元框架,并应用到数百款产品、数十个计算平台上。”
在孙剑看来,天元和谷歌推出的天元有很大不同。
“AI公司和平台公司的深度学**框架考虑的点、位置、方向都不一样,”他说,“我们的深度学**框架(天元)??是基于旷视核心业务的,我们希望让特定领域的AI开发者受益,希望他们可以同时使用不同的框架,或者用不同的框架来解决不同的问题。”
例如在主流的计算机视觉模型(18、、v2和V2)上,天元的训练速度与其他主流框架存在差异。
此次开源,旷视科技还发布了一系列围绕天元框架的开发工具。
例如,开箱即用的在线深度学**工具,让开发者可以快速体验天元的框架,进行模型训练;天元还推出了包含顶尖算法的模型中心,包括旷视研究院的最新技术和研究成果。
同时,旷视还将分布式计算中的数据并行、模型并行应用于天元,进一步提高大规模图像数据处理和模型训练的效率。
为了在更大范围、更多类型的设备上部署,天元提供了神经架构搜索、网络剪枝、构建低比特小型神经网络等功能。
而且天元还融入旷视科技的最新技术,自动设计深度学**算法的各个关键环节,让算法训练算法、让AI创造AI,从而降低进入门槛。
以上这些能力都证明了天元是旷视最核心、最强大的能力。
最直接的例子是旷视连续三年斩获COCO“物体检测”冠军,统治力堪比“中国乒乓球队”。 2019年夺得ICCV冠军后,孙剑再次感谢Brain++,称一系列成绩的取得都离不开背后强大的Brain++。
而负责Brain++平台算法制作/研发的天元则扮演着更为重要的角色。
但即便是如此强大的武器,核心中的核心,如今也被旷视科技开源了。
为什么?
耗时6年打造优化,开源是一场“无限游戏”
对于旷视科技来说,推动开源的直接因素有两个:一是技术是否成熟,二是时机是否合适。
旷视联合创始人兼CEO印奇表示,这与AI产业的发展有直接关系。
他说,当算法成为改变甚至颠覆软件行业的力量时,最后的关键就是这些AI公司是否具备平台能力,即“能否批量、高效、比竞争对手更迅速地供给优质算法”。
这场竞争的决定性因素就是是否掌握了核心引擎的框架。
因此旷视科技在2014年就自主研发了“天元”框架,开发时间较早。
2015年中,天元框架在旷视科技内部全面推广,业务线内的模型全部更换为使用自研框架训练的版本。
同年11月,谷歌开源该框架后,旷视一度犹豫是否继续开发深度学**框架,但经过大规模评估后,旷视还是决定自己开发框架,毕竟新框架的效果并不理想。
如今,天元在不断完善,Brain++逐渐成型,旷视科技在不断壮大,所竞争的市场也在不断扩大,开源已经成为一家行业领先公司的责任。
“我们认为我们应该为中国整个人工智能生态系统做出一些贡献。我不知道这个贡献会有多大,但我认为这是我们应该做的。”尹奇说。
在天元开源发布会上,唐文斌还进一步透露了旷视对天元的期待,希望通过开源,能够与更多人一起,利用AI的力量创造更多价值。
当然,旷视作为一家AI创业公司,如何在最大程度发挥开源能力的同时,保证核心业务不受损害?天元是否开源、如何开源,这也是外界关注的核心问题。
从天元的发展路线图中,我们可以看出旷视科技对于这些问题的态度,不仅没有回避,而且相当坦诚。
唐文斌坦言,此次开源的天元是Alpha版本,基于.0,约有35万行代码,覆盖了绝大多数应用场景。
6月份,旷视将发布天元Beta版本,增加对ARM系列CPU的支持、更多加速设备支持、量化与低位计算支持等功能。
9月,旷视将发布1.0正式版本,全面支持主流计算设备,升级动态计算能力,优化整个训练和推理流程的用户体验。
唐文斌表示,也希望更多人能够对我们的产品提出批评、建议、贡献代码,共同建设更好的天元。
但不管怎样,从现在开始,开发人员在选择构建模型算法的框架时,多了一个不可忽视的可靠选择。
此外,对于整个AI行业来说,竞争维度也进一步增强,开源竞争不再是某个算法或模型单点的开源,而是变成了框架、平台、生态群体之间的争夺。
正如唐文斌所言:“AI可以赋能很多行业、很多场景,这是一场无限的游戏。”
在这场博弈中,旷视因 Brain++ 而强大,Brain++ 因天元而无处不在。AI 复兴让旷视成为第一家上市的 AI 创业公司。如今,旷视正通过天元,将自己的 AI 影响力和能力传播到更广阔的智能时代。
量子位还问CEO印奇,天元开源内部的小目标是什么?
尹奇回答:中国开发者中口碑最好的框架。
如今,天元已正式开放,接受大家的考察和评鉴。
门户网站:
天元深度学**框架官网:
开源地址:
- 超过-
·今日头条签约
关注我们,第一时间获取最新前沿科技资讯