「TensorChord」完成种子轮融资,通过MLOps帮助企业AI落地 | 云九Portfolio

2022-11-28

MLOps企业「TensorChord」于今日正式宣布完成数百万美元的种子轮融资。本轮融资由高瓴创投(GL Ventures)领投,云九资本跟投。公司联合创始人兼CEO高策表示,融资资金将主要用于产品研发和人员招聘等方面。

TensorChord成立于2022年6月,主打Machine Learning Ops领域(下文简称「MLOps」)。MLOps的主要作用是连接算法工程师团队和AI基础设施团队,建立起简单易用的模型开发、部署与运维流程,从而帮助企业提升AI落地的效率和效果。高策表示,MLOps的目标是帮助AI更好地落地,所以只有当企业的AI应用越来越多的时候,MLOps才有用武之地。过去几年里,AI技术应用的爆发,海外几家MLOps公司的发展,以及高策和团队对AI在公有云中落地程度的观察,都让他们更加确信MLOps的发展前景,TensorChord也就此成立。

在具象的市场需求方面,TensorChord团队发现AI领域在快速发展的同时,也存在人才、硬件浪费的问题。而公司的第一款产品「envd」则致力于提升算法工程师的人效和硬件资源的利用率。

提升人效方面,据高策介绍,当前不少公司内部的算法工程师需要花费大量精力在构建和维护AI基础设施上,但在他看来,算法工程师的工作应该服务于公司的核心业务,为业务发展创造更多价值。此外,今天的算法工程师在工作时,也常常需要AI基础设施团队帮忙进行资源配置工作。比如,当算法工程师基于容器架构进行调试时,需要AI基础设施团队帮忙构建容器镜像。而envd则提供了一种基于Python语言的镜像构建方式,让算法工程师也可以自行完成这一部分工作,从而提升团队整体效率。

而在提升硬件资源利用率方面,高策解释,GPU本身不支持硬件辅助的虚拟化等特性,使得其利用率有待提高。具体表现为,算法工程师需要基于GPU进行算法的调试工作,而GPU等底层资源属于AI基础设施团队的管辖范畴,算法工程师需要申请使用,这使得不论是在本地使用GPU卡,还是采用集群或容器的方式,算法工程师都偏向长期占用GPU开展工作。这种情况下,AI基础设施团队无法及时对GPU进行回收,就会造成企业计算资源的浪费。“在公有云上,GPU 的利用率在 30-40% 就已经是非常不错的表现了。”针对这一痛点,高策介绍,envd可以精准洞察GPU资源的占用情况 ,帮助AI基础设施团队进行资源的及时回收。其具体实现逻辑是, envd在镜像构建的工具中引入支持SSH协议的守护进程。并且,这一功能支持本地和远程(类似云开发),保证用户在不同的硬件资源上能有一致的体验。

整体而言,高策表示,开发环境的构建是算法工程师工作流程的入口,也是目前基础设施仍未解决的问题之一。所以,TensorChord团队希望面向AI从业者打造更加符合他们使用习惯的环境构建和分发工具,让AI基础设施团队和算法团队各司其职,提升企业整体业务效率。

可以看出,envd能够解决AI基础设施团队和算法工程师团队两者的痛点,但据TensorChord团队表示,当前主动联系envd的用户仍以AI基础设施团队居多。未来,公司也会持续打磨产品并进行开源社区建设,以同时适应AI基础设施团队和算法工程师团队的需求。

创始团队方面,创始人兼CEO高策是MLOps 知名开源项目Kubeflow 训练与自动机器学习工作组的Co-chair & Tech Lead,曾是该项目全球贡献前二贡献者,维护的开源训练和⾃动机器学习组件在 Bloomberg、IBM,思科等公司有广泛落地。在创立TensorChord前,高策曾在腾讯、才云科技、字节跳动等公司负责容器、机器学习平台产品的开发工作。团队其他成员来自亚马逊、TikTok、Shoppe等公司。

在创始团队的愿景中,TensorChord从成立第一天起就面向全球市场,创始团队也计划于明年开展海外的团队建设和市场探索。