当前位置:首页 > 时尚 > 面对面丨拿着锤子找钉子 他们的开源模型让机器人能“上学”了

面对面丨拿着锤子找钉子 他们的开源模型让机器人能“上学”了

2025-07-19 03:37:31 [知识] 来源:凝颜颜馆站

浙江杭州,上学这个看似普通的面对面丨们的模型作业空间里,隐藏着另一个国际——机器人的锤找数字练习场。这里是钉 群核科技,创业14年,开源因在空间智能范畴堆集了不容忽视的让机优势,不只跻身“杭州六小龙”之列,器人在国际上也有着无足轻重的上学位置。

物理AI可以了解为懂物理规矩的面对面丨们的模型人工智能。只需懂了物理规矩,锤找自主机器如机器人、钉 自动驾驶轿车等,开源才干在实在的让机物理国际中进行感知、了解和履行杂乱操作。器人

黄晓煌,上学群核科技的联合开创人兼董事长。解说物理AI、空间智能以及怎么练习机器人时,他需求不断地浅显一点,不断地举例说明。在杭州六小龙爆火之前,他很少在媒体上出面,本质上他是一个技能痴迷者。

比较于了解练习机器人这件事,了解群核科技的创业进程要简略许多。

2007年,黄晓煌从浙江大学竺可桢学院结业,由于取得英伟达全额奖学金,赴美国伊利诺伊大学厄巴纳-香槟分校攻读博士学位,研讨方向是用GPU(图形处理器)做高性能核算。还没完结学业,他就加入了英伟达,首要作业是给GPU芯片开发并行核算的编程结构以及CUDA的开发。但只是1年后,他做出了脱离英伟达的决议。

2011年,在干流观点中,英伟达仍是一家“消费电子硬件公司”。虽然其时杰弗里·辛顿现已在用英伟达的GPU练习深度神经网络,但大大都人没有意识到GPU的并行核算才干将成为未来人工智能迸发的算力柱石。

在这样一个时刻节点上,黄晓煌看到的是GPU的超级算力和云端布置相结合的潜力。他约请相同来自浙江大学的陈航以及来自清华大学的朱皓,一起创业。创业方向,是用GPU做云端的图形图画快速烘托。烘托,指的是经过算法将三维模型或场景转换为二维图画或视频的进程。

在很短的时刻里,年青的开创团队用贱价显卡集组成一个端云协同的高性能GPU集群,算力本钱大幅下降,并完结了更快的核算速度。但那时,出资圈抢手的概念仍是移动互联网,黄晓煌在硅谷融资时,无一例外都遭到了回绝。在最困难的时期,恰逢浙江省到硅谷招商引资,黄晓煌和同伴们决议回国创业。

2012年,辛顿带领学生在图画识别大赛顶用深度卷积神经网络碾压传统算法,敞开了AI革新的新篇章,GPU也因而一战成名。经过与亚马逊的协作,英伟达开端进入“云服务”的战场。彼时,群核科技的年青团队正奔驰在用锤子找钉子的路上。他们的锤子是运用GPU完结“物理正确”的烘托引擎,“物理正确”是指烘托出的图在各种参数上与实在的物理国际相一致。

黄晓煌:我在英伟达作业的时分,整个公司的方法论都是先把技能做出来,然后花各种本钱去找运用。所以我受到了这种方法论的熏陶,说白了便是拿着锤子找钉子,需求先把锤子造出来。

这把锤子可以用来做电影特效烘托,但回收本钱的时刻太长,也可以用于游戏职业,但其时的手游对画质的要求并不高。终究,他们的技能落锤在了家装职业。

但是,跟着用户规划的扩展,对黄晓煌他们来说,技能应战也呈指数级上升。

2013年,群核科技推出了主打产品“酷家乐”,这款空间规划软件凭仗其10秒快速烘托的才干一炮而红,招引了很多的规划师,成为大家居职业首选的规划软件。

家装职业背面的产业链和数据规划的扩展,让黄晓煌和团队很自然地把技能优势延伸到工业4.0。物理正确的数据让规划图能直接对接工厂出产,而这一步,又带来更多的数据沉积。

2018年,根据本身事务海量的室内空间数据堆集,群核科技联合国内外几所高校一起推出InteriorNet数据集。在此之前,国际上现已有不少闻名数据集存在,但大都为静态或不行交互数据,InteriorNet是罕见的由可交互三维数据构成的数据集,也是全球最大的室内场景认知深度学习数据集。最重要的是,它是免费开源的数据集。

数据集敞开后不久,群核科技就收到了一封来自硅谷某科技巨子的电子邮件,期望和他们进行协作。

其时,该科技巨子正苦于缺少很多物理正确的组成数据做机器人练习,这次协作,让群核科技的数据集第一次运用在了空间智能练习上。

在实际国际中练习机器人,本钱昂扬、难以扩展,而运用数据练习机器人,则面对高质量3D数据稀缺的瓶颈。组成数据因而是一种性价比更高且潜力无限的练习数据来历。群核科技推出的数据集被帝国理工学院、南加州大学、浙江大学等多所高校选用,成为室内AI视觉练习中具有代表性的基础设施之一。

2025年3月,群核科技发布并开源了自主研制的空间了解模型SpatialLM,结合之前发布的空间智能渠道SpatialVerse,可以让机器人完结从认知了解到举动交互的完好闭环练习。跟着具身智能的迸发式增加,群核科技有了新的或许,便是成为空间智能练习的“云端基础设施巨子”之一。

记者:某种程度上,你就像ChatGPT这样的公司。

黄晓煌:是的,但它们是关闭的,咱们是敞开的。

记者:你的敞开和他们的关闭,会带来什么样的不相同?

黄晓煌:我垂青的是未来10年、20年后咱们的事务,咱们先把基础设施铺好,真实的才干才干得到发挥。我觉得关于我国这一代企业家来说,拥抱开源可以发挥更大价值。

记者:所以这又回到你创业的初衷、驱动力是什么?

黄晓煌:咱们一向深信,只需你的技能有价值,然后这个赛道蓬勃发展,你在里面必定可以分到一杯羹。并且你得感兴趣,即便失利了,这个进程你也会很高兴、很有成就感,即便没赚到钱,也会觉得不枉此行。

制片人丨刘斌记者丨董倩策划丨陈朋 夏周编导丨丁芳摄像丨王扬 王忠仁 陈朋。

(责任编辑:知识)

推荐文章
热点阅读