- 全球无序抓取市场的领导者 - 全球无序抓取市场的领导者

今日科普|智元机器人视觉量产系统
2025-10-07 04:02:13

视觉系统:机器人的“火眼金(jīn)睛(jing)”

如(rú)果(guǒ)说(shuō)人(rén)形(xíng)机(jī)器(qì)人(rén)是(shì)未(wèi)来(lái)制(zhì)造(zào)业(yè)的(de)“超(chāo)级(jí)工(gōng)人(rén)”,那(nà)视(shì)觉(jué)系(xì)统(tǒng)就(jiù)是(shì)它(tā)的(de)“眼(yǎn)睛(jing)”。智(zhì)元(yuán)机(jī)器(qì)人(rén)通(tōng)过(guò)自(zì)主研(yán)发(fā)的(de)视(shì)觉(jué)技(jì)术(shù),让(ràng)机(jī)器(qì)人(rén)不(bù)仅(jǐn)能(néng)“看(kàn)”清(qīng)环(huán)境(jìng),还(hái)能(néng)“看(kàn)懂(dǒng)”任(rèn)务(wu)。以(yǐ)智(zhì)元(yuán)最(zuì)新(xīn)发(fā)布(bù)的(de)Genie Envisioner平(píng)台(tái)为(wèi)例(lì),其(qí)核(hé)心(xīn)的(de)GE-Base模(mó)块(kuài)采用(yòng)自(zì)回(huí)归(guī)视(shì)频(pín)生(shēng)成(chéng)框(kuāng)架(jià),能(néng)同(tóng)时(shí)处(chù)理(lǐ)头(tóu)部(bù)相(xiāng)机(jī)和(hé)双(shuāng)臂(bì)腕(wàn)部(bù)相(xiāng)机的三路视角输入,实现每秒120帧的动态捕捉和毫米级深度感知。🆕()这种多视角融合技术,让机器人在复杂场景中能精准识别物体位置——比如叠衣服时,它能通过视觉定位找到衣领和袖口,准确率比传统单目方案提升40%。

智元机器人视觉量产系统

更厉害的是,智元的视觉系统能“预测未来”。GE-Act模块通过稀疏记忆机制,能选择性保留关键历史帧,让机器人在折叠纸盒等超长步骤任务中,成功率从传统方法的0%飙升至76%。这种“预见性”让机器人能像人类一样规划动作,比如倒水时提前调整手臂角度避免洒出。这种能力背后,是智元基于3000小时真机数据训练的视觉世界模型,相当于让机器人“看”了100万次人类操作,积累的“经验”远超普通工人。

量产突破:从实验室到工厂的“临门一脚”

2025年,智元机器人宣布第1000台量产通用具身机器人下线,并计划在张江建设年产1万台的人形机器人二期工厂。这一速度的背后,是视觉系统与量产工艺🈺的深度融合。以智元“远征A2-D”数采机器人为例,它搭载的20DoF(主动自由度)本体包含两个7DoF机械臂,末端六维力矩传感器和RGB-D相机能实时感知力度和位置,配合VR遥操设备,数据采集师每天能采集150条高质量数据。这种“人机协作”模式,让数据采集效率比纯人工标注提升10倍。

但量产的真正挑战在于“一致性”。智元通过AIDEA数据平台,实现了从数据采集到模型训练的全链路标准化。比如,在汽车装配场景中,机器人需要精准识别螺丝位置并完成拧紧动作。AIDEA平台能自动标注螺丝的3D坐标和扭矩要求,确保每台机器人都按统一标准执行。这种“工业化”的数据处理流程,让智元的机器人良品率从初期的70%提升至95%,为大规模商用铺平了道路。

开源生态:让机器人“共享大脑”

2025年底,智元联合上海人工智能实验室等机构,开源了全球首个全功能、全场景的人形机器人百万真机数据集“AgiBot World”。这一数据集覆盖家庭、餐饮、工业等五大场景,包含3000多种物品的交互数据,单个任务的动作时长集中在25秒至120秒之间,远超谷歌Open X-Embodiment数据集的实验室级场景。比如,在超市分拣任务中,AgiBot World记录了机器人从识别商品到放入购物车的完整流程,包括如何避开障碍物、调整抓取力度等细节。

开源的意义在于“众人拾柴火焰高”。智元CTO彭志辉曾举例:“如果只靠我们一个工厂采集数据,1亿条需要几百年;但开源后,全球开发(fā)者(zhě)都(dōu)能(néng)贡(gòng)献(xiàn)数(shù)据(jù),量(liàng)级(jí)跃(yuè)升(shēng)指(zhǐ)日(rì)可(kě)待(dài)。”目(mù)前(qián),AgiBot World在(zài)HuggingFace社(shè)区(qū)的(de)下(xià)载(zài)量(liàng)已(yǐ)超(chāo)2万(wàn)次(cì),GitHub上(shàng)获(huò)1200星(xīng),远(yuǎn)超(chāo)谷(gǔ)歌(gē)同(tóng)类(lèi)产(chǎn)品(pǐn)。这(zhè)种(zhǒng)开(kāi)放(fàng)生(shēng)态(tài),正(zhèng)在(zài)推(tuī)动(dòng)具(jù)身(shēn)智(zhì)能(néng)从(cóng)“单(dān)打(dǎ)独(dú)斗(dòu)”转(zhuǎn)🌻()向(xiàng)“协(xié)同(tóng)进(jìn)化(huà)”。

未(wèi)来(lái)展(zhǎn)望(wàng):机(jī)器(qì)人(rén)走(zǒu)进(jìn)千(qiān)家(jiā)万户

智元的野心不止于工厂。2025年发布的家庭服务机器人HomeBuddy系列,已能通过视觉系统识别2025+种食材,自动规划烹饪步骤,清洁路径规划效率比传统扫地机器人提升60%。更值得期待的是,智元计划在2025年推出“机器人即服务”(RaaS)模式,家庭用户可订阅个性化服务套餐,比如让机器人每天根据用户健康数据调整食谱,或陪老人下棋聊天。

从视觉系统的“火眼金睛”到量产工艺的“精益求精”,再到开源生态的“众人拾柴”,智元机器人正在用技术突破重新定义“人机协作”的边界。正如彭志辉所说:“我们的目标不是造出更像人的机器人,而是让机器人能像人一样思考和解决问题。”当视觉🍒、量产和开源三大支柱真正落地,或许不久的将来,每个家庭都会有一个“懂你”的机器人助手。

登录