hg1088平台官网机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 行业动态 > ICRA 自然语义引导的机器人技能操作

ICRA 自然语义引导的机器人技能操作

来源:CAAI认知系统与信息处理专委会     编辑:hg1088平台官网   时间:2023/11/7   主题:其他 [加盟]

随着自然语言处理技术的发展以及客户需求的提高,当机器人进入以人为主的环境时,必须学会理解人类语言,完成指定任务。相较于传统只对场景做出反应的机器人操作方法,结合语义输入,让机器人理解人类语言,根据场景和自然语言指令完成相应任务,能为人机协作带来更大的便利性。然而,目前该方法具有如下限制:

(1)依赖手工编码任务符号来实现语义表达,限制了语义层面的泛化性。

(2)从指令中推断动作序列时,需要密集的子目标监督。

(3)缺乏更深层次的以目标为中心的推理方法,在解释复杂指令时不连贯。

针对上述问题,该文章提出了一种可感知视觉场景,同时处理语言输入的端到端可训练的模型。该模型使用视觉输入得到当前场景中物体在初始状态下的位置关系,以语义文字推理目标状态下对应的位置关系,实现由自然语言引导机器人进行技能操作。 相关成果以“Learning Neuro-symbolic Programs for Language Guided Robot Manipulation”为题发表于International Conference on Robotic and Automation (ICRA)会议中。

该文章提出了一种新型神经符号模型,使用自然语言推理目标场景,实现在给定初始场景和目标场景的情况下即可学习执行复杂的操作任务,并展示了如何在不需要任何中间监督的情况下,仅使用初始与目标两个场景作为监督来获取机器人操作动作的密集表示。 实验表明,该文章的方法可通过端到端的训练而不需进行任何子目标监督,即可展现出强大的指令理解能力,并对新场景和指令展现出强大的泛化能力,为将来基于自然语言的人机协作,机器人的语义指令集的拓展提供了新的参考思路。

1、模型结构设计

该端到端模型的结构如图1所示,由视觉提取器、语言解释器、视觉解释器、动作模拟器组成。输入初始场景和基于自然语言的任务指令,模型输出完成该指令所需的动作参数,以及预测完成任务后的最终场景。

视觉提取器相当于一个目标检测模型,用于识别初始场景下的物体信息。以图11为例,输入桌面初始状态的图像,视觉提取器输出各个物体的外接框、颜色信息及物体名称,并由外接框在桌面上的相对位置推断物体的位置信息。

语言解释器用于处理自然语言指令推理任务中隐含的操作动作。例如图中“移动绿色骰子后面的红色骰子至红色方块的右边”这句指令,语言解释器经过推理会得到完成该任务需要进行“移动”动作,移动的物体是“位于绿色骰子后面的红色骰子”,目标是“红色方块右边”,并可屏蔽“绿色方块”和“蓝色骰子”这些与完成任务无关的信息。推理完毕后,以专用指令集组合出推理结果。

专用指令集的结构如图2所示,分为“关键词”和“操作词”,前者用于描述物体信息,后者用于表示操作信息。

视觉解释器结合前二者输出的场景信息和任务指令集,输出完成该任务所需的参数化表示,交由任务模拟器生成机器人所能执行的动作参数,并预测完成任务后的场景情况。

以预测场景和数据集中提前设定好的目标场景做差,设置损失函数,即可实现端到端的训练过程。


人形机器人的落地思考-场景聚焦明确产品形态考虑成本设计

要立足场景正向设计产品从场景出发解决问题;续航能力将是制约人形机器人应用和发展的又一个重要因素;需要做到万元级别的成本才有可能大面积进入家庭

中国公共服务机器人产业链研究报告2023-市场规模总量提升较快,企业总量增速放缓

服务机器人的市场规模在2019年后快速增长,预计到2025年CAGR将达到近65%;人形机器人会是未来公共服务机器人主要形态,软件升级引领硬件发展

中国服务机器人行业未来的主要发展趋势

商业模式创新,打造一体化服务,持续拓展下游细分赛道;业务模式创新,多场景融合,实现实现一个服务机器人可以完成在多场景下完成工作

中国服务机器人行业发展目前面临的潜在风险

新科技的出现可能会对传统服务机器人厂商造成 一些冲击;优秀毕业生首选行业是软件和信息服务可能会导致人才供给不足等风险;行业内公司经营模式相似度过高

中国服务机器人行业发展目前面临的主要挑战

收入和研发费用的比例均超过了5%;国产机器人推广应用面临新场景拓展慢的挑战;代理商分销的方式可以有效的帮助服务机器人厂商也会造成市场的恶意竞价

服务机器人在中国市场短期迎来向好拐点 需求增长

在已使用或计划使用服务机器人的企业中,酒旅,金融服务,餐饮快消行业渗透率最高,均超过20%;2023年6月我国服务机器人产量为662658台,同比增长40%

服务机器人产业迎来向好拐点 增长空间巨大

进入2023年后服务机器人产量同比增长47.6%,结束了连续12个月的同比下滑;人工智能技术的突破也将给服务机器人从语音,视觉,决策,控制四个方面带来赋能

hg1088平台官网上市辅导进展情况报告(第十三期)20230414

中原证券参与辅导工作的人员为高岩,赵岩,邹坚贞,胡殿军,李雅璇,开展辅导的方式主要包括持续关注相关行业领域热点信息

环境感知的核心SLAM算法基本结构可分为前端和后端

算法在前端完成占据栅格地图的构建,得出激光雷达扫描帧的最佳位姿后,后端根据扫描帧间的位姿关系进行全局的地图优化,得出闭环扫描帧在全局地图中的最佳位姿

环境感知模块中基于激光雷达或视觉传感器的SLAM算法是核心

环境感知模块的基础硬件是各类不同的传感器,收集不同的测量信息,SLAM算法用于融合收集的信息数据,机器人可以在未知环境中进行自主探索和导航

运动控制、环境感知与人机交互是公共服务机器人三大核心技术模块

环境感知模块主要依靠如激光雷达实现对内外部环境状态信息的获取;运动控制模块主要依靠控制器等硬件实现派发的位置指令;人机交互模块主要依靠多模态信息理解交互技术

公共服务机器人产业链价值集中于上游核心技术与下游商业服务环节

公共服务机器人产业链符合“微笑曲线”理论,产业链附加价值集中于上游核心技术部分以及中游机器人厂商对下游用户的商业行为,中游机器人 整机制造商一般具备部分上游核心技术
资料获取
行业动态
== 最新资讯 ==
ICRA 自然语义引导的机器人技能操作
2023语义增强可编程知识图谱SPG白皮
2023 中国人工智能系列白皮书--人工
2023中国人工智能系列白皮书《人工智能
AI大模型市场研究报告(2023)迈向通
深圳2023人工智能发展白皮书-人工智能
人形机器人的落地思考-场景聚焦明确产品形
银行保险金融机构生成式人工智能战略报告-
中小学阶段的人工智能课程报告-人工智能课
中国公共服务机器人产业链研究报告2023
上海机器人产业园产业政策及入住代表性企业
2023年中国AI技术变革企业服务白皮书
中国服务机器人行业未来的主要发展趋势
中国服务机器人行业发展目前面临的潜在风险
中国服务机器人行业发展目前面临的主要挑战
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  紫外线消毒机器人  消毒机器人价格  展厅机器人  服务机器人底盘  核酸采样机器人  机器人代工厂  智能配送机器人  喷雾消毒机器人  图书馆机器人  导引机器人  移动消毒机器人  导诊机器人  迎宾接待机器人  前台机器人  消杀机器人  导览机器人 
版权所有 hg1088平台官网 中国运营中心:北京 清华科技园九号楼5层 中国生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728