机器人是人类科学发展的产物,目前市面上已经出现各式各样的机器人,社交机器人是其中之一,人们都好奇它是否可以取代宠物,走进人们的生活和千家万户?
据机器宠物制造公司称,自2016年机器宠物首次亮相以来,美国境内已经售出了十万多只专为老年人设计的机器宠物。但在2017年的调查中,近60%的美国人表示,他们不希望使用机器人来照顾自己或家人。64%的人认为,这种照顾只会增加老年人的孤独感。与此同时,欧盟国家60%的人赞成禁止使用机器人来照顾儿童、老人和残疾人……围绕社交机器人产生的伦理、社会问题并不是一朝一夕就可以厘清的,取代鲜活有生命的宠物可谓是有些难度。对此,您有什么看法呢?如果您有何锦囊妙计可以安邦治国平天下,赶快来《共绘网》评论区参与讨论吧!
一共有人参与 条评论
具身任务规划如前所述,对于任务“把苹果放在盘子上”,任务规划器将其分解为子任务“找到苹果,拿起苹果”和“找到盘子”、“放下苹果”。由于如何找到(导航任务)或拿起/放下动作(抓取任务)不在任务规划的范围之内。这些动作通常在模拟器中预定义或使用预训练策略模型在真实场景中执行,例如使用CLIPort [294]进行抓取任务。传统的具身任务规划方法通常基于显式规则和逻辑推理。例如,使用符号规划算法如STRIPS [310]和PDDL [311],以及搜索算法如MCTS [312]和A* [313]来生成计划。然而,这些方法通常依赖于预定义的规则、约束和启发式,这些规则是固定的,可能无法很好地适应环境的动态或不可预见的变化。随着LLMs的普及,许多工作尝试使用LLMs进行规划或将传统方法与LLMs结合,利用它们内部丰富的世界知识进行推理和规划,无需手工定义,大大增强了模型的泛化能力。利用LLMs的紧急能力进行规划:在自然语言模型扩大规模之前,任务规划器通过训练像BERT这样的模型在具身指令数据集上,如Alfred [314]和Alfworld [315],由FILM [316]展示。然而,这种方法受到训练集示例的限制,无法有效与物理世界对齐。现在,由于LLMs的紧急能力,它们可以使用内部世界知识进行任务分解,并通过思维链推理,类似于人类在行动前的推理过程。例如,Translated LM [317]和Inner Monologue [318]可以将复杂任务分解为可管理的步骤,并使用内部逻辑和知识体系制定解决方案,无需额外训练,如ReAct [319]。同样,多智能体协作框架ReAd [320]提出了通过不同提示进行有效自我完善计划的方法。此外,一些方法将过去成功的示例抽象为一系列技能存储在记忆库中,在推理期间考虑以提高规划成功率[321]–[323]。一些工作使用代码作为推理媒介而不是自然语言,任务规划根据可用的API库生成代码[324]–[326]。此外,多轮推理可以有效地纠正任务规划中的潜在幻觉,这是许多基于LLM的智能体研究的重点。例如,Socratic Models [327]和Socratic Planner [328]使用苏格拉底式提问来得出可靠的计划。然而,在任务规划期间,执行期间可能出现潜在故障,通常由于规划器没有完全考虑真实环境的复杂性和任务执行的困难[318],[329]。由于缺乏视觉信息,计划的子任务可能与实际场景偏离,导致任务失败。因此,将视觉信息整合到规划或执行期间的重新规划中是必要的。这种方法可以显著提高任务规划的准确性和可行性,更好地应对真实世界环境的挑战。利用具身感知模型的视觉信息进行规划:基于上述讨论,将视觉信息进一步整合到任务规划(或重新规划)中尤为重要。在此过程中,由视觉输入提供的对象标签、位置或描述可以为LLMs的任务分解和执行提供关键参考。通过视觉信息,LLMs可以更准确地识别当前环境中的目标对象和障碍物,从而优化任务步骤或修改子任务目标。一些工作使用对象检测器在任务执行期间查询环境中存在的对象,并将此信息反馈给LLM,允许它修改当前计划中的不合理步骤[327],[329],[330]。RoboGPT考虑了同一任务中相似对象的不同名称,进一步提高了重新规划的可行性[10]。然而,标签提供的信息仍然过于有限。可以提供更多的场景信息吗?SayPlan [331]提出使用分层3D场景图来表示环境,有效缓解了在大型、多层和多房间环境中进行任务规划的挑战。同样,ConceptGraphs [332]也采用3D场景图向LLMs提供环境信息。与SayPlan相比,它提供了更详细的开放世界对象检测,并将任务规划以基于代码的格式呈现,这更有效,更适合复杂任务的需求。然而,有限的视觉信息可能导致智能体对其环境的理解不足。虽然LLMs获得了视觉提示,但它们常常无法捕捉到环境的复杂性和动态变化,导致误解和任务失败。例如,如果一条毛巾被锁在浴室柜里,智能体可能会在浴室里反复搜寻而不考虑这种可能性[10]。为了解决这个问题,必须开发更强大的算法来整合多种感官数据,增强智能体对环境的理解。此外,利用历史数据和上下文推理,即使在视觉信息有限的情况下,也可以帮助智能体做出合理的判断和决策。这种多模态整合和基于上下文的推理方法不仅提高了任务执行的成功率,而且为具身人工智能的发展提供了新的视角。利用VLMs进行规划:与使用外部视觉模型将环境信息转换为文本不同,VLM模型可以在潜在空间中捕捉视觉细节,特别是难以用对象标签表示的上下文信息。VLM能够识别视觉现象背后的规则;例如,即使毛巾在环境中不可见,也可以推断毛巾可能存放在柜子里。这个过程本质上展示了如何在潜在空间中更有效地对齐抽象的视觉特征和结构化的文本特征。 作者:张长旺
未来大众需要的并不是各种实体商品,而是各种精神产品(情绪安慰)。首先,实体产品投入太大,消费者比价太容易,利润遭多方挤压,未来的利润会无限于0。而虚拟产品的投入非常小,况且其边际成本为0。其次,社会产能已经严重过剩,物质产品已经极大丰富,我们早就不缺各种物质产品了。但同时我们的精神世界却越来越空虚/焦躁,再加上信息茧房和精准推送的配合之下,我们都沉溺在自己的世界里,这时商家很容易刺激到消费者的情绪味蕾,让消费者非理性消费,获取巨大收益。
对于普通人而言,纳米机器人是最现实的,现在已经开始在医疗系统实验性运用,估计未来十年内可以实现大规模商用,如果中国未来顺利实现产业升级,这玩意进入医保应该没有问题。对!国家强大了,纳米机器人都会由国家买单。现在中心城市有一个胶囊机器人已经进入医保,你胃有毛病都不用做痛苦的胃镜,吞一粒胶囊机器人就OK,市场价3000多元一粒,医保后自费1000多元——预计未来5年内这个胶囊机器人会降成白菜价。所以,给大家两个建议。第一,保持有规律的生活习惯,保持乐观的心态。目的只有一个,先坚持活过10年,等智能纳米机器人普及了(同时各种免疫治疗、基因治疗上了一个台阶),你的寿命将有一个飞跃。第二,努力工作,热爱生活。(原文出处:猫哥的视界)
![]() ![]() ![]() ![]() |
![]() ![]() ![]() ![]() |