开罗美国大学提出基于骨架的动态手势识别框架

admin 2024-12-26 15:07:41 阅读:41 评论:0
开罗美国大学提出基于骨架的动态手势识别框架   为动态手势识别提供了可扩展和高效的解决方案   (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HG...

开罗美国大学提出基于骨架的动态手势识别框架

  为动态手势识别提供了可扩展和高效的解决方案

  (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HGR应用程序所必需的实时需求。

  在一项研究中,开罗美国大学提出了一种基于骨架的动态HGR框架,通过将动态手势识别简化为静态图像分类任务,这有效地降低了硬件和计算需求。

  所述框架利用数据级融合技术将动态手势的3D骨骼数据编码为静态RGB时空图像。它结合了一个专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构,优化数据表示之间的语义连接,同时最大限度地减少计算需求。

  对于5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)的测试,框架显示出了与最先进技术相媲美的性能。

  团队指出,框架的成功部署强调了其在虚拟现实/增强现实和环境智能等领域增强实时应用的潜力,为动态手势识别提供了可扩展和高效的解决方案。

  手势识别(HGR)在感知计算中起着至关重要的作用,它使计算设备能够使用数学算法捕获和理解人类的手势。HGR有潜力促进人机交互、虚拟现实/增强现实/混合现实以及环境智能等领域的高级应用。

  然而,由于人手的复杂形态,手势识别面临着独特的挑战,因为人手可以采取多种姿势,并且个体之间的物理特征各不相同。另外,HGR应用通常在具有挑战性的现实环境中运行,其特征包括遮挡、背景变化、噪点输入以及需要实时处理。

  HGR框架必须成功地应对相关形态和环境方面的挑战,以满足实际应用中开发者和最终用户的需求。需求包括易用性、计算需求、硬件需求、响应时间和准确性。

  手势本质上是动态的,姿势和位置随着时间的推移而变化,这为准确识别引入了时间维度。所以,必须解释一系列手部姿势以理解手势的上下文含义。为了解决相关挑战并满足性能要求,业界已经开发了各种用于动态手势识别的框架,而每个框架都使用不同的输入方式和网络架构组合。

  特定HGR框架利用“Multi-Stream网络”,将具有不同输入通道的多个子网络结合起来,并将它们的输出融合到整个网络的手势识别输出中。另一方面,“多模态框架”结合了多种输入模式,包括RGB、深度、骨架、光流和分割,为网络提供更多关于手势的语义信息。所述输入模态可在Multi-Stream的子网络中单独处理,或作为““Single-Stream网络”的统一输入组合。

  无论是Single-Stream还是Multi-Stream,HGR框架都采用了各种(组合)数据驱动的神经网络架构,如GC、注意力网络和1D/2D/3D CNN。另外,CNN处理空间信息的效果通常与RNN处理时间信息的效果相结合,以处理动态手势中包含的时空信息。

  然而,HGR领域研究的最终目的是为最终用户开发实际的HGR应用。所以,大多数开发的框架通常优先考虑最大限度地提高性能,而这需要额外的、专门的硬件和增加的计算复杂性。相关框架同时需要大量的训练数据和数据扩充来获得最大的性能。

  上述需求导致HGR应用成本更高,用户友好性降低,推理时间更长。另外,大多数已开发的框架都没有集成到应用中以展示它们的实际效用。最佳的HGR框架及其应用的目标是最小化计算成本,消除对额外硬件的需求,并实时操作,同时保持与最先进框架相当的手势识别精度。

  近年来,为了减少计算成本,专门使用骨架模式已经变得很普遍。另外,图像分类领域已经开发了一套可在资源受限设备实现实时性能的框架。

  所以,成功地将动态手势识别任务转换为普通图像分类任务的基骨架HGR框架将接近于最优。开罗美国大学提出了一种基于骨架的动态手势识别框架,它将数据级融合技术与专门的CNN架构相结合,能够将动态手势的三维骨架数据有效编码为RGB图像,并采用端到端集成调谐器(e2eET)Multi-Stream CNN架构进行后续图像分类。

  研究人员表示,所述框架支撑了一个稳健的、轻量级的、实时的HGR应用。

  相关论文:Real-Time Hand Gesture Recognition: Integrating Skeleton-Based Data Fusion and Multi-Stream CNNhttps://paper.nweon.com/16126

  总的来说,研究人员探讨了现有手势识别(HGR)框架在现实场景中的实时应用。为了解决相关框架的大量硬件和计算需求所带来的限制,他们引入了一个稳健的基骨架框架。它有效地将动态手势识别转换为静态图像分类,同时保留了关键的语义细节。

  框架采用改进的数据级融合技术,从动态手势的骨架数据生成静态RGB时空图像,并利用专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构进行分类。团队在5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)广泛评估了框架的有效性和泛化性。

  结果证明了其具有竞争力的性能,与当前最先进的基准相比,准确率在-4.10%到+5.16%之间。

  另外,在人类动作识别领域的探索性消融研究表明,框架在处理各种应用的时间动态数据方面具有强大的能力。这个成功的实现展示了数据级融合的潜力,在不牺牲性能的情况下大大减少了硬件和计算需求,使其成为跨多个领域的实时动态手势识别的可行解决方案。

  他们进一步指出,通过集成注意力机制来增强Multi-Stream网络架构将消除对特定于数据集的最佳视图方向序列的需求,并且可以提高整体性能。进一步的努力应该集中在通过定制的ML/DL优化方法来优化计算效率,从而提高框架的性能和有效性。

  ---原文链接:https://news.nweon.com/126690

版权声明

本站属个体站点,非官方网站。本站的文章内容由系统自动采集,不保证其真实性,敬请自行核实广告和内容真实性,并请谨慎使用。本站和本人不承担由此产生的一切法律后果!如有侵权,联系QQ:1755043837

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 2024 年小学生时事新闻:不容错过的

    2024 年小学生时事新闻:不容错过的
    作为一名小学生,了解时事对于开阔眼界、增强社会责任感非常重要。以下是2024年不容错过的时事要闻: 中国探月计划再创佳绩 2024年,中国计划发射嫦娥六号探测器,着陆在月球背面,带回月球样品。 这将是人类首次从月球背面采集样品,有助于科学家们进一步了解月球的起源和演化。 5G技术全面普及 5G技术以其超高速率和低延迟,将彻底改变我们的生活方式。 在2024年,5G网络预计将覆盖中国大部分地区,为智能家居、自动...
  • 陆军政委陈辉晋升上将新晋升,成为共和国第一位在军改后由少将直接晋升至上将的军官

    陆军政委陈辉晋升上将新晋升,成为共和国第一位在军改后由少将直接晋升至上将的军官
    近日,解放军重要人士调整,陆军政委陈辉晋升上将军衔,成为共和国第一位在军改后由少将直接晋升至上将的军官。 陈辉1963年出生,河南商水人,早年毕业于解放军南阳陆军学院合成指挥专业,历任陆军第81集团军副军长兼参谋长、副司令员,第78集团军军长,中部战区陆军司令员等职。2022年4月,陈辉担任陆军政委。 在担任中部战区陆军司令员期间,陈辉大力推进战区建设和改革创新,完善实战化训练体系,培养了一批实战化新型军事人才。他注重部队政治思想工作,思想政治建设成效显著。在...
  • 湖北广电: 湖北广电2024年年度股东大会法律意见书内容摘要

    湖北广电: 湖北广电2024年年度股东大会法律意见书内容摘要
    (原标题:湖北广电2024年年度股东大会法律意见书) 湖北天明律师事务所关于湖北省广播电视信息网络股份有限公司2024年年度股东大会的法律意见书指出,本次股东大会的召集和召开程序符合相关法律法规及公司章程规定。会议由公司董事会召集,于2025年5月22日下午14时30分在武汉召开,采用现场表决和网络投票结合的方式。出席人员包括509名股东及代理人,代表有表决权股份486,461,244股,占总股本42.7790%。会议审议并通过了《公司2024年年度报告》、《公司2024年...
  • 湖北广电: 关于调整董事会战略委员会成员的公告内容摘要

    湖北广电: 关于调整董事会战略委员会成员的公告内容摘要
    (原标题:关于调整董事会战略委员会成员的公告) 证券代码:000665 证券简称:湖北广电 公告编号:2025-023 湖北省广播电视信息网络股份有限公司关于调整董事会战略委员会成员的公告 本公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述或重大遗漏。 湖北省广播电视信息网络股份有限公司于2025年4月27日、2025年5月22日分别召开了第十届董事会第二十八次会议及2024年年度股东大会,审议通过了关于拟更换公司董事的议案。根据《上市...
  • 上海凤凰: 上海凤凰投资者关系管理制度

    上海凤凰: 上海凤凰投资者关系管理制度
       上海凤凰企业(集团)股份有限公司        投资者关系管理制度                 第一章 总 则   第一条 为了加强上海凤凰企业(集团)股份有限公司(以下简称公司)与 投资者之间的信息沟通,增强投资者对公司的了解和认同,提升公司治理水平, 以实现公司整体利益最大化和保护投资者合法权益,根据《中华人民共和国公司 法》《中华人民共和国证券法》《上市公司投资者关系管理工作指引》《上海证券 交易所股票上市规则(2025 年 4 月修订版)》(以...