开罗美国大学提出基于骨架的动态手势识别框架

admin 2024-12-26 15:07:41 阅读:71 评论:0
开罗美国大学提出基于骨架的动态手势识别框架   为动态手势识别提供了可扩展和高效的解决方案   (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HG...

开罗美国大学提出基于骨架的动态手势识别框架

  为动态手势识别提供了可扩展和高效的解决方案

  (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HGR应用程序所必需的实时需求。

  在一项研究中,开罗美国大学提出了一种基于骨架的动态HGR框架,通过将动态手势识别简化为静态图像分类任务,这有效地降低了硬件和计算需求。

  所述框架利用数据级融合技术将动态手势的3D骨骼数据编码为静态RGB时空图像。它结合了一个专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构,优化数据表示之间的语义连接,同时最大限度地减少计算需求。

  对于5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)的测试,框架显示出了与最先进技术相媲美的性能。

  团队指出,框架的成功部署强调了其在虚拟现实/增强现实和环境智能等领域增强实时应用的潜力,为动态手势识别提供了可扩展和高效的解决方案。

  手势识别(HGR)在感知计算中起着至关重要的作用,它使计算设备能够使用数学算法捕获和理解人类的手势。HGR有潜力促进人机交互、虚拟现实/增强现实/混合现实以及环境智能等领域的高级应用。

  然而,由于人手的复杂形态,手势识别面临着独特的挑战,因为人手可以采取多种姿势,并且个体之间的物理特征各不相同。另外,HGR应用通常在具有挑战性的现实环境中运行,其特征包括遮挡、背景变化、噪点输入以及需要实时处理。

  HGR框架必须成功地应对相关形态和环境方面的挑战,以满足实际应用中开发者和最终用户的需求。需求包括易用性、计算需求、硬件需求、响应时间和准确性。

  手势本质上是动态的,姿势和位置随着时间的推移而变化,这为准确识别引入了时间维度。所以,必须解释一系列手部姿势以理解手势的上下文含义。为了解决相关挑战并满足性能要求,业界已经开发了各种用于动态手势识别的框架,而每个框架都使用不同的输入方式和网络架构组合。

  特定HGR框架利用“Multi-Stream网络”,将具有不同输入通道的多个子网络结合起来,并将它们的输出融合到整个网络的手势识别输出中。另一方面,“多模态框架”结合了多种输入模式,包括RGB、深度、骨架、光流和分割,为网络提供更多关于手势的语义信息。所述输入模态可在Multi-Stream的子网络中单独处理,或作为““Single-Stream网络”的统一输入组合。

  无论是Single-Stream还是Multi-Stream,HGR框架都采用了各种(组合)数据驱动的神经网络架构,如GC、注意力网络和1D/2D/3D CNN。另外,CNN处理空间信息的效果通常与RNN处理时间信息的效果相结合,以处理动态手势中包含的时空信息。

  然而,HGR领域研究的最终目的是为最终用户开发实际的HGR应用。所以,大多数开发的框架通常优先考虑最大限度地提高性能,而这需要额外的、专门的硬件和增加的计算复杂性。相关框架同时需要大量的训练数据和数据扩充来获得最大的性能。

  上述需求导致HGR应用成本更高,用户友好性降低,推理时间更长。另外,大多数已开发的框架都没有集成到应用中以展示它们的实际效用。最佳的HGR框架及其应用的目标是最小化计算成本,消除对额外硬件的需求,并实时操作,同时保持与最先进框架相当的手势识别精度。

  近年来,为了减少计算成本,专门使用骨架模式已经变得很普遍。另外,图像分类领域已经开发了一套可在资源受限设备实现实时性能的框架。

  所以,成功地将动态手势识别任务转换为普通图像分类任务的基骨架HGR框架将接近于最优。开罗美国大学提出了一种基于骨架的动态手势识别框架,它将数据级融合技术与专门的CNN架构相结合,能够将动态手势的三维骨架数据有效编码为RGB图像,并采用端到端集成调谐器(e2eET)Multi-Stream CNN架构进行后续图像分类。

  研究人员表示,所述框架支撑了一个稳健的、轻量级的、实时的HGR应用。

  相关论文:Real-Time Hand Gesture Recognition: Integrating Skeleton-Based Data Fusion and Multi-Stream CNNhttps://paper.nweon.com/16126

  总的来说,研究人员探讨了现有手势识别(HGR)框架在现实场景中的实时应用。为了解决相关框架的大量硬件和计算需求所带来的限制,他们引入了一个稳健的基骨架框架。它有效地将动态手势识别转换为静态图像分类,同时保留了关键的语义细节。

  框架采用改进的数据级融合技术,从动态手势的骨架数据生成静态RGB时空图像,并利用专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构进行分类。团队在5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)广泛评估了框架的有效性和泛化性。

  结果证明了其具有竞争力的性能,与当前最先进的基准相比,准确率在-4.10%到+5.16%之间。

  另外,在人类动作识别领域的探索性消融研究表明,框架在处理各种应用的时间动态数据方面具有强大的能力。这个成功的实现展示了数据级融合的潜力,在不牺牲性能的情况下大大减少了硬件和计算需求,使其成为跨多个领域的实时动态手势识别的可行解决方案。

  他们进一步指出,通过集成注意力机制来增强Multi-Stream网络架构将消除对特定于数据集的最佳视图方向序列的需求,并且可以提高整体性能。进一步的努力应该集中在通过定制的ML/DL优化方法来优化计算效率,从而提高框架的性能和有效性。

  ---原文链接:https://news.nweon.com/126690

版权声明

本站属个体站点,非官方网站。本站的文章内容由系统自动采集,不保证其真实性,敬请自行核实广告和内容真实性,并请谨慎使用。本站和本人不承担由此产生的一切法律后果!如有侵权,联系QQ:1755043837

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 异动快报:中马传动(603767)3月14日10点11分触及涨停板

    异动快报:中马传动(603767)3月14日10点11分触及涨停板
    证券之星3月14日盘中消息,10点11分中马传动(603767)触及涨停板。目前价格15.71,上涨10.01%。其所属行业汽车零部件目前下跌。领涨股为苏奥传感。该股为大农业,新能源汽车,新能源车零部件概念热股,当日大农业概念上涨0.95%。 3月13日的资金流向数据方面,主力资金净流出4557.61万元,占总成交额14.95%,游资资金净流入380.44万元,占总成交额1.25%,散户资金净流入4177.17万元,占总成交额13.7%。 近5日资金流向一览见下表:...
  • 股票行情快报:致尚科技(301486)4月1日主力资金净买入1855.48万元

    股票行情快报:致尚科技(301486)4月1日主力资金净买入1855.48万元
    证券之星消息,截至2025年4月1日收盘,致尚科技(301486)报收于52.74元,上涨0.27%,换手率4.32%,成交量3.41万手,成交额1.81亿元。 4月1日的资金流向数据方面,主力资金净流入1855.48万元,占总成交额10.26%,游资资金净流入340.36万元,占总成交额1.88%,散户资金净流出2195.85万元,占总成交额12.15%。 近5日资金流向一览见下表: 近5日融资融券数据一览见下表: 该股主要指标及行业内排名...
  • 后巴: 巴拿马运河扩建后的全球贸易格局

    后巴: 巴拿马运河扩建后的全球贸易格局
    后巴:巴拿马运河扩建后的全球贸易格局引言巴拿马运河扩建于2016年完工,为全球贸易格局带来了重大变革。扩建后的运河允许更大的船舶通过,极大地提高了运力,对世界经济产生了深远的影响。本文将探讨后巴时代的全球贸易格局,重点关注扩建对航运、物流和贸易模式的影响。航运业的变革巴拿马运河扩建为航运业带来了革命性的转变。扩建后,新巴拿马型船可以运载高达14000个标准箱(TEU),是大巴拿马型船(9200 TEU)容量的1.5倍。这些巨型船舶的出现导致了运费的下降和航行时间的缩短。巨型船...
  • 异动快报:*ST威帝(603023)1月22日14点26分触及涨停板

    异动快报:*ST威帝(603023)1月22日14点26分触及涨停板
    证券之星1月22日盘中消息,14点26分*ST威帝(603023)触及涨停板。目前价格2.96,上涨4.96%。其所属行业汽车零部件目前下跌。领涨股为晋拓股份。该股为传感器,新能源汽车,无人驾驶概念热股。 1月22日的资金流向数据方面,主力资金净流出68.15万元,占总成交额9.13%,游资资金净流入122.04万元,占总成交额16.35%,散户资金净流出53.89万元,占总成交额7.22%。 近5日资金流向一览见下表: *ST威帝主要指标及行业内排名如下:...
  • 永达股份(001239)3月21日14点47分触及涨停板

    永达股份(001239)3月21日14点47分触及涨停板
    证券之星3月21日盘中消息,14点47分永达股份(001239)触及涨停板。目前价格19.8,上涨10.0%。其所属行业工程机械目前上涨。领涨股为邵阳液压。该股为风电,机械概念热股,当日风电概念上涨1.01%,机械概念上涨0.89%。 永达股份的投资逻辑如下:1、公司控股子公司江苏金源高端装备有限公司的主营业务为高速重载齿轮锻件的研发、生产和销售,产品部分应用于机器人领域 3月21日的资金流向数据方面,主力资金净流入3939.97万元,占总成交额26.48%,游资资金...