开罗美国大学提出基于骨架的动态手势识别框架

admin 2024-12-26 15:07:41 阅读:57 评论:0
开罗美国大学提出基于骨架的动态手势识别框架   为动态手势识别提供了可扩展和高效的解决方案   (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HG...

开罗美国大学提出基于骨架的动态手势识别框架

  为动态手势识别提供了可扩展和高效的解决方案

  (映维网Nweon 2024年12月26日)手势识别(HGR)能够在各种现实环境中实现直观的人机交互。然而,现有框架往往难以满足实际HGR应用程序所必需的实时需求。

  在一项研究中,开罗美国大学提出了一种基于骨架的动态HGR框架,通过将动态手势识别简化为静态图像分类任务,这有效地降低了硬件和计算需求。

  所述框架利用数据级融合技术将动态手势的3D骨骼数据编码为静态RGB时空图像。它结合了一个专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构,优化数据表示之间的语义连接,同时最大限度地减少计算需求。

  对于5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)的测试,框架显示出了与最先进技术相媲美的性能。

  团队指出,框架的成功部署强调了其在虚拟现实/增强现实和环境智能等领域增强实时应用的潜力,为动态手势识别提供了可扩展和高效的解决方案。

  手势识别(HGR)在感知计算中起着至关重要的作用,它使计算设备能够使用数学算法捕获和理解人类的手势。HGR有潜力促进人机交互、虚拟现实/增强现实/混合现实以及环境智能等领域的高级应用。

  然而,由于人手的复杂形态,手势识别面临着独特的挑战,因为人手可以采取多种姿势,并且个体之间的物理特征各不相同。另外,HGR应用通常在具有挑战性的现实环境中运行,其特征包括遮挡、背景变化、噪点输入以及需要实时处理。

  HGR框架必须成功地应对相关形态和环境方面的挑战,以满足实际应用中开发者和最终用户的需求。需求包括易用性、计算需求、硬件需求、响应时间和准确性。

  手势本质上是动态的,姿势和位置随着时间的推移而变化,这为准确识别引入了时间维度。所以,必须解释一系列手部姿势以理解手势的上下文含义。为了解决相关挑战并满足性能要求,业界已经开发了各种用于动态手势识别的框架,而每个框架都使用不同的输入方式和网络架构组合。

  特定HGR框架利用“Multi-Stream网络”,将具有不同输入通道的多个子网络结合起来,并将它们的输出融合到整个网络的手势识别输出中。另一方面,“多模态框架”结合了多种输入模式,包括RGB、深度、骨架、光流和分割,为网络提供更多关于手势的语义信息。所述输入模态可在Multi-Stream的子网络中单独处理,或作为““Single-Stream网络”的统一输入组合。

  无论是Single-Stream还是Multi-Stream,HGR框架都采用了各种(组合)数据驱动的神经网络架构,如GC、注意力网络和1D/2D/3D CNN。另外,CNN处理空间信息的效果通常与RNN处理时间信息的效果相结合,以处理动态手势中包含的时空信息。

  然而,HGR领域研究的最终目的是为最终用户开发实际的HGR应用。所以,大多数开发的框架通常优先考虑最大限度地提高性能,而这需要额外的、专门的硬件和增加的计算复杂性。相关框架同时需要大量的训练数据和数据扩充来获得最大的性能。

  上述需求导致HGR应用成本更高,用户友好性降低,推理时间更长。另外,大多数已开发的框架都没有集成到应用中以展示它们的实际效用。最佳的HGR框架及其应用的目标是最小化计算成本,消除对额外硬件的需求,并实时操作,同时保持与最先进框架相当的手势识别精度。

  近年来,为了减少计算成本,专门使用骨架模式已经变得很普遍。另外,图像分类领域已经开发了一套可在资源受限设备实现实时性能的框架。

  所以,成功地将动态手势识别任务转换为普通图像分类任务的基骨架HGR框架将接近于最优。开罗美国大学提出了一种基于骨架的动态手势识别框架,它将数据级融合技术与专门的CNN架构相结合,能够将动态手势的三维骨架数据有效编码为RGB图像,并采用端到端集成调谐器(e2eET)Multi-Stream CNN架构进行后续图像分类。

  研究人员表示,所述框架支撑了一个稳健的、轻量级的、实时的HGR应用。

  相关论文:Real-Time Hand Gesture Recognition: Integrating Skeleton-Based Data Fusion and Multi-Stream CNNhttps://paper.nweon.com/16126

  总的来说,研究人员探讨了现有手势识别(HGR)框架在现实场景中的实时应用。为了解决相关框架的大量硬件和计算需求所带来的限制,他们引入了一个稳健的基骨架框架。它有效地将动态手势识别转换为静态图像分类,同时保留了关键的语义细节。

  框架采用改进的数据级融合技术,从动态手势的骨架数据生成静态RGB时空图像,并利用专门的端到端集成调谐器(e2eET)Multi-Stream CNN架构进行分类。团队在5个基准数据集(SHREC’17、DHG-14/28、FPHA、LMDHG和CNR)广泛评估了框架的有效性和泛化性。

  结果证明了其具有竞争力的性能,与当前最先进的基准相比,准确率在-4.10%到+5.16%之间。

  另外,在人类动作识别领域的探索性消融研究表明,框架在处理各种应用的时间动态数据方面具有强大的能力。这个成功的实现展示了数据级融合的潜力,在不牺牲性能的情况下大大减少了硬件和计算需求,使其成为跨多个领域的实时动态手势识别的可行解决方案。

  他们进一步指出,通过集成注意力机制来增强Multi-Stream网络架构将消除对特定于数据集的最佳视图方向序列的需求,并且可以提高整体性能。进一步的努力应该集中在通过定制的ML/DL优化方法来优化计算效率,从而提高框架的性能和有效性。

  ---原文链接:https://news.nweon.com/126690

版权声明

本站属个体站点,非官方网站。本站的文章内容由系统自动采集,不保证其真实性,敬请自行核实广告和内容真实性,并请谨慎使用。本站和本人不承担由此产生的一切法律后果!如有侵权,联系QQ:1755043837

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 4月6日生肖牛运势详解:今日运势全方位解读

    4月6日生肖牛运势详解:今日运势全方位解读
    整体运势 今日对于生肖牛而言,整体运势较为平稳,没有明显的吉凶起伏。整体能量充沛,适合处理日常事务,但需注意避免过于急躁,保持冷静的头脑。在人际交往方面,与他人沟通时,多一份理解和耐心,可避免不必要的冲突。 事业运势 工作方面,今日适合进行计划制定和任务分配。积极主动地开展工作,能有效提升工作效率。但需要注意细节问题,避免因小失大。对于新项目或新任务,可提前做好准备工作,以确保顺利进行。...
  • 百惠金控2024年IPO发行成绩斐然 总集资规模超过57亿

    百惠金控2024年IPO发行成绩斐然 总集资规模超过57亿
    百惠金控2024年的IPO工作圆满收官,累积助力16个IPO上市项目,总集资规模达57.25亿港元。百惠金控对资本市场具有深刻见解,欣见2024年香港IPO市场气氛回暖,我们积极调动自身资源,协力多家具有潛力的企业赴港上市,在国际融资平台大放异彩。,,这一年,百惠金控助力16个星级IPO项目上市,企业板块涵盖人工智能、生物医药研发及第三代半导体硅基氮化镓研发技术等企业。这些项目中,集资规模排名前三的是英诺赛科(苏州)科技股份有限公司(2577.HK)、多点数智有限公司(258...
  • ST美谷(000615)3月14日9点43分触及涨停板

    ST美谷(000615)3月14日9点43分触及涨停板
    证券之星3月14日盘中消息,9点43分ST美谷(000615)触及涨停板。目前价格3.74,上涨5.06%。其所属行业医疗美容目前上涨。领涨股为ST美谷。该股为粘胶短纤,医美,京津冀概念热股,当日粘胶短纤概念上涨0.56%,医美概念上涨0.05%。 ST美谷的投资逻辑如下:1、公司将医美事业深耕长三角、大湾区,构建“1+N”模式,“1”是以连天美为代表的5A级医美医院;“N”是以奥若拉为代表的轻医美连锁品牌。 3月13日的资金流向数据方面,主力资金净流入1134.05...
  • 无缝整合:跟随式更新让软件焕发新机

    无缝整合:跟随式更新让软件焕发新机
    在瞬息万变的科技世界,软件更新至关重要,可确保软件功能强大、安全且高效。传统的更新过程往往费时费力,需要用户手动下载和安装更新程序,这可能会导致系统停机和潜在的安全漏洞。 为了解决这些挑战,跟随式更新应运而生。跟随式更新是一种创新技术,可实现软件的无缝更新,无需用户干预。 跟随式更新的优势 无缝更新:跟随式更新在后台进行,不会中断用户的活动,确保工作的连续性。 自动下载和安装:软件会自动下载和安装更新,消除了手动操作的麻烦和潜在错误。...
  • 3月25日生肖兔:事业、财运、爱情、健康运势精准预测

    3月25日生肖兔:事业、财运、爱情、健康运势精准预测
    事业运势 今日工作状态较为积极,思维活跃,容易产生新的想法和思路。工作中遇到的挑战,你也能积极面对并寻找解决方案。适合与同事进行沟通合作,共同完成项目。不过要注意避免过度自信,保持谦虚的态度,尤其是在与领导沟通时。 对于创业者而言,今日有利于拓展人脉,结识新的合作伙伴。但需要谨慎评估合作对象,避免被虚假信息迷惑。建议多考察,多沟通,确保合作的可行性。 财运运势 今日财运平稳,正财收入...