以下文章来源于大模型之家
在2024年巴黎奥运会的璀璨舞台上,全球目光再度汇聚于体育运动的激情与荣耀,同时,这一体育领域的盛大赛事,也成为展示科技应用的绝佳场景。在这次盛会中,体育竞技已超越单纯的体力和技艺较量,升华为一场尖端技术的角逐。为深入探讨科技与体育的融合之道,大模型之家《我AI奥运》专题栏目荣幸地邀请到了利亚德集团CMO,虚拟动点董事长兼CEO刘耀东。访谈中,刘耀东凭借丰富的行业经验和独到的视角,以利亚德·虚拟动点的技术布局和应用场景实例出发,为我们揭示了AI和空间计算技术如何赋能体育,以及未来体育科技发展的无限可能。过去,体育运动更多是依靠运动员个人努力以及教练常年的经验。随着现代体育的发展,对成绩和极限的日益追求,基于人眼观察的方式已无法满足体育运动员成绩的提高,科学技术已经全面融入到现代体育的各个环节之中。刘耀东认为,如今的体育竞技项目,已经远远超越了单纯的体力较量,背后更是国家科学技术角力的舞台。在这一过程之中,人工智能工具的广泛应用正在引领体育行业迎来全新变革,尤其是在数据分析和运动表现提升这两个关键领域。借助先进的AI和空间计算技术,运动员们得以接受更为精准的训练指导特别是大模型技术在体育产业中的应用,极大地提升了运动员的竞技水平。刘耀东表示:空间计算是指在一定空间场地条件下,基于所有人、物位置关系的整体结果,而动作捕捉技术则是空间计算领域中的一个重要分支。在体育运动场景下,除了关注运动员的动作细节外,还需要深入考量物体与人的互动关系,例如在冰壶、橄榄球、乒乓球等项目中,物体的运动轨迹和力量关系对比赛结果有着不可忽视的影响。他指出:虽然动作捕捉技术并非新兴技术,但其在体育领域的应用却赋予了这项技术全新的生命和意义。与影视领域相比,体育领域对动作捕捉技术的需求更为专业和精细。传统的动作捕捉技术,例如光学捕捉,虽然能够提供极为精确的数据,有助于复制顶尖运动员的标志性姿势和发力角度,但这一过程通常要求运动员身着特制的动捕服。然而,部分运动员或体育项目并不总能满足相应的环境要求和穿戴条件,在一定程度上限制了技术的应用。面对这一挑战,第二代空间计算技术——基于机器视觉的无标记点技术应运而生。这种技术免去了运动员穿戴任何设备的需要,仅需在环境中部署数台高速摄像机,便可实现精准的动作捕捉。通过结合AI算法和空间计算技术,还可以为运动员提供辅助训练、康复以及竞技状态调整等方面的数据和建议,从而对整个体育领域产生更深远的影响。以虚拟动点为北京体育大学乒乓球项目提供动作捕捉和测量服务为例,通过空间计算技术提炼明星运动员动作,能够有效提升竞技水平。“中国是个体育强国、体育大国。当谈到‘大’的概念时,并不是国家队才可以享用到尖端的技术。随着无标记点技术的成熟,我们希望把它推广到更多的地区、更多的场景里。比如到高校、大众健身的场景里面,赋能更多的百姓、学生和儿童。”刘耀东相信,随着技术的不断进步,空间计算等相关技术在体育领域的应用将变得更加灵活和实用。在运动场景之外,在影视动画制作、游戏开发、工业仿真、职业教育等领域,虚拟动点通过技术创新,为用户提供更为优质的解决方案,推动行业发展。“虚拟动点最高峰的时候,美国好莱坞的大片,69%的影片都是用我们的动捕技术来做的。《三体》《流浪地球》《封神》等电影中,虚拟动点也都参与其中。”刘耀东表示,在游戏领域,虚拟动点同样取得了显著的成就,例如全球知名的游戏《2K》和《使命召唤》中,都有动作捕捉技术的身影。这些先进技术不仅极大提升了影视和游戏作品的视觉震撼力和真实性,也为娱乐产业注入了新的活力。在工业制造领域,空间计算技术同样扮演着举足轻重的角色。刘耀东透露:“虚拟动点还助力波音、奥迪这些全球领先的工业制造企业,进行整个空间结构的精细测试、测算,实现对工业设备和生产线的精细监控和优化,提高生产效率和产品质量。”关于“空间计算”技术的概念的起源,最早可以追溯到2003年麻省理工学院Simon Greenwold的文献,揭示了空间计算的核心特征和广阔的应用前景。刘耀东表示:“空间计算时代,我们第一次可以走入数字世界,与实体世界在数字层面实时交互。”空间计算作为一项前沿技术,正逐步重塑人们的生活和工作方式。刘耀东认为,空间计算技术的核心价值在于解决虚拟世界和实体世界之间的3D数据关系。“我们希望通过空间计算技术,让实体世界和数字世界同步进入一个立体的世界,实现真正的3D数据理解和生成。”因此,在虚拟动点“一体三核”发展战略中,“一体”明确指向公司将空间计算作为战略核心,专注于交互技术的研究与应用。“三核”则包括:AI大模型,利用丰富的空间数据进行训练,以提高动作识别和生成的准确性;硬件设备,作为算法的物理载体,确保技术的实际应用;空间数据,通过硬件设备收集而来,为AI大模型提供训练所需的关键信息。今年年初,OpenAI发布Sora视频大模型,引发了行业对于利用AIGC技术缓解内容生态问题的关注。刘耀东指出,Sora的3D位置关系仍是基于2D模拟,缺乏对真实世界物理逻辑的理解。而虚拟动点追求的,是解决在3D位置关系方面的突破,即利用大模型,真实地去操控实体世界的物体,或者与实体世界的物体产生交互,而非与Sora一样去模拟这个过程。因此,想要根本性地解决空间计算的问题,则需要更“懂”物理世界交互的大模型。虚拟动点LYDIA动作大模型专注于空间计算中动作数据的生成与理解,能够广泛应用于影视领域、游戏、动画、电商、教育、体育、文艺等多元行业,满足各种空间计算内容生成需求。“目前在动作大模型领域,虚拟动点在全球范围内处于领先的地位。”刘耀东自豪地表示,“一个是我们的数据优势,虚拟动点拥有不同的数据单元和动作的数据库;二是LYDIA自推出以来,不断的优化的算法成功解决了动作结构化的难题。我们希望未来这个基于动作的大模型可以真正能实现所有动作的自然生成,并真正在AIGC层面为生产力带来巨大变革。”他透露,虚拟动点将继续依托自身数据能力优势,持续优化LYDIA大模型。未来,除了深化在影视、动画等优势领域的应用外,还将探索机器人具身智能、无人机自动驾驶等新方向。“作为一家专注在技术领域的公司,一定要吃着碗里的,看着锅里的,还得瞄着地里的。”刘耀东如是说。其中,“碗里的”指的是光学技术,“锅里的”是虚拟动点多年投入的无标记点的技术,而“地里的”下一代技术,虚拟动点将目光瞄向了生成式大模型。刘耀东眼中的“第三代技术”便是基于大模型的动作数据的生成:“光学技术的进步,让我们拿到了更准确的数据,机器视觉的无标记点则是为了提升数据获取的效率和敏捷性。而大模型能够生成数据,我们希望它能同时兼备前两代的精确性与效率的优势,同时又能满足这种极高效率的涌现。 “作为科技公司,技术是第一生产力。”刘耀东特别强调了技术创新在虚拟动点发展中的核心地位:“我们未来的业务布局和发展方向将沿着算法、硬件和数据这三种核心能力展开。我们将一方面继续优化我们的光学算法和机器视觉的无标记点技术,另一方面还要积极寻找更多的应用场景,让技术真正服务于用户、创造价值。”刘耀东强调,空间计算的落地需要充足的生态系统支持,正如苹果市场的成功背后有着成千上万的开发者。同样,中国市场也需要更多开发者的加入,共同推动技术的应用与发展。在与合作伙伴共同推动空间计算领域发展的过程中,虚拟动点主要扮演了“四重身份”:第一,虚拟动点是一家“硬件提供商”,能够将算法部署在边缘计算设备和动作采集设备中。第二,虚拟动点是一家“解决方案商”,在体育,影视、游戏、医疗等领域形成了成熟的端到端的空间计算解决方案。第三,虚拟动点也是一家“内容提供商”,拥有成熟的数字人、数字场景、数字孪生开发能力,能够为合作伙伴提供赋能。第四,虚拟动点还是一家“场景集成商”,能够提供从顶层设计到硬件供应、方案制定、内容创作乃至运营的全方位服务体系,并在技术提供之外,让更多客户理解空间计算所能塑造的场景。刘耀东表示,虚拟动点正在积极寻找更多的合作伙伴:“我们希望通过与通路型的销售伙伴合作,将我们的技术和产品推广到更广阔的市场。同时,我们也欢迎更专业的内容合作伙伴加入,共同推动数字场景和交互技术的发展。”在访谈的最后,刘耀东表示:“无论是大模型还是空间计算,数字世界发展的浪潮正日益呈现。在过去二三十年的社会发展历程中,从工业革命到信息革命,我们从未见过生产力如此迅速的提升。到了空间计算和大模型时代,我们要时刻去追赶最先进的技术,并将最先进的技术去落实到各自的产业与场景之中。虚拟动点也希望能与更多的开发者、更多的上下游的厂商共同努力,将技术落地生根。我们不应陷入对技术的悲观,我们要相信技术一定可以改变人类的发展,为人类造福。”在人工智能和空间计算的交汇处,我们正见证着技术与产业的深度融合,构建出一个前所未有的行业发展格局。在未来,两者的融合将重新定义多个行业的生产力边界。从工业自动化到智能家居,从体育竞技到城市规划,这些领域都将被赋予全新的生命力。