1.1 基本概念:五大技术体系支撑 XR 走向高虚拟化与高交互便捷化之路
1.1.1 MR 是什么?—— 混合现实,将部分数字元素虚拟化元素置于现实世界当中
MR(Mixed Reality,混合现实技术)能够将部分数字元素虚拟化置于现实世界当中, 同时支持较为灵活的实时交互。
AR(Augmented Reality,增强现实技术)则仅能将数字元素叠加到现实世界环境中, 虚拟化程度较低,且通常无法实现与场景之间的交互。MR 从属于 AR,在 AR 基础 上增进了虚拟化能力与实时交互技术。
VR(Virtual Reality,虚拟现实技术)则完全遮挡现实世界环境,由计算机生成完全 虚拟环境,而 MR 则可以实现现实世界到虚拟世界的完全融合。
XR(Extended Reality,即扩展现实技术)涵盖任何通过在现实世界环境中添加数字 元素来改变现实的技术,包括 AR、MR、VR。
1.1.2 XR 需要哪些技术?——近眼显示+渲染计算+感知交互+内容生产+网络通信
XR 产业的发展有赖于近眼显示、渲染计算、感知交互、内容生产与网络通信五大技术体 系的成熟。
近眼显示:也称头戴显示或可穿戴显示,可在单眼或双眼视场中渲染出光场信息,进 而在眼前重建虚拟场景。快速响应液晶屏、折反式(Birdbath)已规模量产,MicroLED 与衍射光波导成为重点探索方向。目前多数 XR 设备采用快速响应 OLED 显示 技术,少数如 AVP(Apple Vision Pro)采用了 Birdbath 技术,雷鸟 X2 等采用了 Micro-LED 与衍射光波导技术。
渲染计算:渲染技术指电脑绘图中将三维场景转化为数字图像的过程。渲染计算方面, 端侧算力不足仍然是掣肘 XR 设备使用体验的重要屏障。云渲染、人工智能与注视点 技术等进一步优化渲染质量与效率间的平衡。
感知交互:指 XR 设备通过感知和理解用户的动作、语音、姿势等信息,以更自然、 直观的方式实现人与设备的互动。内向外追踪技术已全面成熟,手势追踪、眼动追踪、 沉浸声场等技术是能自然化、情景化与智能化的技术发展方向。包括 AVP 在内的主 流 XR 设备厂商已逐渐开发出手眼协同的新一代人机交互范式。
内容生产:指为 XR 设备创建具体应用、游戏、体验或其他交互性内容。Web XR、 OS、OpenXR 等支撑工具稳健发展,六自由度(DoF, Degree of Freedom)视频摄制技术、虚拟化身技术等前瞻方向进一步提升虚拟现实体验的社交性、沉浸感与个性 化。内容生产方面,多数 XR 设备厂商仍面临内容生态尚未打通或应用场景尚不清晰 的问题。
网络传输:将 XR 应用中生成的数据传输到 XR 设备中需要高带宽、低延迟的网络连 接,以确保用户在使用 XR 设备时获得流畅、高质量的交互体验。在 XR 设备逐渐成 为“下一代个人计算中心”的发展道路上,5G+F5G、Bluetooth 5.4 以及 Wifi 7 等基 础通讯设施与通讯协议的发展完善也不可或缺。5G+F5G 构筑虚拟现实双千兆网络 基础设施支撑,传输网络不断地探索传输推流、编解码、最低时延路径、高带宽低时 延、虚拟现实业务 AI 识别等。
XR 趋向高虚拟化与高交互便捷化发展。按照虚拟化程度与交互边界程度的高与低,现存 的 XR 技术大致可被分类①高交互低虚拟(MR);②低交互低虚拟(AR);③低交互高虚 拟(VR)的四分矩阵当中的三大维度。未来,以 Apple Vison Pro 为代表的 MR 终端产品与以 Meta Quest 3 为代表的 VR 终端 产品或以不同的技术路线与应用起点同归于四分矩阵的右上角——④高交互便捷度与高 虚拟化程度。其中,Apple Vison Pro 侧重手眼交互与一定程度的虚拟现实融合;Meta Quest 3 则在以往手柄交互的基础上逐步添加手势交互功能,且增强了虚拟现实以外的透 视现实功能。我们认为,二者的技术演进一定程度上反映出 XR 产品未来高虚拟化与高交 互便捷化的发展趋势。在一个飞速发展变化的科技行业中试图对某一阶段的产品进行分类定义很可能落入旧范 式的窠臼。因此,在后文的讨论当中,我们将不再具体区分 AR/VR/MR 的分野,而会统 并在 XR 的语境之下。
1.2 产业全景:硬件终端+内容生产+分发渠道,硬件能力与内容丰富度互为支撑
XR 产业链主要包括元器件/终端生产、内容生产与应用、分发渠道三大关键环节:元器件/终端层面:侧重硬件,主要分为关键器件和终端外设,前者包括芯片、显示、 传感、光学等,后者包括头显整机、感知交互外设等。内容生产与应用层面:侧重软件,主要分为开发环境/工具和采集系统两部分,前者 包括操作系统、开发引擎、SDK、API 等,后者包括 360 视频、拼接缝合、3D 建模、 光场等。内容应用上,AR/VR/MR 主要向 G 端的数字展馆,B 端的工业、教育、医 疗、创意等行业,和 C 端的文娱(游戏、文旅、社交、直播等)领域布局。分发渠道层面:包括硬件的分发与内容的分发,分为线上和线下两部分,线上包括以 互联网厂商主导的内容聚合和分发平台,以及电信运营商发力的电信级云控网联平 台,线下则包括自助 VR 终端机、线验店、主题乐园等。我们认为,XR 作为潜在的“下一代个人计算中心”的核心价值在于其用于计算处理的软 件与内容生态本身,无论是 G/B/C 端用户最终都是在为 XR 终端上的内容付费,具备优 质内容是硬件得以规模化销售的胜负手之一。同时,优质内容需以强硬件能力及高硬件渗 透率做支撑。
建模工具与开发引擎或为 3D 内容生产关键抓手。XR 作为潜在的“下一代个人计算中心” 将会彻底颠覆移动互联网时代基于智能手机与平板电脑的 2D 内容消费习惯,XR-Native 的内容主体很可能是 3D 的,而 3D 内容的生产涉及 3D 扫描建模、3D 软件建模、3D 创 作工具、AIGC 建模、体积视频建模等关键环节。
1.3 市场空间:我国 XR 产业百亿市场,娱乐/游戏/工业制造/教育场景或为主要增长极
娱乐与游戏场景驱动 C 端市场扩容,教育与工业制造或为 B 端市场主要增长极。艾媒咨询预测,2025 年消费级市场中,娱乐和游戏位居第一、第二,市场规模或达 87.5 亿元和 68.0 亿元,2030 年市场规模或达 147.0 亿元和 114.3 亿元。艾媒咨询预测,在企业级应用市场中,工业制造和教育市场规模排名靠前,2025 年或达 335.5 亿元和 291.9 亿元,2030 年或达 564.1 亿元和 490.4 亿元。
近年来 XR 内容呈现井喷状态。2019 年以来,以游戏为代表的 XR 设备内容呈现井喷状 态,陆续出现《一起来捉妖》、《刺客信条:Nexus》等诸多爆款产品。我们认为,XR 爆 款内容的推出与内容生态的逐渐完善将有助于 XR 硬件设备的破圈放量。
2. XR 拐点将至:通用型 XR 跨越十年再度问世,我国 XR 出货量快速释放
2.1 拐点线索一:通用型 XR 产品跨越十年再度问世,XR 产品近年间集中爆发
通用型 XR 产品跨越十年再度问世,APV 向 Google Glass 跨越十年的致敬。通用型 XR 设备:2013 年,Google Glass 正式对外发售,定位于通用型 XR 设备以 AR 眼镜的可穿戴智能设备形式首次出现在大众视野当中;十年之后的 2023 年,苹 果发布 AVP 先导片,定位于通用型 MR 设备,通用型 XR 重新进入大众视野,在 Google Glass 发布十年之后再度引发广泛关注。专业型 XR 设备:2015 年,微软发布了旗下面向 B 端专业场景的 AR 产品 HoloLens。2019 年,微软发布 HoloLens 二代产品。消费型 XR 设备:2018 年,国内初创公司 NREAL 和 Rokid 发布各自的初代 AR 产 品,定位于偏内容消费型的 XR 产品。Meta(原 Facebook)旗下 Oculus 发布偏游 戏内容消费型的 Quest 初代产品。2022~2023 年,主流 XR 设备厂商相继迭代自家 主打产品。
Google Glass 留给 XR 的遗产,一台像普通眼镜一样的通用型个人计算终端。2011 年, Google Project Glass 团队就已经在测试早期版本的 Google Glass 原型产品。彼时,团 队使用常规的眼镜框,将镜片替换为特制的 HUD(Head-Up Display,头戴显示设备)模 块;2012 年 4 月,Google 联合创始人,Google Glass 项目牵头人 Sergey Brin 首次佩 戴 Google Glass 公开亮相;2013 年 4 月,Google 眼镜的探索者版本(Explorer Edition) 以 1,500 美元的价格向测试者与 Google I/O 开发者发售。2013 年 11 月,Google Glass 发布包括搜索歌曲、扫描已保存播放列表、收听高保真音乐等一系列功能,同时还具备消 息提醒、地图导航、相机、小游戏等功能。在此后的数年当中,Google Glass 始终未曾 “跨越鸿沟”,集中在科技极客的小圈子当中长期处于“叫好不叫座”的尴尬境地。我们认为,一台能够成为下一代个人计算终端的 XR 设备一定是一台通用型产品,而非仅 仅用于内容消费或者强调工业场景的生产力工具。2013 年发布的 Google Glass 作为初 代通用型 XR 设备实质上奠定了未来十年 XR 的基本范式,即便其最终并未“跨越鸿沟” 获得市场层面的极大成功,但是却留给整个 XR 产业许多有价值的启发:
产品形态上,通用型 XR 设备的长期佩戴属性决定了其应当是小型化、轻量化的,像 一副普通的眼镜一样便于穿戴的;技术路线上,通用型 XR 设备适配 OST 与 VST 技术方案各有优劣,OST(Optical See-Through,光学透视)方案能够让佩戴者直接看到现实世界,它只针对虚拟的东 西做数字化,不对物理世界进行重建,因此更容易做轻量化;VST(Video SeeThrough,视频透视)方案能够让佩戴者经由摄像机回传的画面看到外部世界,更容 易实现数字坐标系的对齐,还可以对数字世界进行任意改造,因此更有沉浸感;应用场景上,通用型 XR 设备至少应具备图像与音频的采集能力与一定的端侧计算能 力,以支持①消息提醒类:看时间、看天气、看未读消息;②语音交互类:免提通话、 听音乐、导航;③专业功能类:贴面翻译;④内容生产/消费类:瞬时拍照、录像/视 频、游戏内容消费;⑤生产力助手:基于 AI 的数字助理等功能。
若将以上三点一一对照,我们认为 AVP 的发布优化了虚实融合与虚实转换的体验,在苹 果内容生态的加持之下承载了海量 APP 的使用体验,有望改变通用型 XR 设备“叫好不 叫座”的困境,是对 Google Glass 一次跨越十年的致敬:产品形态上,AVP 相比 Quest、Pico 等 VR 头显更贴近眼镜形态,且重量相对更轻(AVP 454g,Quest 3 515g、Pico 4 586g);技术路线上,AVP 采用 VST 方案,更加强调虚实融合与虚实切换,沉浸感更强;应用场景上,AVP 相对 GG(Google Glass)而言具有苹果生态加持,海量 APP 可 直接迁移到 AVP 界面中进行使用,且能够实现多设备间的协同联动,未来在 AI 加持 之下,有望助力 Siri 从语音助理到 AI 助理的飞跃。
2.2 拐点线索二:XR-Native 的交互方式(手眼交互)&内容形态(空间视频)初现
交互即应用,媒介即信息。近三十年间我国乃至全球经历了由 PC 互联网到移动互联网时 代的变迁,并且有望在本轮 AI 技术革命的牵引下进入 XR+AI 时代。我们认为,PC 互联 网移动互联网XR+AI 的时代变迁向内看本质上是人机交互范式的转变(键鼠平面 多点触控空间手眼交互)所带来的应用场景的扩容,向外看则是硬件载体的小型化过程 中内容传播媒介与分发效率的变化(门户网站手机 APP)。
人机交互方式上,①键鼠模式下应用场景被限制以文本为主的内容生产、消费与部分 即时通讯功能的实现,PC=电子记录本+电视;②平面多点触控(含麦克风、摄像头、 手电筒等)模式下则拓展了应用场景的深度,相继诞生了基于多点触控功能的水果忍 者/愤怒的小鸟、基于语音采集与语义理解的语音助理、基于移动定位功能的地图导 航/外卖送餐/在线购物、基于相机功能的短视频生产/消费/分发平台等,智能手机/平 板电脑=电话+手电筒+相机+电视+其他;③在未来的手眼交互模式下,我们有理由相 信相比智能手机与平板电脑,通用型 XR 设备的应用场景深度将进一步得到挖掘,诞 生诸如贴面翻译等 XR-Native 的应用形态。
传播媒介&内容形态上,我们认为,PC 互联网时代的门户网站与移动互联网时代的 APP 更多是对于 2D 内容(新闻、书籍、传统影视作品)与货物商品(外卖、快递) 分发渠道的变革(生产关系的变革),而在 XR+AI 时代下,由于用户信息接收载体出 现了革命性的改变,优质 3D 内容的规模化制作或将成为下一时代的胜负手(生产力 的变革),AIGC 将会在其中起到重要作用。我们认为,在即将到来的 XR+AI 时代,一方面,人机交互形态的变化势必会在移动互联 网时代的基础上持续拓宽应用场景,另一方面,XR 设备对于 3D 内容的极大需求也将推 动优质 3D 内容的规模化制作或将成为下一时代的胜负手。目前,以 APV 为代表的手眼 交互模式很有可能会成为未来 XR 设备的通用交互范式,而以苹果空间视频为代表的 3D 视频将有可能取代 2D 视频成为 3D 内容版图中一块重要的拼图。全新交互模式的诞生与 新兴内容形态的初步显现或标志着 XR 产业已进入“跨越鸿沟”的历史性拐点。
AVP 重新定义手眼交互的人机交互方式。在苹果 2023 年发布的 AVP 先导片当中,AVP 利用眼动追踪、手势捕捉与计算机视觉技术实现了极为惊艳手眼交互效果。其中,眼动追 踪技术要解决的三大问题是眼球的注视点看向哪里?何时看?看多久?在 AVP,眼动追 踪系统包含了近红外光源、高分辨率摄像头以及图像处理相关的算法。
AVP 具备观看“空间视频”功能,iPhone 15 Pro 已具备拍摄空间视频功能。在苹果 2023 年发布的 AVP 先导片当中,AVP 提出其具备观看“空间视频”的功能,且苹果旗下 iPhone 15 Pro 已具备拍摄空间视频的功能,苹果生态产品一定程度上形成了自我内容生产与内 容消费的闭环。目前,苹果通过重叠两张不同角度拍摄的照片或者视频,利用人眼的视差 来实现 3D 的空间感,未来,基于空间信息采集及建模的“体积视频(Volumetric Video)” 或逐步取代现有的“空间视频”为用户提供更为立体的 3D 内容体验。
XR 内容的丰富可促进硬件设备的购买,二者形成良性循环,或将推动市场爆发。2016 年 AR 领域的《Pokemon Go》曾风靡一时,受一众玩家追捧。2020 年 VR 领域内容爆品《半 衰期:Alyx》正式发售,头部游戏产品开始出现但数量较少,主要有《Beat saber》、《Super Hot》等,销量均在百万份级别。内容是提升交互性的重要支撑,硬件设备是沉浸式体验 的基础,二者相辅相成,爆品内容的推出可能带来硬件设备的起飞。我们认为,伴随众多 内容生态开发者入局,更多优质内容将会带来“硬件销量增加用户增加开发者获益 更多开发者加入优质内容增加硬件销量增加”的正向循环,实现飞轮效应。
2.3 拐点线索三:全球 XR 出货量突破 1,000 万台,我国出货量增速远超海外
全球 XR 硬件出货量迅猛增长。2022 年全球 VR 出货量为 986 万台,Pico 拉动国内 VR 出货量迅猛增长,海外市场受产品周期影响 VR 出货量短暂下滑。据 Wellsenn XR,2022 年中国 VR 整体出货量为 121 万台,其中 Pico 贡献了 79 万台的出货量,同比增长 218%, 2025 年出货量或达 800 万台。2022 年海外 VR 整体出货量为 865 万台,同比减少 13%, 主要系 Quest 2 销量下滑,Quest Pro 等新产品销量不及预期,2025 年出货量或达 2,700 万台。
2022 年全球 AR 出货量为 43 万台,国内外差距更小。消费级 AR 使国内 AR 出货量显著 增加,海外 AR 出货量增长平缓。据 Wellsenn XR,2022 年中国 AR 整体出货量为 14 万 台,同比增长 133%,主要系 AR 产品逐步向消费级渗透,2025 年出货量或达 60 万台。2022 年海外 AR 整体出货量为 29 万台,同比增长 26%,主要系新品发布较少,2025 年 出货量或达 240 万台。
从计算机行业的技术视角看,可以为 XR 领域提供的技术主要包括算力技术和算法技术两 个方面。从算力方面来看,云边端协同的算力部署方式可以承载 XR 对于算力和基础设施 的庞大需求。从算法方面来看,人工智能围绕数据的搜集、加工、分析、挖掘过程中释放 出的数据生产力,为 XR 提供信息采集、分析与内容生产支撑。从计算机行业的应用视角 看,XR 应用领域主要包括数字文旅与数字孪生,数字文旅主要应用于景区、文博、演艺、 文创、虚拟人物、游戏等行业场景,数字孪生主要应用于工业、城市、交通等行业场景。
云边端协同一体化为 XR 提供强大算力支持。云边端协同一体化解决了算力限制和信息传 输的速率质量,可以为 XR 提供随时随地联通支持。在云边端协同一体化中,“云”是传 统云计算的中心节点,是边缘计算的管控端;“边”是云计算的边缘侧,分为基础设施边 缘和设备边缘;“端”是终端设备。随着云计算能力从中心下沉到边缘,边缘计算将推动 形成“云、边、端”一体化的协同计算体系,为 XR 的实现提供强大算力基础。
云计算:包括数据中心的私有云,以及超大规模数据中心承载的公有云,如 AWS、 AZURE、Google 云、阿里云、腾讯云等,提供了便捷、易扩展的计算资源使用方式, 帮助实现类似 AIGC、大数据分析、云渲染、备份归档等任务。
边缘计算:将耗费计算资源和带宽的任务运行在边缘计算节点或者边缘计算数据中 心上。与云计算相比,边缘计算可以有效减少用户体验的延迟。因为边缘平台靠近用 户,其与用户的数据交换会更加及时,用户体验的延迟问题可以得到较好解决。研究 表明,借助边缘计算,延迟可以降低 60%以上。
端计算或终端计算:端侧计算是指在设备本身执行计算任务,而不是依赖于云端计算。这种计算方式通常会在 XR 设备内部或附近的边缘计算资源上进行。端侧计算具有降 低延迟、提高隐私保护以及减轻对网络的依赖等优势。如触觉手套、VR、AR 眼镜、 无人机吊舱内嵌有 AI 芯片的摄像头、风力发电的叶片等智能终端所包含的计算。
云边端协同产品助力 XR 应对算力挑战。华为与道客联合推出的云边协同超融合一体机有 效解决了计算资源匮乏等问题。九州未来旗下拥有 Animbus 算力协同平台和元宇宙平台 元沸点等。美林数据也推出了 Tempo Edge 云边协同平台等。
人工智能为 XR 提供算法支持,主要通过计算机视觉技术(CV)与自然语言处理技术(NLP) 解析外界采集的信息,基于机器学习技术通过 AIGC 支撑 3D 内容生产。
3.2.1 计算机视觉技术(CV):解析外界视觉信息,为赋予 VST 方案更强现实感
计算机视觉是现实图像的数字化关键技术,为 XR 提供虚实结合的观感。计算机视觉是指 用摄影机和计算机代替人眼对目标进行识别、跟踪和检测等机器视觉处理过程,通过图形 处理技术,使计算机处理生成更适合人眼观察或适用于仪器检测的图像。计算机视觉技术 可代替人类分析现实环境,同时做出信息判定和数分析功能。计算机视觉技术流程主要包 括图像获取、预处理、分割、特征处理、分类和输出结果等步骤。
3.2.2 自然语言处理技术(NLP):解析外界音频信息,智能语音助手基石
自然语言处理技术为 XR 的用户与用户之间、用户与系统之间的语言识别和交流提供技术 支撑。自然语言处理技术通过对语音的分析、理解和处理,帮助系统或设备实现与人之间 语音信息的交互,使机器具备自然语言交流能力。XR 对智能语音的核心需求是满足用户 与用户、用户与机器、系统之间的语义理解、特征识别、语音处理、实时交互需求。自然 语言处理技术主要包括“语音识别”和“语音合成”两项关键技术。语音识别技术是是输 入,让机器可以听懂,语音合成技术是输出,让机器可以说正确,两者相辅相成。
基于扩散模型所研发出的 T2(I Text-to-Image)模型备受关注。扩散模型(Diffusion Models) 提升了图像的逼真度与细节丰富度。扩散模型最初在 2015 年被提出,但直至 2020 年除 噪扩散概率模型(DDPM)推出后才受到广泛关注。扩散模型通过在前向阶段对图像逐步 添加随机噪声,直至图像被破坏变成完全的高斯噪声,然后再逆向该过程以生成高质量图 像。其独特之处在于其生成过程的逐步性和渐进性,使得生成的图像具有高度的逼真度和 细节丰富度。Stable Diffusion 与 MidJourney 模型均基于扩散模型开发而来,且一经问世 便以其稳定的性能受到广泛关注。Stable Diffusion 以其生成高质量的稳定图像能力而著 称,适合批量生成相同风格类型的图片;MidJourney 在创造细腻、具有艺术感的图像方 面表现出色。
众多计算机公司积极在 AI 领域布局。商汤科技积极布局计算机视觉领域推出智慧商业服 务、城市管理等模块化软件平台等。科大讯飞深耕智能语音领域,推出讯飞听见、语音庭 审系统等产品。
3D 渲染引擎将真实世界与虚拟的三维世界进行融合,打造 XR 的沉浸式体验。渲染引擎 同时兼顾视频和音频处理、排序、物体捕捉及跟踪反算、色域转换、网格布尔运算等综合 算法,通过兼容不同设计软件格式模型,在原有模型的基础上进行处理、渲染,添加材质、 光照、阴影、链接各类实时数据等,最后渲染输出至交互终端。
数字文旅是商用 XR 的典型应用,突破时空限制辐射众多场景。数字文旅是以网络为载体, 以大数据和数字技术和信息通讯技术与文旅业的深度融合而形成的新产业形态。XR 结合 3D 渲染和全息成像技术,为景区游客带来沉浸式体验;通过展会方式模拟实景参观以解 决文博需求;还可以打造小型化、数字化沉浸式娱乐互动产品,满足文旅演艺需求。此外, XR 技术助力打造文创、虚拟人和游戏等领域的 IP。一方面增强交互性,开发沉浸式体验 新空间;另一方面拓展应用场景并带来增值空间,推进智慧旅游产品升级和转型发展。
后疫情时代,数字文旅成为市场需求热点,各大文旅集团积极布局数字文旅业务。文旅部 “十四五”规划明确提出,大力培育文化新型业态,培育 100 个沉浸式体验项目,并于 2023 年 8 月公布了首批全国智慧旅游沉浸式体验新空间培育试点名单。
数字孪生是 XR 与工业结合的典例。数字孪生是指在虚拟环境中建立和现实世界一致的模 型。虚拟环境能够实时反映真实产品的状态,在虚拟环境中做的各种仿真测试、分析优化 的结果,可作为指导和干预现实世界决策与行为的重要依据。
XR 赋能数字孪生实现工业生产降本增效,并辐射到其他行业。XR 技术可智能获取现场 数据,进行缺陷检测和虚实叠加,实现三维作业流程引导,并实时显示任务完成进度,从 而避免失误操作情况发生,提升员工工作效率。此外,当设备发生故障时,XR 技术可以 实现专家远程指导,通过瞬时标注、音视频通话等处理故障,从而降低设备停机时间,提 升生产效率。XR 技术可从产品设计生产延伸到售后、运维全流程,促进产业革新。从行 业视角出发,XR 与数字孪生的融合也在向医疗、教育、城市、汽车等领域拓展。
计算机公司积极布局数字孪生业务,解锁工业、城市、交通等领域的应用场景。其中 DataMesh 是工业领域的核心供应商,公司业务聚焦工业制造场景,通过快速连接 CAD/BIM/IoT 及知识数据,结合 XR 技术,实现物理世界与数字世界的虚实映射和仿真, 打造工业、建筑场景下的元宇宙。
风语筑为国内数字展示龙头企业,积极推动数字化体验经济,拓展新型文旅场景的应用。公司结合自身业务资源和 VR/AR/MR、全息影像、裸眼 3D、AIGC 等关键技术手段,产 品及系统广泛应用于政务服务、城市文化体验、数字展示、文化旅游、广电 MCN、新零售体验及数字艺术消费等众多领域。公司主营业务主要分为 3 类:城市数字化体验空间:着重于政务宣传目的,可以进一步细分为城市馆规划展示馆、 产业园区展示馆等。通过数字化技术手段展示城市或产业园区的历史文化底蕴、发展 历程、建设成就和未来规划愿景,是各地开展政务接待、招商引资、规划展示和城市 形象宣传的重要窗口和平台。文化及品牌数字化体验空间:着重文化宣传目的,可以细分为科技馆、博物馆、文化 馆或文化主题体验空间等。将创意、设计、数字艺术和沉浸式体验元素深度融入 IP 主题、在地特色和品牌形象之中,重点面向大众和消费者开放的新型互动体验式空间。数字化产品及服务:主要通过全息影像、裸眼 3D、CGI 特效、VR/AR/MR、4K/8K 超高清视频等技术手段和媒介形式,为客户和消费者提供商业展览、数字艺术消费品 及各类数字视觉服务。
风语筑营收及利润 23 年企稳回暖。公司 2022 年营业收入为 16.8 亿元,同比减少 42.8%, 归母净利润为 0.7 亿元,同比减少 85.0%,归母净利率为 3.9%,主要原因系受宏观环境 影响,客户需求减弱导致完工项目减少。2023 年实现业绩反弹,Q1-3 营业收入达 18.4 亿元,同比增长44.1%,归母净利润达2.1亿元,同比增长1,597.6%,归母净利率为11.3%。
数字文旅为公司业务发展重心,城市数字化体验空间收入占比逐步提升,数字化产品及服 务毛利率最高。城市数字化体验空间业务和数字化产品及服务均属于数字文旅业务,前者 面向 G 端,后者面向 C 端,对 VR/AR/MR、裸眼 3D、全息等技术的应用需求更多,毛利 率也更高。公司客户目前以 G 端为主,未来将继续以数字文旅为发展重点,深度融合 VR/AR/MR 等技术,面向 C 端布局,并打造系列 IP 拓展 B 端用户。公司近期代表性数字 文旅作品包括“消失的法老”、“三体沉浸式艺术展”、“达摩石窟光影艺术馆”等。
4.2 万兴科技:我国数字创意软件领航者,战略投资 Realibox 布局 3D 引擎
作为全球领先的新生代数字创意赋能者,公司面向全球海量新生代用户提供简单高效的数 字创意软件、潮流时尚的创意资源和丰富多元的生态化服务,深耕数字创意软件领域,并 面向 AIGC 时代深度布局。公司四大产品条线包括视频创意、绘图创意、文档创意以及实 用工具,每条产品线内部也不断衍生出新的爆款产品,及时回应下游客户需求。
作为创作经济层的赋能者,以及创作市场的稀缺赋能者,公司旗下资源特效、音视频和图 像处理、协作工具等均是创作经济层的重要生产力和创造力工具。公司对内成立元宇宙研 究院,对外联合多家著名高校建立联合研究工作室并战略投资国内领先 3D 可视化云平台 Realibox,完成在 XR 市场的首笔投资,共同发力研究新技术、新应用、打造新工具。在 MR 背景下大火的虚拟数字人技术,万兴科技已打通技术与应用之间的逻辑实现。万兴科 技的产品 Wondershare Filmora 新版本结合元宇宙实现了诸多创新玩法。其中,视频创意 类软件万兴录演上线“虚拟人”功能,实现从真人演示到虚拟数字人演示的技术跨越,助 力泛知识类视频创作。在元宇宙前沿技术的探索方面,公司全力加码三维类素材创作规模, 探索 3D 模型和基于 Gan 网络的形象生成等技术的实现,加速智能化应用集成落地,从 以往主打二维动态渲染,正在完成向三维渲染的技术转型,并取得阶段性重要成果,直接 支持 VR、AR 等元宇宙应用场景。万兴 2022 年营业收入为 11.8 亿元,同比增加 14.7%,归母净利润为 0.4 亿元,同比增加 47.7%,归母净利率为 3.5%。2023 年业绩持续增长,Q1-3 营业收入达 11.0 亿元,同比 增长 30.7%,归母净利润达 0.7 亿元,同比增长 166.9%,归母净利率为 5.9%。
视频创意类服务收入占比最高,2023 年 H1 占比 63.6%,视频创意类服务毛利率较高, 且综合毛利率基本一致。公司视频创意类软件万兴播爆成为 AIGC“真人”短视频出海营 销神器,万兴录演上线“虚拟人”功能,公司不断推出新产品为 MR 创作经济层提供重要 生产力和创造力工具。
2021 年 6 月,万兴完成对广州引力波信息科技有限公司(以下简称 Realibox)的投资, 这是万兴在 XR(VR/AR/MR 集合)市场的首笔投资。Realibox 成立于 2018 年,这是国 内唯一拥有自主云端 3D 引擎及 PaaS 云平台的公司,在云端在线D 数据管理 与协同等方面拥有雄厚积累。2022 年 9 月,Realibox 宣布完成近亿元 A 轮融资,由成为 资本、高瓴创投、元璟资本、亿联凯泰联合投资,老股东万兴科技超额跟投。Realibox 目 前的核心产品包括:
Realibox iView:专注于 3D 设计沟通与评审的工具。在 Realibox iView 的协助下, 设计师及相关协作方可以做到多端实时轻松审图,而 3D 方案评论、跟随模式及深度 集成飞书等功能,帮助从业人员开启新一代沟通评审方式,极大提升生产效率。
Realibox iShot:专注于 3D 实时渲染的工具。包含 CMF 工艺设计、在线实时渲染、 虚拟打样等功能,搭配云端光线追踪技术,让照片级渲染的时间缩短至秒速级别。还 可通过云端素材资源共享与实时在线协同设计,实现本地化软件所没有的团队协同 能力。
Realibox iStudio:更简便的 3D/XR 交互内容创作及发布工具。支持多种格式的设计 数据导入,提供所见即所得的线上协同编辑模式,仅通过简单的拖拽,即可快速的创 建在线D/XR 交互场景。基于云端的内容分发,将 3D 场景置入品牌全渠道营销平 台,覆盖消费者全触点,创造沉浸式的 3D 场景化购物体验。
Realibox Open:3D 数据应用开放平台,所有在 Realibox 应用中所沉淀的 3D 数据 可以通过 API 或 SDK 集成至企业现有的业务系统中,打通“研发设计-市场营销”前 后端业务闭环,实现企业数字化从 IT 至 DT 的跨越升级。
4.3 美图公司:VIP 订阅业务收入占比高达 37.5%,基于图片社交优势布局数字藏品
美图近年业绩稳步增长。公司 2022 年营业收入为 20.9 亿元,同比增加 25.2%,毛利率 为 56.9%,归母净利润为 1.1 亿元,同比增加 29.9%,归母净利率为 5.3%。2023 年 H1 营业收入为 12.6 亿元,同比增长 29.8%,毛利率为 59.8%,归母净利润达 1.5 亿元,同 比增长 320.4%,归母净利率为 12.0%,原因系公司疫情限制解除后美业解决方案收入逐 步恢复等。
VIP 订阅业务收入占比最高,2022 年占比 37.5%,实现收入 7.8 亿元,同比增长 57.4%。SaaS 及相关服务收入增长强劲,占比 22.2%,系公司收购一家专注于向化妆品门店提供 ERP 及供应链管理 SaaS 方案的企业。在线广告及达人内容营销解决方案(IMS)收入受疫情冲击影响较大,收入占比呈下降趋势。公司将持续投资 AI,并将 AI 驱动的功能应用 于图像及视频产品,同时积极拓展生产力应用场景,从而推动更高的月活跃用户、付费渗 透率以及用户平均收入,促使 VIP 订阅业务实现可持续增长。
2022 年 6 月,美图公司旗下数字收藏品牌“美图宝石”首次对外发售数字藏品“像素记 忆”。“像素记忆”数字收藏品为拍照共创玩法,限量 198 枚,用户拍照合成就可以生成属 于自己的专属共创数字藏品。
丝路视觉深耕 CG(Computer-generated)视觉创意领域,是专业数字视觉综合解决方案 提供商。应用场景涵盖城市规划馆、主题展示馆、博物馆、企业形象宣传、大型庆典活动、 城市形象展示、设计可视化、高端地产营销、数字孪生、智慧城市、VR+K12 标准化试验、 VR+职业教育、VR+智能制造、VR+智慧园区、虚拟仿真、数字文旅等多个领域。公司主营业务主要分为 3 类:数字化展览展示综合业务、数字内容应用业务和数字孪生业务及 AR/VR/MR 交互式数字内容整体解决方案。
数字化展览展示综合业务:依靠高科技数字展陈手段与高质量的创意内容输出,为各 大城市规划馆、企业展厅、主题展馆、博物馆、科技馆、产业园区展馆、工业遗产等 各类型展馆展厅建设赋能,用专业的数字化展示技术探索践行科技化、艺术化、沉浸 式、交互式的展示模式,通过前沿数字技术与创新表达,以数字创意的力量构造数字 化、智能化展览展示空间。
数字内容应用业务:分为静态数字内容应用以及动态数字内容应用服务。前者以建筑 设计为起点,结合专业设计视觉技术与细腻画面表达,将设计师 2D 的设计蓝图转 换为 3D 立体的视觉呈现表达。后者利用 CG 技术,将创意构想通过 3D 建模、实 拍等多维度的表达,最终呈现高清特效的数字化内容作品,为政府机构和各行业进行 展示、营销和宣传。
数字孪生业务及 AR/VR/MR 交互式数字内容整体解决方案:以城市基建/生态建筑等 要素搭建三维数字城市底图,实现三维立体世界场景和实时图形呈现与应用的探索 与实践,打造数字孪生。深入布局 VR、AR、MR 等交互内容和解决方案,在教育领 域、智能制造、企业运维、可视化营销和文旅等多场景实现应用布局和落地。
丝路视觉 23 年业绩有所复苏。公司 2022 年营业收入为 12.9 亿元,同比减少 7.0%,归 母净利润为 4,612.9 万元,同比减少 35.8%,归母净利率为 3.6%,主要系总体人工成本 较上年增加。2023 年 Q1-3 营业收入为 9.5 亿元,同比增长 21.5%,归母净利润为 452.5 万元,同比减少 70.3%,归母净利率为 0.5%。
数字化展览展示综合业务收入占比最高,2023 年 Q3 占比 82.1%,数字内容应用业务毛 利率较高。数字化展览展示综合业务为公司发展主赛道,数字内容应用业务为公司传统优 势业务,近年来公司结合 VR/AR/MR、裸眼 3D、全息技术、人工智能、大数据、超高清 视频等多媒体高科技展示交互技术,推动业务转型升级。此外,公司进一步拓展交互式数 字内容在 AR/VR/MR 产业、数字孪生、智慧城市、智能制造、职业技术教育、智慧园区、 智慧文旅等行业内的应用场景,数字孪生/智慧城市和 VR/AR 综合解决方案力争成为公司 业务增长的第二曲线 虹软科技:计算机视觉行业领先算法服务商
作为计算机视觉行业领先的算法服务提供商及解决方案供应商,虹软科技将领先的计算机 视觉技术与人工智能技术商业化应用在智能手机、智能汽车、智能家居、智能零售、互联 网视频等领域,并且仍在不断探索新的领域与方向。VR、MR、AR 智能可穿戴设备相关方案作为公司前瞻性技术培育方向,公司 VR、MR、 AR 领域的创新产品目前已成功打入了行业头部厂商。为满足手机客户和新兴眼镜厂商在 VR、MR、AR 领域的需求,公司全面布局相关视觉产品,从标定、感知、交互和视觉呈 现四大方向布局算法解决方案。公司可以提供 相机标定解决方案等一站式多传感器标定 解决方案,智能扫地机解决方案等空间感知解决方案,手势交互解决方案等交互解决方案, 以及 360°环视视觉子系统(AVM)等视觉呈现解决方案。
虹软 23 年业绩企稳回升。虹软 2022 年营业收入为 5.3 亿元,同比减少 7.2%,归母净利 润为 0.6 亿元,同比减少 59.0%,归母净利率为 10.9%。2023 年实现业绩反弹,Q1-3 营 业收入达 5.0 亿元,同比增长 28.7%,归母净利润达 0.8 亿元,同比增长 53.2%,归母净 利率为 16.3%。
智能手机视觉解决方案收入占比最高,2023 年 H1 占比 91.7%,智能手机视觉解决方案 毛利率最高且高于综合毛利率。智能手机视觉为公司的主要业务,占比最高且毛利率高于 公司综合毛利率,助力为综合毛利率的提升。其人脸特效、手势交互和相机标定等方案为 公司进一步开拓 MR 领域提供技术和方法。
作为人工智能软件公司,商汤科技涵盖感知智能、自然语言处理、决策智能、智能内容生 成等关键技术领域,同时包含 AI 芯片、AI 传感器及 AI 算力基础设施在内的关键能力。商 汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块。基于公司自有的大模型,商汤科技进一步向 MR 领域拓展。商汤“日日新 SenseNova” 大模型体系下的“如影 SenseAvatar”AI 数字人视频生成平台、“琼宇 SenseSpace”和 “格物 SenseThings”3D 内容生成平台为元宇宙、虚实融合应用打开新的想象空间。商 汤科技联合 OPPO 以及高德地图共同打造的 AR 步行导航,创新性地将 SLAM 技术与传 统的 GPS 定位进行结合。此外,作为杭州亚运会官方智能视觉服务独家供应商,公司依 托“大装置+大模型”,使用 AI+AR 黑科技和商汤琼宇 SenseSpace 领先的 NeRF 技术, 构建沉浸式感受亚运氛围的亚运数实空间。
4.7 飞天云动:国内领先的 AR/VR 内容与服务供应商,自研引擎布局元宇宙
公司为领先的 AR/VR 内容与服务供应商,凭借自研 AR/VR 引擎布局元宇宙生态,为娱 乐、互联网、电商等各行业企业实现数字化升级及业务扩充赋能。公司为广告主及其代理 商提供 AR/VR 营销服务;为娱乐、游戏、教育、文旅、科技、保健及汽车行业提供定制 化 AR/VR 内容;同时提供 AR/VR SaaS 平台订阅服务,包含内容设计、开发及投放工具。
凡拓数创为数字创意行业领军企业,专注于将数字技术与文化创意相融合。公司主要提供 3D 数字内容制作、软件开发、综合设计、系统集成等一站式数字创意服务,广泛应用于 建筑设计、广告宣传、文化文博、科教科普、智慧城市、产城文旅、文体活动等领域。公 司主营业务主要分为 3 类:3D 可视化产品及服务、数字一体化综合服务和数字孪生及信 息化软件。
3D 可视化产品及服务:分为静态数字创意服务和动态数字创意服务。前者指利用计 算机图形图像制作和处理技术,根据客户提供的平面图或结构图,通过电脑三维仿真 软件模拟真实环境,将创意构思三维化、仿真化,为客户提供三维效果图等图像及设计服务。后者指用 3D 可视化技术、多媒体技术、软件开发技术等,为客户提供三维 影及数字互动软件(如 VR/AR/MR 系统、数字沙盘、数字多媒体交互系统等)。数字一体化综合服务:即数字展馆服务。主要通过 3D 可视化技术、AI、立体 (全 息)成像技术、AR/VR/MR 等数字多媒体集成技术的结合,提供以展示策划、总体设 计、3D 数字内容制作、软件开发和系统集成为核心的数字展馆全流程服务。数字孪生及信息化软件:主要应用数字信息技术,结合 AI、大数据、GIS、VR/AR/MR、 IOT 等技术,为客户提供基于智慧城市及产业园管理、行业 3D 大数据应用、工业数 据及信息化管理等的数字孪生平台、云虚拟展馆、数智虚拟人等产品。
凡拓数创近年间业绩有所承压。公司 2022 年营业收入为 6.1 亿元,同比减少 14.7%,归 母净利润为 1,816.5 万元,同比减少 74.2%,归母净利率为 3.0%,主要原因系受经营周 期性影响。2023 年 Q1-3 营业收入为 3.1 亿元,同比减少 28.4%,归母净利润为-2,288.4 万元,同比减少 193.3%,归母净利率为-7.3%。
数字一体化综合服务收入占比最高,2023 年 Q3 占比 73.9%,数字孪生及信息化软件毛 利率最高。数字一体化综合服务即数字展馆业务,是公司业务重点,近年公司融合 VR/AR/MR 等技术,成功落地贵州移动 5G 之城体验馆、广东粤剧博物馆等数字展馆项 目。数字孪生及信息化软件业务于 2019 年投入研发,2022 年向市场推广,与 VR/AR/MR 技术结合更紧密,公司在虚拟数智人、智慧城市、工业制造、智慧交通领域推出一系列标 杆案例。公司持续加强在 VR/AR/MR、裸眼 3D 等领域的创新创意,并建立基于新科技融 合的产品研发部门,VR 与 AR 专利、软件著作权储备丰富,也已在 VR/AR 技术应用产 品、大数据 3D 可视化服务等中有所突破。
地址:马鞍山经济技术开发区湖东南路555号众一创意街区4栋201-202
电话:15955552931
邮箱:admin@masydzp.com