首页 > 原创文化 > 原创文化 > Character.AI突破性技术:实时AI角色视频互动

Character.AI突破性技术:实时AI角色视频互动

发布时间:2025-07-06 09:04:59来源: 15518196690

 7 月 5 日消息,AI 聊天机器人平台 Character.AI 发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。

该模型尚未部署在 Character.AI 平台上,根据研究论文和视频演示,用户只需要输入一张图片和声音信号,该模型就能实现类似 FaceTime 的通话视觉互动。

该模型基于 Diffusion Transformer(DiT)技术,本质上是一种能够从随机噪声中创建详细图像的“艺术家”,并不断优化图像直至完美。Character.AI 所做的就是让这一过程变得极其迅速,达到实时效果。

TalkingMachines 模型采用了流匹配扩散(Flow-Matched Diffusion)、音频驱动的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不对称蒸馏(Asymmetric Distillation)等多种关键技术。

其中流匹配扩散技术通过训练大量动作,包括细微的面部表情和更夸张的手势,确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词,还能理解音频中的节奏、停顿和语调,并将其转化为精确的口型、点头和眨眼。

稀疏因果注意力技术让 Character.AI 能够以更高效的方式处理视频帧,而不对称蒸馏技术则让视频能够实时生成,营造出类似 FaceTime 通话的效果。

Character.AI 强调,这一研究突破不仅仅是关于面部动画的,它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

原创文化更多>>

smart 全新一代精灵1号 用激光雷达让小车也配高阶智驾 不跟风、不妥协:212如何用“野”字对抗行业的“卷”? 新款红旗H5和HQ9将于5月20日上市。对心现款车型新款会在内饰部分进行一些升级调整 三大车企一季度财报横评:比亚迪在换挡,吉利在加速,上汽在磨合 订单10万台!30万的大唐“一夜爆红”,越贵的比亚迪越不愁卖? 限时售价8.79万元 配备专属徽章 吉利博越十周年冠军版上市 “8系、9系”扎堆申报,集体冲击高端旗舰 科技比亚迪:以首创之姿筑不可超越之基 1-3月硬派越野销量榜 仅一款销量过万 普拉多第六 销量六连冠,星光730凭什么成为家庭MPV“满分座驾”? 比起“谁更智能”,一汽奥迪强调“把驾驶感抢回来” 15.08万元起!领汇汽车正式推出C级闪充商务轿车e9 五座/七座售价同步揭晓 哈弗猛龙PLUS定档5月15日正式上市 哈弗猛龙PLUS五座版主打宽适空间+硬核越野+全维智能,轻松hold住日常通勤与长途自驾 这4款紧凑型SUV即将上市,家用全能,年轻家庭闭眼选! 零跑并不慌?卖价不到16万的华为全家桶,真的没弱点? 铂智3X的持续爆款、铂智7的强势开局,广汽丰田为什么成为合资车企中最快走上增长正轨的品牌? 预售价39.98万起 智界V9将于5月15日上市 与新款极氪009同台竞技 该选谁? 捷途汽车:把「方盒子」做成冠军,把「旅行」做成生态 “10万级SUV超配王”说到做到,国民好车埃安i60为何持续热销? 2026北京车展,红旗带着27台展车、三大子品牌全矩阵登场,只有实打实的产品落地、技术破局与全域进阶 吉利银河M7以10.98万起入局,能否搅动主流SUV市场? 新款宝马7系正式亮相,换装新前脸、新内饰,两种动力,明年上市 2026北京车展创多项历史新纪录,为世界汽车工业写下了浓墨重彩的一笔 竞速电动科技 雪铁龙暨东风雪铁龙加速落地电智化产品 雷克萨斯全新一代ES上市:当\"东方豪华\"成为一种方法论 大众ID.Polo首发:WLTP综合续航最高可达454公里,新车还搭载了全新互联旅行辅助系统 保时捷出售布加迪全部股权:活下去比什么都重要 2026年4月车市:新能源渗透率超60.6% 燃油车加速萎缩! 2026北京车展:AI隐秘重构汽车消费公式?传统车企浑然不知?