在日前举行的 2024 中国计算机大会上,快手副总裁、大模型团队负责人张迪透露,自今年 6 月发布以来,快手可灵 AI 已有超过 360 万用户,累计生成 3700 万个视频以及超过一亿张图片。同时他还表示,近期快手可灵 AI 将上架独立 App,以便于用户的使用。
此外张迪还透露,快手可灵 AI 即将内测视频人脸模型功能。据悉,该功能基于创新的 ID 保持能力,支持用户自助训练人脸模型,在完成训练后,用户可使用该模型文生视频的能力生成 5 秒或 10 秒的视频,有效解决以往 AI 视频生成中无法打造稳定人物 IP 角色的难题。
据了解,目前快手方面已发布可灵和可图多款大模型。其中,快手可灵大模型是由快手 AI 团队自研,其基于类 Sora 技术路线、并结合了多项自研创新技术,以真实世界物理规则为基准,生成的视频展现出了电影级的画质与动态效果,还能模拟大幅度的物理运动。可图大模型则支持文生图和图生图两类功能,可用于 AI 创作图像以及 AI 形象定制。
此前在今年 7 月,快手方面正式推出可灵 AI 网页版,并提供了 AI 图片、AI 视频、视频编辑三个板块,但目前视频编辑功能尚未正式上线。值得一提的是,当时快手方面还宣布开源图像生成大模型可图。
随后在 9 月下旬,快手可灵 AI 推出全新升级的可灵 1.5 模型。据官方介绍,与 1.0 版本一样,可灵 1.5 模型也支持 " 高品质模式 ",但在该模式下 1.0 版本只能生成*高 720P 的视频,而可灵 1.5 模型则支持生成 1080P 高清视频。同时新版模型所生成的画面构图更加美观、视频清晰度大幅提升,并且动态质量也显著提升,主要加强了部分运动的合理性。此外在文本响应度方面,该模型的文本相关性也得到了一定的增强,视频生成功能可响应更为复杂的文字要求。
此外,可灵 1.0 模型的图生视频功能还新增了 " 运动笔刷 " 工具。据悉,这一工具支持为图片中的人物或物体等各种元素指定运动轨迹,从而实现更好的运动控制和运动表现。值得一提的是," 运动笔刷 " 还能支持横屏、竖屏、方屏等多种尺寸,以及 JPG、PNG 格式的图片,同时还支持额外指定静止区域、可以让运动更加精准。