在快手 2024 年二季度业绩电话会上,快手联合创始人、董事长兼 CEO 程一笑透露了关于“可灵 AI”的重要战略规划。
程一笑表示,目前快手已经构建了一套支持万亿参数大模型训练和推理的基础设施,并基于此,先后研发了行业领先的快意语言大模型、视觉生成大模型和推荐大模型。于 6 月开放测试的视频生成大模型“可灵 AI”表现出色,以真实世界物理规则为基准,生成的视频展现出了电影级别的画质与动态效果,获得了国内外用户的广泛好评。近期,“可灵 AI”正式面向全球开放会员体系,截至目前,已有超过百万人使用过“可灵 AI”,并累计生成超千万视频。
不仅如此,快手的语言大模型和文生图模型在二季度也都实现了显著的性能提升。快意语言大模型已经实现了在中文场景下综合性能超过 GPT4.0 的目标,多模态大语言模型在视频内容的理解方面,达到了 GPT4v 的水平。文生图大模型“可图”经过多个版本的迭代,综合性能已经超越了 MidjourneyV5,近期还宣布正式开源,旨在与行业共建繁荣的文生图大模型生态。
在具体业务场景应用方面,快手的大模型矩阵已经可以覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。例如,基于快意大模型构建的视频和直播脚本生成、广告线索客服,叠加数字人技术,可以助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。数据显示,今年上半年,有近 2 万商家借助快手大模型实现智能化经营,其中 AIGC 营销素材在 6 月的日均消耗已经达到 2000 万。
对于未来的发展方向,程一笑指出,首先在语言大模型上,快手将侧重研发训练更适配业务场景的专项语言模型,大规模降低模型的整体推理成本。在视觉生成模型方面,“可灵 AI”依旧是重点发力方向,未来将进一步升级该模型,以保持行业的领先地位。针对“可灵 AI”的商业化,除了加强 C 端会员付费的全球运营外,也将寻求更多与 B 端合作变现的可能性,力争尽快实现可观的商业化变现规模。