快手自研可灵AI凭借出众效果引发国际关注 实现广泛应用
据有关媒体报道,8月20日,AI插画艺术爱好者黛博拉(Déborah)在推特上发布一段时长为五秒钟,内容为女人手捧一朵燃烧的玫瑰的视频。视频画面表现堪比电影,很快引起埃隆·马斯克(Elon Musk)关注,并在评论区回复“AI娱乐正在快速发展”。据了解,这一视频由快手自研的可灵AI完成图生视频过程。此前,可灵AI自发布起就在海外社交媒体引发热议和关注,经持续功能升级,已实现广泛应用。
可灵AI获国际爱好者和业界热议追捧。可灵AI生成的作品8月20日发布后被埃隆·马斯克关注,在国内外AI界和社交媒体引发热议。早在6月初,快手自研的视频生成大模型可灵AI正式发布之初,在海外社交媒体上就掀起了一波热度,大量海外网友在线“求”可灵AI内测机会。可灵AI之所以获得高关注度,是因为从视频生成效果本身来看,可灵AI不仅能够模拟物理世界特性,还具备了强大的概念组合能力和想象力,生成的视频分辨率高达1080p,帧率达30fps,时长最高可达2分钟。有网友表示,可灵AI生成的内容比真实世界还美好。
市场分析机构摩根士丹利发表研究文章《可灵堪比Sora》指出,可灵AI与Sora势均力敌,表现要比抖音和腾讯过往发布的视频生成模型都更加优秀,有望使快手的用户规模和活跃度进一步提升,从而长期影响快手在电商和商业化等领域的盈利潜力。可灵AI也引起美国知名刊物《麻省理工科技评论》的关注,发表了题为《我测试了一个令人兴奋的中国新型“文生视频”人工智能模型》的文章,同样对照了可灵AI与Sora的生成效果以及对物理世界的还原能力。
可灵AI功能持续升级,应用逐渐广泛。可灵AI于今年6月21日升级推出图生视频功能,支持用任意静态图像生成 5秒视频,并且可搭配不同的文本内容,实现丰富视觉叙事 。马斯克点赞的视频,正是出自可灵AI这一核心爆款功能。被点赞的视频作者黛博拉(Déborah)已多次用可灵AI制作视频,显示快手的图生视频功能在海外得到了广泛的使用。
7月6日,在上海举行的2024世界人工智能大会上,可灵AI正式上线了网页端,推出了更加清晰的高画质版,在视频处理的精细度上有了大幅提升。其中,首尾帧控制、镜头控制等新功能也一起上线,并且创作者单次生成的文生视频时长也增加至10秒。7月底,可灵AI大模型全面开放内测,并正式面向全球上线会员体系,针对不同类别的会员,提供相应的专属功能服务。前段时间网络掀起“AIGC让老照片动起来”“拥抱小时候的自己”等热门话题,很多网友选择可灵AI让照片动起来,连接过去和现在的自己。在可灵AI正式面向全球开放会员体系后,已有超百万人使用过可灵AI,并累计生成超千万视频。
可灵AI赋能专业影视制作。可灵AI还被媒体和影视机构广泛应用于专业视频制作流程中。在巴黎奥运来临之际,中央广播电视总台推出首部生成式AI微电影《百年前的那次出发》,就是由可灵AI提供技术支持,生动还原了100年前4名网球选手代表中国奔赴巴黎奥运会的历程。尤其在七月下旬,由可灵AI提供深度技术支持国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》收官,在5集的篇幅里,利用可灵AI呈现奇幻的上古传说,将古代的浪漫想象进行数字再现,截至7月底播放量超过5200万,全网话题曝光量超4.3亿,登上全平台热搜21个,德塔文短剧景气指数Top1。近日火爆全网的游戏《黑神话·悟空》,网友们也用可灵AI二创了大量视频,表现效果甚至同游戏本体不相上下。
AIGC助力快手业绩实现重要突破。快手2024年第二季度及中期业绩显示,总营收同比增长11.6%至310亿元,经调整净利润达46.8亿元,超过市场一致预期。快手负责人表示,针对可灵AI的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B 端合作变现的可能性,力争尽快实现可观的商业化变现规模。除了视频生成大模型,快手的语言大模型和文生图模型也都实现了显著的性能提升:目前,快意语言大模型已经实现了在中文场景下综合性能超过GPT4.0的目标;多模态大语言模型也在视频内容的理解方面,达到了GPT4v的水平;文生图大模型可图经过多个版本的迭代,综合性能已经超越了Midjourney V5,在近期宣布正式开源。
无论是网友的创意狂欢还是专业制作者的深入应用,都让人看到未来视频生成大模型赛道的无限可能。快手负责人表示,未来将坚定执行AI战略,在赋能现有业务场景的同时,努力创造新的业务变现模式。