可灵是什么?
可灵(Kling)是由快手AI团队自主研发的视频生成大模型,于2024年6月6日正式上线。其技术架构对标国际先进的Sora模型,采用类Sora的DiT(Diffusion Transformer)结构,结合3D时空联合注意力机制和flow模型,能够生成高分辨率、长时长且符合物理规律的高质量视频。

可灵的主要功能
1. 长视频生成
- 支持生成最长2分钟、1080p分辨率、30fps的高清视频,并可通过续写功能延伸至约3分钟。
2. 动态控制与物理模拟
- 基于3D时空注意力机制,生成大幅度的合理运动(如人物奔跑、四季变换),同时模拟真实物理特性(如光影、物体运动轨迹)。
3. 图生视频与自由宽高比
- 将静态图像转化为5秒动态视频,支持自定义首尾帧和镜头运镜,并可根据文本提示生成多样化运动效果;支持多种视频宽高比,适配不同场景需求。
4. 概念组合与电影级画面
- 通过Diffusion Transformer架构,将抽象概念转化为具体画面(如虚构场景),并生成电影级视觉效果的视频。
可灵的使用场景
- 影视创作:与导演合作生成实验性电影短片,例如国内首部AIGC奇幻短剧《山海奇镜之劈波斩浪》。
- 广告营销:快速制作高质量产品演示视频,如动态广告、虚拟模特展示等。
- 教育科普:模拟物理现象(如四季更替、动物运动),辅助教学可视化。
- 艺术设计:将创意草图转化为动态作品,或生成超现实艺术场景。
- 社交媒体:用户通过文生视频、图生视频功能创作个性化内容(如Vlog、创意短剧),提升创作效率。