最新超长AI视频模型！一句话即可生成120秒视频，免费开源！ - chatGPT

近日，由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

免费在线试玩：【 点击进入】目测在线人太多需要排队

自己本地搭建教程：

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境【 Python 3.10 】、【 Cuda 下载】

2.克隆开源项目至本地：

git clone https: //github.com/Picsart-AI-Research/StreamingT2V.git

cd StreamingT2V/

StreamingT2V 压缩包：【 网盘下载】

3.安装必备的环境：

conda create -n st2v python= 3.10

conda activate st2v

pip install -r requirements. txt

4.（可选）如果您的系统上缺少 FFmpeg，请安装 FFmpeg

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

6.文本转视频

cd t2v_enhanced

python inference. py --prompt= "A cat running on the street"

如要使用其他基本模型，请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced

python inference. py --image=../__assets__/demo/fish. jpg --base_model=SVD

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时，采用随机混合。对于随机混合，chunk_size和的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用：【点击前往】支持多模型自由切换！