Wav2lip-GAN 环境配置

news/2024/7/10 20:23:30 标签: ffmpeg, python, 开发语言

首先使用 conda 创建新的虚拟环境,然后激活这个环境

python">conda create -n myenv python=3.8
activate myenv

使用 git 克隆代码,或者直接下载源码压缩包解压,安装依赖(我使用的豆瓣源)

python">git clone https://github.com/Rudrabha/Wav2Lip.git
cd Wav2Lip
pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

我修改过后的 requirements.txt 依赖如下:

python">librosa==0.7.0
numpy==1.17.3
opencv-contrib-python>=4.2.0.34
opencv-python==4.1.2.30
torch==1.8.0
torchvision==0.9.0
tqdm==4.45.0
numba==0.48

接下来需要安装 ffmpeg,这是音视频处理的神器,ubuntu 版本使用 apt 安装

python">sudo apt install ffmpeg

我是 windows 版本,需手动下载安装,安装地址:ffmpeg

在这里插入图片描述

我这里下载的是 6.0 版本。

解压后将 bin 对应的路径添加到系统环境变量 PATH 中。添加过后需重启电脑使 ffmpeg 生效。

然后下载视频材料:game.mp4

音频材料我是自己找的2s的 mp3文件,命名为 2s.mp3

然后准备模型文件:
(1)脸部检测预训练模型,下载地址:脸部检测模型
放到 Wav2Lip下的 face_detection/detection/sfd 目录下,并重命名为 s3fd.pth。
(2)下载模型文件,我使用的是 Wav2Lip + GAN,下载地址:Wav2Lip + GAN
下载后放在项目根目录。

以上都配好后,执行命令:

python">python inference.py --checkpoint_path wav2lip_gan.pth --face game.mp4 --audio 2s.mp3

结果出现报错如下:
AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeli

解决办法:(这里安装我带上了本机代理、不带安装失败)

python">pip install opencv-python install "opencv-python-headless<4.3" --proxy http://127.0.0.1:7890

以上问题解决过之后,查看日志输出:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

合成结果输出在 Wav2Lip 中的 results 下。

在这里插入图片描述


http://www.niftyadmin.cn/n/315023.html

相关文章

代码审计之PHP基础铺垫

目录 1、标记 2、注释 3、输出语句 4、关键字 5、常量的定义与使用 6、预定义常量 7、变量的赋值&#xff08;传参赋值与引用赋值&#xff09; 8、可变变量 9、双引号和单引号的区别 10、heredoc结构和nowdoc结构 11、其他符号 1、标记 <?php 和 ?> 是PHP标…

rk3588移植ubuntu server

ubuntu server 18.04 arm版本. 1、使用qemu运行 安装qemu-system-aarch64 sudo apt install -y qemu-system-arm 2、下载ubuntu server Index of /releases/18.04.3 3、创建虚拟磁盘 qemu-img create ubuntuimg.img 40G 4、创建虚拟机 弹出界面&#xff0c;直接回车选…

SwiftUI 4.0 中 List 显示层级数据的子视图在展开和收起操作时无动画的解决

问题现象 在 SwiftUI 4.0(iOS 16+)中,一个超简单 List 视图层级子视图的收放操作竟然没有动画,这着实有点让人不爽: 从上图可以看到:我们在点击 List 子项时不仅毫无收放动画可言,而且在展开时还有卡顿,显得非常生硬。 以上代码在目前最新的 iOS 16.4.1(a) 系统中测试…

mysql错误:2059 - Authentication plugin ‘caching_ sha2_password‘ cannot be loaded:

这个错误是因为MySQL数据库使用了 caching_sha2_password 插件进行身份验证&#xff0c;而该插件需要 MySQL 8.0.4 及以上版本的 MySQL 客户端才能够使用。 如果你使用的是旧版本的 MySQL 客户端&#xff0c;可以考虑升级到 MySQL 8.0.4 或更高版本。如果升级不是一个可行的选…

勒索病毒“顽疾”,没有“特效药”吗?

基础设施瘫痪、企业和高校重要文件被加密、毕业论文瞬间秒没……这就是六年前的今天&#xff0c;WannaCry勒索攻击爆发时的真实场景。攻击导致150多个国家数百万台计算机受影响&#xff0c;也让勒索病毒首次被全世界广泛关注。 六年后&#xff0c;勒索攻击仍是全球最严重的网络…

选择合适的 MQTT 云服务:一文了解 EMQX Cloud Serverless、Dedicated 与 BYOC 版本

引言 EMQX Cloud 是基于 EMQX Enterprise 构建的一款全托管云原生 MQTT 消息服务。为了满足不同客户的需求&#xff0c;EMQX Cloud 提供了三种版本供客户选择&#xff1a;Serverless 版、专有版和 BYOC 版。 本文将简要介绍这三个版本的核心区别&#xff0c;并通过三个用户故…

如何解决人力资本管理挑战?

人力资本管理&#xff08;HCM&#xff09;是任何企业成功的一个重要因素。得益于高效、多产和敬业的员工队伍&#xff0c;在此领域找到正确的方法和策略可以推动您取得更大的成果。 但是&#xff0c;除了关注HCM的好处和机会之外&#xff0c;你还需要做好准备&#xff0c;以克…

易智编译EaseEditing:计算机顶会不一定比SCI期刊更权威!

计算机SCI期刊和学术会议都是评估学术研究水平和影响力的重要指标&#xff0c;但在不同领域、不同学科、不同评价指标下可能会有不同的权威性。 在计算机科学领域&#xff0c;传统上认为顶级学术会议的影响力和权威性更高。 因为计算机科学发展较快&#xff0c;研究领域广泛&a…