conda环境里用不了电脑系统环境里的应用ffmpeg;ffmpeg调用本地windows麦克风读取

news/2024/7/10 19:27:37 标签: conda, ffmpeg

ffmpegzai_conda_1">1、 ffmpegzai conda环境里执行不了,在系统可以运行

import ffmpeg

stream = ffmpeg.input(r'D:\sound\222.mp4')
stream = ffmpeg.filter(stream, 'fps', fps=25, round='up')
stream = ffmpeg.output(stream, r'D:\sound\dummy2.mp4')
ffmpeg.run(stream)

会报错:
File “C:\Users\loong.conda\envs\nlp\lib\subprocess.py”, line 1435, in _execute_child
hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] 系统找不到指定的文件。
在这里插入图片描述
在这里插入图片描述

解决方法,用全部绝对路径执行可以正常运行

C:/Users/loong/.conda/envs/nlp/python.exe  D:\sound\ffmpeg_sounddevice.py

在这里插入图片描述

ffmpegwindows_28">2、ffmpeg调用本地windows麦克风读取

查看设备名称名称:ffmpeg -list_devices true -f dshow -i dummy
在这里插入图片描述

ffmpeg_cmd = [
    "ffmpeg",
    "-f", "dshow",  # 使用alsa作为音频输入设备
    "-i", "audio=麦克风阵列 (适用于数字麦克风的英特尔® 智音技术)",  # 使用默认的音频输入设备(麦克风)
    "-f", "s16le",
    "-acodec", "pcm_s16le",
    "-ar", "16000",
    "-ac", "1",
    "-"
]
ffmpeg_cmd = [
    "ffmpeg",
    "-f", "dshow",  # 使用dshow作为音频输入设备(名字必须是这个,其他会报错)
    "-i", "audio=Microphone",  # 麦克风的设备名称
    "-f", "s16le",
    "-acodec", "pcm_s16le",
    "-ar", "16000",
    "-ac", "1",
    "-"
]

这个命令将使用dshow作为音频输入设备,以及指定使用名为Microphone的麦克风设备。如果你使用的麦克风设备名称不同,你可以将其替换为你实际使用的设备名称。

其他参数的含义与之前提到的Linux示例相同:-f s16le指定输出音频格式为16位无压缩PCM音频,-acodec pcm_s16le指定音频编解码器为16位无压缩PCM音频,-ar 16000指定采样率为16000Hz,-ac 1指定声道数为1(单声道)。

最后,输出文件名被替换为-,表示音频数据将通过标准输出进行流式传输,而不是写入到文件中。

请注意,以上命令参数适用于Windows系统,并使用了DirectShow作为音频输入设备。如果你在其他操作系统上运行,请使用相应的音频输入设备和命令参数。

import subprocess

import numpy as np


ffmpeg_cmd = [
    "ffmpeg",
    "-f", "dshow",  # 使用alsa作为音频输入设备
    "-i", "audio=麦克风阵列 (适用于数字麦克风的英特尔® 智音技术)",  # 使用默认的音频输入设备(麦克风)
    "-f", "s16le",
    "-acodec", "pcm_s16le",
    "-ar", "16000",
    "-ac", "1",
    "-"
]

# 创建FFmpeg进程
process = subprocess.Popen(
    ffmpeg_cmd,
    stdout=subprocess.PIPE,
    stderr=subprocess.DEVNULL,
    bufsize=1600
)


# 读取和处理音频数据
while True:
    # 从FFmpeg进程中读取音频数据
    data = process.stdout.read(frames_per_read * channels * 2)  # 每个样本16位,乘以2
    if not data:
        break
    
    # 将音频数据转换为numpy数组
    samples = np.frombuffer(data, dtype=np.int16)
    samples = samples.astype(np.float32)
    # samples = MinMaxScaler(feature_range=(-1, 1)).fit_transform(samples.reshape(-1, 1))
    samples /= 32768.0  # 归一化到[-1, 1]范围
    ##数据后续处理逻辑

http://www.niftyadmin.cn/n/1006877.html

相关文章

C++ 教程

C 教程 C 是一种高级语言,它是由 Bjarne Stroustrup 于 1979 年在贝尔实验室开始设计开发的。C 进一步扩充和完善了 C 语言,是一种面向对象的程序设计语言。C 可运行于多种平台上,如 Windows、MAC 操作系统以及 UNIX 的各种版本。 本教程通过…

Fiddler抓包工具笔记

一、简介 Fiddler代理相当于中介的角色 快捷键ShiftF5去缓存刷新 二、抓包 1. 设置过滤器 没有设置过滤器的话,会抓所有的包,非常乱会混淆 隐藏包含这些内容的URL 2. 快速定位到需要的包 点击:Webforms菜单 界面分析: …

Stable diffusion中mov2mov

场景: 这段时间成迷于AI绘画,目前已经学会了视频转成二次元风格。这里利用了秋葉aaaki大佬的Stable diffusion WebUI,和mov2mov插件,在controlnet 插件中利用了openpose来约束每张图的动作和手部,减少出现多只手和多个…

从网上复制shell脚本 到 linux下运行 碰到的各种问题汇总

从网上复制shell脚本 到 linux下运行 碰到的各种问题汇总 快捷键CtrlU查看网页源码 一、报错现象:: No such file or directory 解决方法:在linux系统下执行:dos2unix filename 问题原因:本质是文件中二进制符号^M乱码问题 参考…

【Image captioning】Show, Attend, and Tell 从零到掌握之二--create_input_files.py代码详解

【Image captioning】Show, Attend, and Tell 从零到掌握之二–create_input_files.py代码详解 作者:安静到无声 个人主页 作者简介:人工智能和硬件设计博士生、CSDN与阿里云开发者博客专家,多项比赛获奖者,发表SCI论文多篇。 Thanks♪(・ω・)ノ 如果觉得文章不错或能帮助…

unity Embedded Browser(ZFBrowser)使用相关问题

在使用ZFBrowser的时候 碰到获取不到声音权限的问题 在插件的BrowserNative.cs脚本中,找到commandLineSwitches变量, 只需要开启以下两个配置项: "--enable-media-stream":允许收集用户的摄像头视频流与mic的音频流。…

nodejs之net模块的使用

vscode的底层ipc通讯都是基于node的net模块进行封装,今天大概讲解下net模块的使用 官方文档地址:https://nodejs.cn/api/net.html net模块的作用 net模块提供了基于流的方式构建tcp或ipc服务器和客户端的能力。 node:net 模块提供异步网络 API&#x…

【深入了解Nacos集群和持久化配置】 ——每天一点小知识

💧 深入了解 N a c o s 集群和持久化配置 \color{#FF1493}{深入了解Nacos集群和持久化配置} 深入了解Nacos集群和持久化配置💧 🌷 仰望天空,妳我亦是行人.✨ 🦄 个人主页——微风撞见云的博客🎐 …