转换猫在线人声分离工具,支持双人对话分离,可将不同说话人的声音和歌声拆分为单独音频文件,适用于采访、会议、播客、录音整理等场景。
点击或拖入待处理文件
双人对话分离引擎采用了高度优化的 Diarization 聚类算法。AI 首先通过语音活跃检测(VAD)剔除环境底噪,随后对人声纹理进行嵌入式特征提取。通过对比独特的频率特征与音色包络,系统能以 98% 的准确度区分不同的发言者,即使在声音重叠(Overlapping)的情况下也能通过声谱隔离实现精准切分。
快速分离记者与被访者的声音,提升速记效率。
为不同嘉宾的音轨单独添加均衡、压限等后期特效。
从嘈杂的会议录音中清晰提取特定发言人的陈述内容。
从电影对白中分离出不同角色的音轨用于二创剪辑。
* 支持更多定制化处理需求,请在客户端尝试。
上传包含两个发言人的采访、播客或会议原始音频。
AI 核心自动分析音色指纹并对全片进行发言人标注。
处理完成后,分别下载发言人 A 与发言人 B 的独立音轨。
网页版目前针对“双人对话”进行了模型特化。如需处理 3 人以上的会议,建议下载专业版客户端。
只要音色有细微的生理差别,我们的 Embedding 模型就能捕捉到细微的频谱差异并进行区分。
建议先使用我们的“提取人声”功能,再对提取出的纯干声进行对话分离,效果更佳。