一, 主要流程 数据集整理->搭建环境->训练数据->推理结果 二, 数据集的获取和整理 整理干净的同一情绪下的人声,20-30分钟,切割成3s~10s. 转换音频格式 (1天时间) 数据集整理是...