本书系统地介绍了语音识别在大模型时代的新技术与新应用。全书共16章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST)、语音大模型,重点描述了GMM-HMM、DNN-HMM和端到端(E2E)三种语音识别框架;应用部分包含Kaldi、WeNet、FunASR和sherpa-onnx等工业应用实践介绍,内容主要来自工程经验,极具实用性。
阅读本书,可以帮助你掌握MA音频制作技术,掌握旁白、现场音、SE、BGM表现视频的基本能力,了解视频作品的声音制作流程!本书主要向视频创作者、新媒体从业者、影视制作专业的学生介绍录音的采集、编辑及制作技术,使他们能够在一定程度上在成本相对有限的情况下编辑和制作专业水平的音频和视频。此外,对于那些想要将视频音频工作作为业务扩展的读者也有不小的帮助。现在,音频制作的门槛在逐渐降低,自媒体、短视频从业者、SOHO一族、自由艺术创作者所开辟的各种传媒新工作种类将变得越来越普遍。毫无疑问,个人创
本书贯穿了信号的获取、处理、分析和识别整条链路所需的关键知识点,以声信号为研究对象,阐述了传统信号处理、自适应信号处理、机器学习等信号处理和智能分析设计等知识要点。全书总共16 章,第1~4 章介绍了经 典信号处理与分析方法,第5~11 章阐述了先进信号处理方法、人工特征的获取原理和方法,第12~16 章主要说明了深度学习、混合模型等智能分析方法。 本书的主要读者对象为声信号处理和分析相关学科的高校学生,以及从事声信号处理的相关科研工作者。本书对语音信号处理相关专业的技术人员也有一定的
本书共六章,从走进音视频技术切入,分别介绍了音视频技术的概念、音响设备常用连接头、常用的音频线材、线材的制作、线材测试和焊接标准。本书内容浅显易懂,通过大量图片和操作指导,将音视频制作接头过程用的材料与制作方法逐一讲解,有助于学生完成各种复杂的接线工作。它紧密结合生活及工作,无论是专业人士还是非专业人士使用,都易学易懂。本书可作为中等职业院校、高等职业院校音视频布线技术相关课程的基础教材,也可以作为初学者学习音视频布线技术的参考书。