产品特点:
1.支持语音检出(VAD)能力:能够在夹杂噪音的环境下连续采集语音信号,并进行过滤,保留有效语音,对有效语音进行识别和转写。
2.语音识别引擎具备声学模型、语言模型、热词模型、自动标点系统。声学模型采用端到端神经网络模型对声学进行建模,语言模型采用ngramLM进行建模,用于计算搜索候选的文本概率,引擎同时支持自动智能标点,能够对识别的文本自动添加标点。
3.支持多个语种语音识别能力:根据需要提供中文等语种的语音识别能力。
4.支持实时语音识别能力:支持对实时音频流的识别,并实时转写成文字,支持16kHz/8kHz采样率,16bit位深,单通道pcm/wav音频格式。
5.支持录音文件转写能力:支持上传音频文件转写成文字,支持16kHz/8kHz采样率,16bit位深,单通道pcm/wav/mp3/mp4等格式的音频。
6.录音文件转写支持文稿模式和字幕模式两种输出格式。
7.语音识别引擎具备如下效果和性能:
(1)中文语音识别(标准普通话)正确率最高可达98.6%;
(2)识别结果响应时间标准测试集≤500毫秒。
8.支持开启词级别的对齐结果,词信息时间精度为毫秒。
9.支持逆文本标准化,将语音识别结果中的日期、数字等对象以标准化格式展示。
10.支持自动智能标点,智能判断对识别的文本添加标点。
11.支持热词接口:提供中文热词导入及编辑功能,通过热词提升转写效果。
12.支持敏感词接口:可手动配置敏感词,提供敏感词屏蔽、标注等功能。
13.支持语气词过滤功能,可手动添加语气词过滤规则,开启语气词过滤后在识别结果中自动删去匹配的语气词。
14.软著和专利:要求具备语音识别系统的软件和专利。
15.部署要求:为了保证数据安全性和相应速度,要求提供所有的语音识别引擎软件本地离线部署和使用,所使用的技术和软件自主可控。
国产化软硬件支持:支持国产化CPU和国产化操作系统,具备国产化操作兼容性适配证书。