2024-06-24
中国门锁网
网络
6006
智能声音识别技术(Intelligent Speech Recognition,ISR)主要是通过对监测样本的声音特征进行分析,得到该样本的声音特征文件。特别的专业数字信号处理器(Digital SignalProcessor,DSP)芯片具有很强的数据处理能力,可最大限度地减少占用CPU资源,从而实现一台计算机同时对多个音频信号进行并行处理识别。这就彻底克服了一般语音识别算法存在占用CPU时间长、识别速度不够的弱点,非常适合大规模商业化应用。智能声音识别技术采用了特别的算法,能自动对输入的音频信号进行前期处理调节,从而大大提高了声音识别的正确率,经过实际测试,其识别准确率高达98%以上,达到了国内先进水平。这也使得此项技术真正进入了实用阶段。
目前,声音识别技术主要有两大类:一类是声音的相似性识别;另一类是语音的意义识别。其中第二类是通过语音识别,将语音变成文字,主要用于信息的快速输入、人工智能、人机对话等领域。而第一种声音的相似性识别,是比较两个声音的相似性,从大量的声音信息中,找出和某一个样本声音相似的部分,主要用于某一个特定声音的筛选,可广泛应用于信息检索、国家安全等领域。
根据客户的需求,在语音识别系统中主要采用声音相似性识别技术,识别广播电视节目。要进行声音的相似性识别,首先必须对音频信号进行数字化,也就是量化处理,包括样本的量化和被识别声音的量化,其次对经过量化的两个声音文件进行匹配对比,通过复杂的计算,得出匹配结果。
手机的语音助手功能从苹果Siri的异常火热发展到现在已经非常普及,仅需一个手机应用程序便能实现。电视的语音操作则是由近期快速发展的智能电视所引导起来的,现在许多高性能的智能电视中也已经比较常见了。
语音控制可以用多屏互动的语音输入来实现,可以控制电视的搜索、应用程序的打开、换台等动作。超强的语音识别技术,只需要简单下达口令,即可轻松完成电视控制、咨询信息以及搜索功能。
语音控制需要电视具备强大的处理运算能力,首先需要识别声音,把口语转化为文字,再通过语音知识库来进行匹配识别。接着还需要系统自动执行相应的任务,进行音量调节、换台、切换模式等。而这直接对电视硬件配置提出了要求,一般功能强大、反应迅速的语音系统一定有一个强大的处理核心。
13520832007