推荐期刊

网络安全智能语音识别安全技术研究

时间:2020-09-23 11:12:20 所属分类:智能科学技术 浏览量:

人类获取信息的方式主要通过语言、图像、文字三种方式。语音识别技术也称之为自动语音识别技术AutomaticSpeechRecognition(ASR),通俗地讲,这是一项可以让机器听懂人类自然语言及意图并执行相关指令或操作的技术。人类对语音识别技术的研究可追溯到20世纪50

  人类获取信息的方式主要通过语言、图像、文字三种方式。语音识别技术也称之为自动语音识别技术AutomaticSpeechRecognition(ASR),通俗地讲,这是一项可以让机器听懂人类自然语言及意图并执行相关指令或操作的技术。人类对语音识别技术的研究可追溯到20世纪50年代,但技术的落地并快速嵌入产品应用的时间却在21世纪的第一个十年的尾声,在自动语音识别飞速发展的今天,所带来的网络安全风险与暴露的技术缺陷问题也日益凸显,对企业或个人造成的影响不可小觑。本文简单论述了自动语音识别技术的运用分析,通过研究,阐述了在网络安全领域中的风险以及利用自动语音识别技术的主要攻击手段。

网络安全智能语音识别安全技术研究

  1自动语音识别技术发展现状

  人类对未知领域的探索从未停止,且脚步愈发加快。在自动语音识别技术领域的探索研究始于1952年AT&T贝尔实验室的Audry系统,该系统可识别0~9十个数字发音,从此,人类打开了自动语音识别技术的大门,并在21世纪开始了爆发式技术跃进,时至今日,自动化语音识别技术应用场景已开始实现到家居、车载、客服、教育、金融、网络安全等等各个方面,搭载有自动语音识别技术的产品数不胜数。其中在网络安全领域也得到广泛普及,例如利用自动语音识别技术监测网络语音数据及舆情监控。自动语音识别技术发展迅速,同时对国家经济发展和国家安全都有着很重要的作用。

  2自动语音识别技术实现原理简要说明

  自动语音识别系统本质上是一套模拟识别系统,须有硬件设备与操作系统作为支撑,同时需要海量语音样本数据作为基础,通过识别特征信息进行样本匹配,进而达到语义识别的目的。由上图可看出,自动语音识别技术的核心要点主要为:(1)训练;(2)识别。两者为自动语音识别技术的核心要点。

  2.1训练

  “训练”或称之为“学习”所形成的“知识库”是自动语音识别技术的基础,是自动语音识别准确率的核心要素之一,该阶段采用语音分析方法分析出语音特征参数作为标准知识储存在计算机内,形成标准“知识库”,或者称为“模板”,建立识别基本单元的声学模型以及进行句法分析的语言模型等。

  2.2识别

  “识别”或者称之为“匹配”是语音数据输入后对该数据进行分析处理,匹配“知识库”的阶段,该阶段同样是自动语音识别准确率的核心要素之一,提取语音数据中的特征参数,按照一定的准则和测度与系统模型进行比较,通过匹配判决得出识别结果。

  3自动语音识别技术目前的应用领域

  自动语音识别技术发展至今日,市场上尚未出现一款很成熟的应用,准确识别一段语言,相关因素很多,除了不同语种的差别,即使是汉语,在加入方言、口音、同音字词等这些因素后也会产生海量的语音数据要识别。目前自动语音识别主要有四类应用方向,一是简单指令或有限字词的识别,二是智能语音问答,三是智能语音分析,四是实时语音监控分析。在网络安全监管领域,自动语音识别技术可对网络中的大量语音信息进行监听管理,防止网络风险和垃圾信息由语音形式进行传播。

  4自动语音识别技术应用目前面临的安全威胁

  随着海量数据的积累、硬件核心计算能力的发展、语音识别技术的训练与识别手段的持续创新与演进,自动语音识别技术得到普遍部署和广泛应用,在诸多应用方面中最大两个应用落地点就是语音导航与智能音箱,语音导航与智能音箱为使用者提供极大便利,解放了双手,但在使用过程中获取了大量个人隐私数据,主要包含性别、年龄、环境、健康、想法、情绪、地理位置等多重信息,同时由于网络发展的速度远远比人们安全使用网络的意识和操作更新速度快,由此为不法分子的侵入提供了温床,这些信息一旦被恶意利用,将对企业或个人造成严重危害。自动语音识别技术作为战略性与变革性信息技术之一,给网络空间安全增加了诸多新的不确定性,自动语音识别技术应用目前所面临的安全风险主要包括:(1)软硬件的风险;(2)数据完整性风险;(3)个人数据隐私风险。

  4.1软硬件的风险

  在软件及硬件层面,包括应用、模型、系统和处理器以及编码都存在漏洞或后门的可能性;攻击者能够利用这些漏洞或后门实施高级攻击。在自动语音识别技术训练模型层面上,攻击者同样可能在模型中植入后门并实施高级攻击;由于训练模型的不可解释性,在模型中植入的恶意后门难以被检测。

  4.2数据完整性风险

  为了语音识别的精准性,则需要采集大量语音数据进行建模训练,因此在数据层面,攻击者能够在训练阶段掺入恶意数据,影响语音识别模型的识别能力;攻击者同样可以在判断阶段对需要判断的样本加入少量噪音,刻意改变判断结果,破坏数据完整性,以此达到恶意攻击目的。

  4.3个人数据隐私风险

  在用户提供训练数据的场景下以及用户正常使用过程中均会产生大量跟个人及周边环境相关数据信息,攻击者能够通过反复查询训练好的模型或者直接攻击服务商数据中心获得用户的隐私信息。

  5利用自动语音识别技术的主要攻击手段

  毋庸置疑,在今天看来,自动语音识别技术是一项很强大的技术,然而,与其他所有技术一样,自动语音识别技术也容易受到漏洞威胁。如果将这项技术与指纹识别等其他生物技术进行对比,我们就会发现,自动语音识别同样也会遭到黑客的攻击,被黑客盗取并利用,自动语音识别技术应用目前所面临的攻击手段主要包括:(1)伪造声纹攻击;(2)内容安全攻击;(3)个人终端伪造攻击;(4)超声波攻击。

  5.1伪造声纹攻击

  通过克隆演说命令的方法或者直接盗取目标个体的声音样本,从而模拟出目标个体的声音,冒充目标的身份来绕过安全保护机制,对目标发起网络攻击,最终达到攻击目的,一旦拿到这些认证信息,就能访问目标的重要私密文件,盗取目标的个人信息。目前对声纹采取的攻击手段主要包括拼接合成攻击(通过对语音数据截切与拼接最终合成可识别的仿冒语音数据)、样本攻击(对声纹库样本进行攻击,篡改样本数据)、录音攻击(提前录制目标个体的语音样本进行攻击回放)、端到端攻击(直接攻击自动语音识别系统所搭载的终端)等。

  5.2内容安全攻击

  内容攻击也是自动语音识别技术的主要脆弱点之一,我们可输入非法敏感词汇数据,而一般自动语音识别系统不具备判断输入数据是否安全的能力,从而造成恶意音频播放或者敏感信息回显,以此达到攻击的目的。

  5.3个人终端伪造攻击

  目前尚无绝对安全的个人终端安全保护措施,攻击者通过劫持合法终端,从而获取通信凭证信息,达到伪造个人终端的目的,进而可执行恶意命令。

  5.4超声波攻击

  普通人的耳朵可听到的频率为20Hz~20kHz,频率大于20kHz为超声波,正常人无法听到,但搭载自动语音识别的电子产品可轻松抓取并识别,例如通过向与设备连接的耳机发送一个简单的超声波信号,之后就能激活设备自动语音识别系统,从而控制你的设备并达到攻击的目的,而在这个攻击过程中目标个体根本不会有任何察觉。目前电子产品的喇叭性能提升使得攻击者无须额外硬件即可发送超声波信号,这为超声波攻击提供了极大便利性与攻击条件。

  6结语

  随着网络技术的快速发展,网络安全问题也变得十分重要。在网络安全监管中,要充分利用语音识别技术的优势,对网络中的语音信息进行监听管理,避免网络风险和垃圾信息由语音形式进行传播。同时,充分利用自动语音识别技术的高效性和便捷性对网络用户的使用问题反馈进行相应的技术处理。但是任何技术都是一把双刃剑,自动语音识别技术给不法分子带来可乘之机,这是所有人都不能忽视的,如何规避目前自动语音识别技术所存在的风险与攻击利用手段,我们还在进一步研究中,在未来,需要进一步发展和完善自动语音识别技术的安全性,杜绝语音技术使用时的不安全因素,为消费群体提供更加坚实可靠的保障。

  参考文献:

  [1]罗岩.语音自动识别技术及其在电信彩铃业务中的应用研究[D].西安电子科技大学,2014.

  《网络安全智能语音识别安全技术研究》来源:《网络安全技术与应用》,作者:连耿雄 丘恵军 陈昊

转载请注明来自:http://www.zazhifabiao.com/lunwen/dzxx/znkxjs/46644.html