回到首页 返回首页
回到顶部 回到顶部
返回上一页 返回上一页

第二课 能听懂中文的语音识别模块 简单

头像 Really 2021.04.19 996 0

引言

我们知道了什么是人工智能,也了解了生活中的人工智能有百度搜索、无人驾驶汽车、在线翻译助手、四足机器人等。在人工智能中,还有一种非常常见的技术——语音识别,比如我们熟知的小爱音箱、天猫精灵等,它们都能听懂我们所说的话。那它们为什么能听懂我们的语言呢?

本课,我们将深入语音识别模块,学习语音识别模块的用法,完成一个语音控制灯实验。

project-image

一、 语音识别

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。

随着科技的发展,语音识别技术有着非常广泛的应用领域和市场前景。如智能家电、车载导航、智能翻译等。

project-image
project-image

二、语音识别模块

1.语音识别模块简介

I2C 离线语音识别模块,是一款以Gravity I2C作为连接接口的、针对中文进行识别的模块。该模块采用由 ICRoute 公司设计的 LD3320 “语音识别”专用芯片,只需要在程序中设定好要识别的关键词语列表并下载进主控的MCU中,语音识别模块就可以对用户说出的关键词语进行识别,并根据程序进行相应的处理。

project-image
project-image

每次识别最多可以设置50项候选识别句,每个识别句可以是单字,词组或短句,长度为不超过10个汉字或者79个字节的拼音串。无需训练,识别准确率高达95%。

project-image

2.语音识别模块的三种识别模式

为了满足不同的识别场景,该模块预设了三种语音识别模式:循环模式、按钮模式、指令模式,分别对应指示灯的蓝色、绿色、白色。识别模式指示灯的亮代表语音识别模块在工作、灭代表语音识别模块在休眠。同一时间只能识别一条关键词,待指示灯闪烁后方可进行下次识别。

(1)循环模式

将识别模式设置为循环模式后,识别模式指示灯为常亮蓝色,此时模块一直处于拾音状态,不停地拾取环境中 的声音进行分析识别。当识别到录入的关键词后,指示灯会闪烁一次,提示使用者已准确识别。

project-image

(2)按钮模式

将识别模式设置为按钮模式后,识别模式指示灯为常灭,此时模块处于休眠状态,对环境中的声音完全忽略,在按钮被按下时会激活模块。模块被激活后,指示灯常亮绿色,识别到录入的关键词后,指示灯会闪烁一次,提示使用者已准确识别。

project-image

(3)指令模式

将识别模式设置为指令模式后,识别模式指示灯为常灭,此时模块处于休眠状态,对环境中的声音完全忽略,在说出唤醒关键词后激活模块。模块被激活后,指示灯常亮白色,识别到录入的关键词后,指示灯会闪烁一次,提示使用者已准确识别。唤醒时长为10s。在这10s内,每当识别到添加的关键词后,唤醒时间会刷新。如果10s内没有识别成功。则模块会再次进入休眠状态。

project-image

3.语音识别模块相关程序指令

语音识别模块总共有下方4条指令,其中,第1条是模块初始化,并根据应用场景需求设置识别模式和麦克风模式,板载麦克风的作用是拾取用户语音,有了板载麦克风,本品无需接入任何其他语音输入设备即可拾取声音。本品在默认状态下使用板载麦克风,当 3.5mm 耳机接口接入录音设备后,则自动屏蔽板载麦克风。第2条指令是添加语音拾取关键词,并为之编号,方便作为变量进行调用,输入的关键词为拼音音节,且音节之间要空格。添加完关键词后,必须使用第3条指令激活语音识别模块。第4条指令用于拾取语音时获得对应的编号。

project-image

三、语音控制LED灯实验

我们以前学过声控灯,是通过声音传感器检测环境声音的大小,当声音超过阈值,则灯亮,一定时间后,灯灭。但这样也存在问题,环境中的噪音太大灯也会亮,此时开灯并非我们所愿,导致浪费资源。因此,我们引入语音识别模块,当拾取到环境中的特定字词后灯才亮。下面,以Mind+图形化编程软件、Arduino Uno主控板作为软硬件进行语音控制LED灯实验。

1. 接线图

project-image

2. 切换到“上传模式”。

project-image

3. 点击左下角“扩展”按钮,进入扩展库界面。选择“主控板”选项卡下Arduino Uno。

project-image

4. 在“用户库”选项卡下搜索“I2C语音识别模块”,点击加载扩展库。

project-image

5. 编写程序

project-image

6. 调试

以下为调试视频。

四、想象无极限

运用语音识别模块,我们还能创造哪些东西来解决生活中的问题呢?

project-image
project-image

关注公众号,查看更多精彩!

评论

user-avatar