引言
在学习传感器、主控、执行器后,我们做出了许多有意思的创客作品,例如温控风扇、自动门、自动浇花系统等等,在学习声音传感器时,我们也根据采集到的声音的音量大小、有无等信息,进行了相关作品设计,但我们始终留有一个遗憾,那就是机器听不懂我们的意思。
本课,我们将走进人工智能中的语音世界,感受能听懂我们的话的语音模块。
一、人工智能
人类生活在自然之中,具有极大的自由发展空间。但人们通常不满足于此,在数千年的发展中,一直试图发展机械以突破人类体力的极限。发展各种感知器件,以实现人类在感知方面的突破。试图解开大脑的秘密,寻求人工智能。
人工智能(Artificial intelligence)英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能企图了解智能的实质,产生出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
在越来越多的领域,人工智能大显身手,显示出越来越强的能力,给人们的生活带来了极大的便利,人工智能改变我们生活的步伐也越来越快。
二、人工智能的应用
从人工智能的提出到人工智能应用于各行各业解决实际问题,经历了数十年,这其中有过高潮也有过低谷,但是人类的希望之火从未熄灭。
目前人工智能的实际应用有:视觉识别、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜素、博弈、自动程序设计、智能控制、机器人学、语言和图像识别等。
1. 百度搜索
百度搜索在表面上只是一款搜索引擎,但其引擎的机理和很多人工智能程序相同:以并行计算、大数据以及更深层次算法为基础,完成对数据、问题的智能化分析。许多百度用户都能感受到,百度搜索正变得越来越“聪明”,越来越“懂你”,知道你喜欢或需要什么样的答案,而赋予百度这种学习能力的,正是人工智能。
2. 无人驾驶汽车
我们可以把无人驾驶看做是一台轮式智能机器人,这个机器人凭借探测器作为“精确的眼睛”、以深度学习为基础的人工智能作为“聪明果断的大脑”,从而实现快速移动的交通工具。
这个移动的机器人利用传感器、雷达、摄像机、激光测距仪、GPS等获得路况信息,再交由系统分析,获得应对措施,再传达至汽车的各项零部件从而实现辨别各种障碍并合理避让,按路线安全行驶不迷路等。
3. 在线翻译助手
基于融合统计和深度学习方法的在线翻译系统可以模仿人脑“理解语言,生成译文”。这种翻译方法最大的优势是译文流畅,易于理解。有意思的是,这个系统并不是一开始就具备强大大脑,而是像刚出生的婴儿一样通过学习大量语言对照句子,逐渐提高翻译水平。
5. 四足机器人
2021年春节联欢晚会“拓荒牛”是我国自主研发生产的四足机器人。它是基于深圳经济特区的设计原型,高度体现了高科技、智能制造及5G等人工智能技术方面的应用和创新。同时,它结合了中国传统牛年的红色祥云图案,再加上五颜六色的灯杆。它将传统元素与科技和时尚的酷感结合在一起。
三、人工智能中语音模块的应用
语音识别是人工智能中非常常见且重要的一种应用,例如手机人工智能助理Siri、语音输入、智能录音笔、天猫精灵、小度智能音箱等都含有智能语音系统,它能像人一样地与我们聊天,精准识别我们说话的内容,提供广泛的答案,给予反馈。
以智能音箱为例,其中的语音助手需要听懂我们说的话,并做出相应的适当的反馈,这其中就包含了语音模块的两大功能:语音识别和语音合成。
语音识别:听懂我们说的话。
语音合成:说出我们能听懂的话。
在小度智能音箱里,每当我们说“小度小度”,音箱都能回答“我在”,我们说歌曲名字,小度便能播放对应的歌曲。这里的回答和播放歌曲都是建立在小度识别到我们说的话中的相应内容,这就是语音识别。小度的回答便是小度语音合成的效果。
在人工智能学习中,也有相应的模块与程序编写方法,下一节课,就让我们一起学习对语音模块编写程序进行语音识别。
关注公众号,查看更多精彩!
评论