所有分类
主题 主题
平台 平台
我的工作台
userHead
注册时间 [[userInfo.create_time]]
创造力 [[userInfo.creativity]]
[[userInfo.remark]]
[[d.project_title]]
articleThumb
[[d.material_name]]
timelineThumb
进入工作台
折叠
所有分类 我的工作台
展开
人脸识别+语音识别开门
fyyt fyyt 2019-12-22 22:46:01
9
0
简单

制作背景:

      AI人工智能一直很神秘,这次赶上DF举行的挑战活动,一边学习,一边创作,通过学习了解了语音识别、图像识别的使用方法,体验了一把AI人工智能的乐趣,真的很好玩,下面和大家分享一下制作的过程。

学习AI人工智能

         利用df的在线学习的平台,学习了人工智能相关技术的使用方法(https://mindplus.dfrobot.com.cn/ai)。 语音识别技术的使用

步骤1 步骤1
语音识别技术的使用
projectImage
projectImage

语音识别原理:录音一段时长并上传到云端做识别然后返回结果。 

【当听到[开始]】 说明: 事件程序,当开始语音输入之后得到的结果为此事件程序设定的结果时触发。 

【听候语音输入】 说明: 开始录音,直到设置的“每次听的时间”结束或者执行“语音识别结束听”。 

注意:开始语音输入时请保持周围环境安静或者使用独立麦克风。  

(识别结果) 说明: 返回识别的结果,前面勾选之后舞台可以直接显示结果。  

【设置每次听[10]秒】 说明: 设置每次录音时长,到时间后自动结束听,最长60秒。 

【语音识别结束听】 说明: 提前结束语音识别过程并上传获取结果。  

【[显示/隐藏]声波图】 说明: 可以显示或者隐藏声波提示图。 

 【切换语音识别服务器为[服务器1/服务器2]】 说明: Mind+中语音识别有两个服务器,服务器1为MIT服务器,在国外,服务器2为百度服务器,在国内。因此当一个服务器没有反应时可以尝试使用此模块切换到另一个服务器。

步骤2 步骤2
图像识别的使用方法
projectImage
projectImage
projectImage

说明: AI图像识别功能调用的百度AI服务,因此需要使用百度AI的账户。

 Mind+默认有一个公用的账户,因此无需单独注册账户也可以使用,但是公用账户有同时访问限制,因此推荐使用自己注册的账户。 

账户注册方法: 登录百度AI开放平台,https://ai.baidu.com,点击页面右上角“控制台”,然后“注册”或者“登录”自己的百度账号。 登录成功后进入控制台页面,点击左边栏“人脸识别”,在新页面中点击“创建应用”,将“语音技术”、“文字识别”、“图像识别”、“人体分析”全部勾选,(有些用不上,但是都可以勾选,可以多选不可少选)。 在“应用管理”中复制AppID、API Key、Secret Key下方的参数,填到Mind+中“切换至独立账户”中。 填好之后可以点击一下此积木,如果运行出错会提示错误信息,没有提示即为正确。

步骤3 步骤3
功能设计

1、语音识别功能:当有人来访,首先按下门上的语音识别按钮,按下空格键说出姓名,并把姓名存放在姓名的列表中,用于主人可以查看有哪些人来过。

2、图像识别功能:说出姓名后还要进行人脸识别,通过摄像头捕捉的图像和事先存放在人脸列表中的图像进行对比,如果相似度大于80,说明是主人回来了,如果相似度小于80,说明是陌生人,不给开门。

3、人脸识别的来访人员,他们的图像都会被保存在电脑中的文件夹中,可以让主人通过图像来辨认是否需要开门。

projectImage

以下是自动保存的来访人员的人脸信息

projectImage
步骤4 步骤4
编写美乐加的程序

    功能:麦乐加是负责看门的机器人,有人来了会提示客人先语音识别说出姓名,再图像识别,通过和主人的图像进行对比判断是否是主人。

projectImage
步骤5 步骤5
语音按钮程序

功能:按下语音按钮,并按下空格键,说出自己的姓名,并被记录在列表中,

projectImage
步骤6 步骤6
人脸识别按钮

功能:通过摄像头捕捉来访人员的人脸,并通过和主人的人脸进行对比,判断是否开门。

projectImage
Makelog作者原创文章,未经授权禁止转载。
9
0
评论
[[c.user_name]] [[c.create_time]]
[[c.parent_comment.count]]
[[c.comment_content]]