回到首页 返回首页
回到顶部 回到顶部
返回上一页 返回上一页

行空板案例征集:剧小行——基于智能识别的博物管理助手 简单

头像 ccy0602 2025.02.09 93 0

项目背景

今年春晚舞台上的《秧 BOT》节目火速出圈,deepseek火爆全网,你的春节又解锁了哪些技能,打卡了哪些地方?带着孩子的出行,常常选择参观博物馆去了解这个地方的历史地理人文故事,去不了的地方也可以通过网络检索去了解。读万卷书、行万里路,每一个器物,每一场演出都有它难以复制难以替代的心里触动。剧小行是基于行空板K10智能技术的一个助手类项目作品,主要通过了语音识别、语音合成、图像识别等技术制作了一个简易版的博物管理助手,也对K10中的人工智能进行了一番体验对比。

在2022版新课标中跨学科主题项目学习也是非常重要的一部分,在具体生活场景下利用信息科技来解决实际问题也是我们项目的关注点。

 

步骤1:方案设计

需求分析:

1. 收藏与保存:博物馆是文物标本和其他实物资料的主要收藏机构,负责将这些珍贵的文化遗产保存下来。

宣传教育:博物馆不仅是科学研究的场所,也是向公众传播科学文化知识的场所,通过展览和教育活动提高公民的科学文化素质。

科学研究:博物馆为科学研究提供丰富的实物资料,是科学研究的重要基地。

2. 利用 k10 实现简单博物馆管理助手功能:介绍,保护,展示,其他

3. 为了方便制作和实现我们先设计功能菜单,然后从每一个简易功能开始实现

 

功能设计与后期拓展

image.png

具体使用场景

可以放置在实物旁,直接让实物与观众形成链接,搭建宣教体验桥梁

 

步骤 2: 材料准备

清单:

1. 软件及相关教程:https://www.unihiker.com.cn/wiki/k10/jianjie

2. k10、内存卡

image.png

3. 图片、音频、文字等素材

4. 作品外观

避坑指南

1. 软件还没有正式版,实时更新中,教程参考以下链接:https://www.unihiker.com.cn/wiki/k10/jianjie

注意⚠️⚠️⚠️软件安装在根目录,这里坑了很多小伙伴

2. png、gif 等包含透明背景的图片,背景会默认为黑色,颜控慎选

3. 音频文件仅支持 wav,需要搭配内存卡使用,建议提前准备内存卡和读卡器

4. 介绍文本如果使用语音合成建议规避英文,部分英文无法正常朗读

 

步骤3: 程序实现

物联网环境检测类教程已经很多了,我这里主要是测试一些行空板 k10

人工智能方面的功能

1. 语音识别:脱机语音识别嵌入 k10 对比之前 df 的离线语音识别模块性价比确实杠杠的,使用语音唤醒词“你好小行”后,指示灯绿灯亮起,我们可以初始化各类需要用到的语音提示词。

image.png

2. 语音合成:直接粘贴文本就可以合成语音,音量偏小,社区大神们有外置扬声器的方案,小伙伴们可以参考一下

image.png

3. 移动识别:本意开始想做人脸识别,具体实现过程看到了小伙伴们的案例了:

另外想要根据不同戏剧中脸谱识别不同戏剧角色似乎没有办法导入自己训练的模型,替代方案是可以外接二哈,但感觉有点不太合算,退而求其次测试了一下移动识别,参照了教程里面的案例,添加了移动后图片保存在 tf 卡的操作,这里因为有多个界面,监控显示还是出现了不少问题,多次调试后方才显示正常

image.png

ps:技术们能否实现图片可上传到其他网络位置,视频可以同步呢?

4. 音频播放:保存需要的音频到 tf 卡,直接输入名称就可以正常使用了,需要注意的是音频格式。

image.png

 

步骤4: 调试和修改

https://b23.tv/gEqMknF

image.png

 

可以的话,能够自定义唤醒词和支持一定大小的模型导入会更好玩。

反思与收获

终于完成作业任务了,坑没少踩,项目基本实现,但是感觉还有很多可以进一步优化的地方,通过加入群聊,测试制作遇到了一些不大不小的问题,比如语音识别准确性不够,于是我补充了按钮控制,监控显示问题,添加了清空屏幕,播放音频不能中途停止的问题等等

还有很多想要实现的交互没有完成,很多想法已经有小伙伴们的案例了难以创新,还没有尝试行空板 ESP32 代码编程 等等

最后纪念一下在 df 的第一篇帖子,这是一个好的开始,完成比完美更重要

评论

user-avatar