一、项目概述
1.1 项目背景
某次,学校接收了慈善机构捐赠的图书,有的是旧书籍,分类上架时遇到了难题,人工分类效率低,容易出错,后期管理难度大,统计有存在分类不明确的尴尬。基于此次我们使用mind+ v2的文本分类工具制作了一款基于siot的书籍分类及统计的系统。
1.2 功能介绍
使用mind+ v2文本分类训练模型工具根据书籍名称训练模型,通过实时结果推送到行空板K10,对在场的分类人员进行提示,并且使用行空板K10还统计该小组分类的书籍总数,对于新旧书上架分类提供快速上手的解决方案。
1.3 成果展示
【图书馆书籍分类系统】
二、项目制作过程
2.1 模型训练过程
首先采集数据,书籍名称能够体现书籍的基本内容,对于快速分类提供重要的价值,除此之外,书籍的目录更能够反映书籍所讲述的内容,可以更准确的分类该书籍。为了展示简单模型,我采用书籍名称作为数据采集的对象。
采集图书馆某一分类如儿童文学的图书书籍名称,每一个大类下需要采集至少50+的书籍名称,记录到.txt文件中。为了测试方便,仅仅选择5-6个大类,数据或者分类过大,训练时间过长,不利于我们后期的迭代。每个数据类别可准备多样化的样本文本,类别间数量尽量平衡。给类别起个简洁的名字,不要用太复杂的符号或过长的描述。
2.2 模型训练
打开mind+ v2,选择训练模型的文本分类,点击上次文本数据,可以一一手动输入,就是忒费手指头。将六个类别的数据上传,并填写类名,就可以进行模型训练了。



高级设置选择默认,点击训练模型,等待一会儿,训练模型就可以完成。关于模型训练的高级设置参数,解释如下:
参数 | 参数说明 | 类别说明 | 推荐设置 |
| 周期数(Epochs) | 一个周期指训练数据集中的所有文本样本均已向模型馈送并完成一次参数更新。例如,周期数设为 30,即模型对全量训练样本迭代学习 30 次。 | 反映模型对训练文本特征的学习深度:周期数不足易导致欠拟合(分类准确率低,无法识别常见电影评论类别);周期数过多可能导致过拟合(对训练文本分类准确,但对新文本分类误差大)。 | 100 |
| 批次大小(Batch Size) | 模型每次训练时同时处理的文本样本数量。例如,批次大小设为 12,即每次从训练集中抽取 12 条文本进行特征计算(如情感词提取、语义编码)与参数更新。 | 影响训练速度与模型稳定性:批次过小会增加训练耗时(需更多迭代次数),且参数更新波动大;批次过大可能导致内存不足(文本特征处理需占用内存),或模型收敛困难(单次更新覆盖样本过多,难以调整参数)。 | 32 |
| 学习速率(Learning Rate) | 控制模型每次参数更新的步长,即模型根据文本分类误差调整权重的幅度。例如,学习速率设为 0.001,即每次参数更新幅度为 0.001 倍的梯度值。 | 决定模型训练的收敛速度与最终精度:速率过大易导致训练震荡(误差忽高忽低,无法稳定收敛);速率过小会使训练缓慢(需更多周期才能达到低误差),且可能陷入局部最优解。 | 0.001 |
点击深入了解,我们会看到如下内容。这是训练监测相关数据,即每个周期的准确率和每个周期的损失。

每个周期的准确率:指在模型训练的一个周期(即对整个训练数据集完整迭代一次)内,模型预测结果与实际结果相符的比例。
每个周期的损失:该周期内模型预测值与真实值之间的误差程度量化指标。
2.2 模型校验过程

在模型校验文本框输入书籍名称,即可推理得出分类结果,如上所示输入《小蝌蚪找妈妈》,输出结果是儿童文学,准确率为97%。
2.3所需硬件及接线
2.31 所需硬件
1.行空板K10
2.USB数据线
2.32 电脑与行空板K10接线


2.4 环境准备
2.41 下载运行mqtt环境
由于语音识别、文本分类等模型暂不支持硬件部署,所以我们通过实时结果推送将识别的分类发送至物联网,由行空板K10接收后,显示到屏幕上。实时结果推送依托MQTT进行无线网络传输,因此需要输入计算机的实际IP地址。操作流程如下:首先启动数据传输工具(运行.bat批处理文件),然后获取计算机的 IP 地址。
运行过程中不能关闭传输工具。
SIoT工具下载连接:
腾讯微云下载(推荐): 链接: https://share.weiyun.com/6SFhgLQj
百度网盘下载: 链接:https://pan.baidu.com/s/17clVjJXWTZh02FteKy3mcA?pwd=mind


2.42 实时结果推送至应用

点击文本训练工具的实时结果推送前红色的圆点,设置mqtt信息,我设置的信息如下:

重点是推送的分类名称:siot/ai和准确率的topic:siot/ai/score
这两个topic需要在行空板K10的订阅中使用到。
当服务器连接打开的siot服务成功后,实时结果推送的按钮变为绿色。
2.5 编程
使用mind+ v2的上传模式,结合mqtt和wifi模块编写接受推送结果的程序。
如下为主程序,主要行空板K10的调试和显示


如下为清零程序:

如下为Mqtt服务器中接受数据程序

三、成果展示
行空板K10图书馆书籍分类系统界面如图所示

哔站视频:
四、附件
1.文本训练文件
2.文本素材
3.行空板K10上传文件
附件

返回首页
回到顶部







评论