用行空板实现文字识别纠错- Makelog(造物记)

用行空板实现文字识别纠错

一、创作背景

有这样一个任务：机器人首先实时拍照识别1张知识卡片上的信息内容，判断其中的错别字及所在位置，然后按照规定格式显示并播报指定内容。

如下格式：有一个错别字，显示与播报内容的格式：“第X个字有误，请更正为X”。

二、作品原理

本项目我们给行空板接上摄像头和喇叭，利用Python pytesseract库制作一个文字识别装置，实现拍照识别并输出纸上的文字，在实现语音播报。将纸上识别到的文字传给Kimi大语言模型，通过大语言模型来判断文字内容对错并按“第X个字有误，请更正为X”的格式输出文字，并将输出内容转换成语音播报出来。

三、硬件清单

行空板 1个

语音合成模块 1个

摄像头 1个

四、制作过程

1.安装插件和必要的程序文件。
安装pytesseract库将其添加到项目文件中，再上传到行空板中与mindplas文件夹的平行文件夹位置。

结果下如图

安装pytesseract库，将编程模式切换为代码模式，双击打开“1-Install_dependency.py”文件，出现安装代码，点击运行，自动安装依赖库。

安装完成：