【花雕动手做】HUSKYLENS 2 AI 相机视觉传感器 ( 二哈识图 2) 之光学字符识别- Makelog(造物记)

HUSKYLENS 2 (二哈识图 2) 是一款简单易用、玩法多样的AI视觉传感器，采用6TOPS算力专用AI芯片，预置人脸识别、目标检测、物体分类、姿态识别、实例分割等20余种开机即用的AI模型，同时，用户还可部署自行训练的模型，教会二哈识图识别任意目标物体。板载的UART / I2C端口，可以与主流控制器Arduino、micro:bit、ESP32、Raspberry Pi等开源硬件无缝连接，被广泛应用于创客、AI教育、STEAM教育和交互艺术领域。

光学字符识别（Optical Character Recognition，简称 OCR）是一种图像识别技术，其核心目标是：将印刷或手写文本从图像、扫描件或照片中提取出来，并转换为可编辑的数字文本。光学字符识别是人工智能与图像处理的经典应用之一。它让计算机“看懂文字”，是连接纸质信息与数字世界的关键桥梁。

1、OCR 的基本原理
OCR 的识别过程通常包括以下几个步骤：
图像采集：通过扫描仪、摄像头或文件获取含有文字的图像。
图像预处理：去除噪声、校正倾斜、增强对比度，提高识别准确率。
文字定位：识别图像中哪些区域包含文字。
字分割：将整段文字拆分为单个字符。
字符识别：通过模式匹配或深度学习模型识别每个字符。
文本输出：将识别结果转换为可编辑的文本格式，如 TXT、DOC、PDF。

2、OCR 能识别哪些内容？

3、应用场景举例
扫描纸质文档并转为电子档
发P、收据自动录入系统
手机拍照识别文字（如翻译、搜索）
银行、政府机构的档案数字化
车牌识别系统中的字符提取
教育实验中的图像识别训练

4、相关场景

5、AI 相机视觉传感器 ( 二哈识图 2) 之光学字符识别

光学字符识别介绍
光学字符是指通过光学成像设备（如相机、扫描仪）呈现在图像上的文字。光学字符识别（OCR）是一种将这些图像中的文字自动识别并转换为可编辑、可搜索的电子文本的技术，使得纸质文档或图片中的文字信息能够被计算机理解和利用。
本功能下，HUSKYLENS 2可以检测画面中的中英文字符并显示其内容，可以学习、识别追踪字符。
注：在光学字符识别功能下，HUSKYLENS 2能检测出画面中所有文字块出现的区域并用方框圈出，但只识别离十字光标最近的一个文字块区域的内容并显示在方框左上角。

光学字符识别使用说明
这一部分我们将了解如何使用HUSKYLENS 2检测画面中的文字，学习、识别十字光标所指的文字。

选择光学字符识别功能
给HUSKYLENS 2供电，启动成功后，滑动屏幕，找到“光学字符识别”功能。

观察光学字符检测效果
将HUSKYLENS 2对着有文字的画面，检测到文字时，屏幕上会用白色方框，框出画面中的文字。“十”字光标所指的识别框上会显示识别出文字。

学习字符，观察结果
对准要学习的文字，调整HUSKYLENS 2“看”的角度，使屏幕中间的“十”字光标位于白色框内，然后按下HUSKYLENS 2右上角A键，进行学习。

学习完成后，如识别到已学习的文字，屏幕将以彩色方框框出该文字，并在上方显示“name: IDx 90%” ，name默认为文字的内容，例如“春眠不觉晓:ID1 100%”。"ID1"即第一个学习的文字；“100%”是指置信度，表示在光学字符识别功能下，模型认为当前摄像头画面中识别到的目标文字是某已学文字的可能性。"ID1 100%"即模型认为当前文字有100%的可能性是已学习过的ID为1文字。

【花雕动手做】HUSKYLENS 2 AI 相机视觉传感器 ( 二哈识图 2) 之光学字符识别 简单

【花雕动手做】HUSKYLENS 2 AI 相机视觉传感器 ( 二哈识图 2) 之光学字符识别简单