基于行空板的nanodet物体分类项目- Makelog(造物记)

一、实践目标

本项目在行空板上外接USB摄像头，通过摄像头来识别物体，找到画面中的物体将其框出并识别。

二、知识目标

1、学习使用ncnn框架和Nanodet模型实现实时物体检测。

三、实践准备

硬件清单：

软件使用：

Mind+编程软件x1

四、实践过程

1、硬件搭建

1、将摄像头接入行空板的USB接口。

2、通过USB连接线将行空板连接到计算机。

2、软件编写

第一步：打开Mind+，远程连接行空板

第二步：在“行空板的文件”中新建一个名为AI的文件夹，在其中再新建一个名为“基于行空板的nanodet物体分类项目”的文件夹，导入本节课的依赖文件。

第三步：编写程序

在上述文件的同级目录下新建一个项目文件，并命名为“main.py”。

示例程序：

代码

import os

# 设置NCNN的环境变量
os.environ["NCNN_HOME"] = os.getcwd()

import sys
import cv2
import time
import numpy as np
import ncnn
# 导入ncnn的模型库
from ncnn.model_zoo import get_model
# 导入工具函数
from utils import draw_detection_objects

# 打开默认的摄像头设备
cap = cv2.VideoCapture(0)
# 设置摄像头的分辨率为320x240
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 320)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 240)
# 设置摄像头的缓冲区大小为1，这样可以减少延迟
cap.set(cv2.CAP_PROP_BUFFERSIZE, 1)

# 创建一个名为'image'的全屏窗口
cv2.namedWindow('image',cv2.WND_PROP_FULLSCREEN)    #Set the windows to be full screen.
cv2.setWindowProperty('image', cv2.WND_PROP_FULLSCREEN, cv2.WINDOW_FULLSCREEN)    #Set the windows to be full screen.

# 从模型库中获取NanoDet模型，设置了目标大小、阈值、线程数等参数
net = get_model(
    "nanodet",
    target_size=320,
    prob_threshold=0.4,
    nms_threshold=0.5,
    num_threads=4,
    use_gpu=False,
)

# 主循环
while cap.isOpened():
    # 从摄像头中读取一帧
    success, image = cap.read()
    # 如果读取失败，则忽略这一帧
    if not success:
        print("Ignoring empty camera frame.")
        # If loading a video, use 'break' instead of 'continue'.
        continue

    # 使用NanoDet模型对图像进行目标检测，得到检测到的目标列表
    objects = net(image)
    # 在图像上标记出检测到的目标
    image = draw_detection_objects(image, net.class_names, objects)

    # 将图像逆时针旋转90度
    image = cv2.rotate(image, cv2.ROTATE_90_COUNTERCLOCKWISE)
    # 显示图像
    cv2.imshow('image', image)
    # 如果按下了'ESC'键，则退出循环
    if cv2.waitKey(5) & 0xFF == 27:
        break
# 释放摄像头设备
cap.release()

3、运行调试

第一步：运行“1-Install_dependency.py”程序文件，等待自动安装依赖包。

第二步：运行主程序

运行“main.py”程序，可以看到初始时屏幕上显示着摄像头拍摄到的实时画面，将摄像头画面对准苹果、鼠标、手机等不同的物体，可以看到其被一一识别出。

Tips：程序运行过程中，可能需要联网自动更新下载模型。

4、程序解析

在上述的“main.py”文件中，我们主要通过opencv库来调用摄像头，获取实时视频流，然后使用ncnn库的NanoDet模型对图像进行目标检测，并在图像上标记出检测到的目标。整体流程如下，

①初始化：程序启动时，会打开默认的摄像头设备，并设置摄像头的分辨率和缓冲区大小。然后，程序会创建一个名为'image'的全屏窗口，用于显示图像。接着，程序会从模型库中获取NanoDet模型，并设置模型的相关参数。

②主循环：程序进入一个无限循环，在每次循环中，程序会执行以下操作：

- 从摄像头中读取一帧。如果读取失败，则会忽略这一帧，继续下一次循环。

- 使用NanoDet模型对读取到的帧进行目标检测，得到检测到的目标列表。

- 在读取到的帧上标记出检测到的目标。标记方式是在每个目标的外接矩形区域内，画出该目标的类别名称和置信度。

·将标记后的帧逆时针旋转90度，然后在窗口中显示出来。

③用户交互：程序会检查用户的键盘输入，如果按下了'ESC'键，那么程序会退出主循环。

④结束：当主循环结束时，程序会释放摄像头设备，然后退出。

五、知识园地

1. 了解ncnn库的NanoDet模型

ncnn是一个为移动端优化的高效神经网络前向计算框架，由腾讯的开源项目NCNN提供。ncnn可以运行在Android、iOS等移动设备上，支持多种神经网络模型，包括NanoDet。

NanoDet是一个高效的、轻量级的目标检测模型。它的设计目标是在保持较高的准确率的同时，尽量减小模型的大小和计算量，从而能够在资源受限的设备（如移动设备和嵌入式设备）上实现实时的目标检测。

NanoDet的主要特点包括：

1. 轻量级：NanoDet的模型大小非常小，只有约1MB，这使得它可以在资源受限的设备上运行。

2. 高效：NanoDet的计算量非常小，只有约1.5BFLOPs，这使得它可以在移动设备上实时运行。

3. 高精度：尽管NanoDet的模型大小和计算量都非常小，但它的检测精度仍然非常高，可以达到与一些更大、更复杂的模型相媲美的性能。

NanoDet使用了一些先进的神经网络设计技术，如深度可分离卷积、注意力模块等，来实现高效和高精度的目标检测。它的网络结构主要包括一个特征提取网络和一个目标检测头，特征提取网络用于从输入图像中提取特征，目标检测头用于根据提取的特征进行目标检测。

附件

Project.zip

_深蓝_2024.11.08

如何处理如下错误？ Traceback (most recent call last): File "/root/Project/main.py", line 12, in <module> from ncnn.model_zoo import get_model ImportError: cannot import name 'get_model' from 'ncnn.model_zoo' (/usr/local/lib/python3.7/dist-packages/ncnn/model_zoo/__init__.py) root@unihiker:~/Project#

0
_深蓝_2024.11.08

出现如下的错误，应该如何处理 Traceback (most recent call last): File "/root/Project/main.py", line 12, in <module> from ncnn.model_zoo import get_model ImportError: cannot import name 'get_model' from 'ncnn.model_zoo' (/usr/local/lib/python3.7/dist-packages/ncnn/model_zoo/__init__.py) root@unihiker:~/Project#

0

基于行空板的nanodet物体分类项目 简单