当前位置：首页 > AI > 正文内容

使用PaddleX对大量图片进行分类(仅包含预测的内容)

chanra1n4年前 (2022-06-15)AI6575

# -*- coding: UTF-8 -*-

import os
import cv2
from shutil import copyfile
import numpy as np
import paddlex as pdx

#处理中文路径
import importlib,sys
importlib.reload(sys)

#Paddle加载模型
model = pdx.load_model('./inference_model')

def paddle_predict(source_path,result_path,threshold_value):
    #对源路径的图片进行推理
    #对来自参数一目录下的图片进行分类，按分类名保存在参数二的目录下，当预测的准确度大于参数三时，保存该图片到参数二对应目录下
    isExists=os.path.exists(result_path)#判断目标文件夹是否存在
    if not isExists:
        os.makedirs(result_path)
    for filename in os.listdir(source_path):
        try:
            im = cv2.imdecode(np.fromfile(source_path+'/'+filename,dtype=np.uint8),-1)
            im = im.astype('float32')
            result = model.predict(im)
            print(result)
            isExists=os.path.exists(result_path+'/'+result[0]['category'])#判断分类文件夹是否存在
            if not isExists:
                os.makedirs(result_path+'/'+result[0]['category'])
            if(result[0]['score']>threshold_value):
                copyfile(source_path+'/'+filename, result_path+'/'+result[0]['category']+'/'+filename)
                #os.remove(source_path+'/'+filename)
        except:
            print('ERROR:'+filename)

paddle_predict("C:/test","C:/output_new",0.9)

首先使用PaddleX进行训练，然后使用该Python程序对大量图片进行分类。

本程序支持中文路径和错误处理功能，能够稳定用于生产用途。

另附上支持对源路径的子文件夹进行遍历的程序

# -*- coding: UTF-8 -*-

import os
import cv2
from shutil import copyfile
import numpy as np
import paddlex as pdx

#处理中文路径
import importlib,sys
importlib.reload(sys)

#Paddle加载模型
model = pdx.load_model('./inference_model')

def paddle_predict(source_path,result_path,threshold_value):
    #对源路径的图片进行推理
    #对来自参数一目录下的图片进行分类，按分类名保存在参数二的目录下，当预测的准确度大于参数三时，保存该图片到参数二对应目录下
    isExists=os.path.exists(result_path)#判断目标文件夹是否存在
    if not isExists:
        os.makedirs(result_path)

    for dirpath, dirnames, filenames in os.walk(source_path):
        for filename in filenames:
            try:
                im = cv2.imdecode(np.fromfile(os.path.join(dirpath, filename),dtype=np.uint8),-1)
                im = im.astype('float32')
                result = model.predict(im)
                print(os.path.join(dirpath, filename))
                isExists=os.path.exists(result_path+'/'+result[0]['category'])#判断分类文件夹是否存在
                if not isExists:
                    os.makedirs(result_path+'/'+result[0]['category'])
                if(result[0]['score']>threshold_value):
                    copyfile(os.path.join(dirpath, filename), result_path+'/'+result[0]['category']+'/'+filename)
                    #os.remove(os.path.join(dirpath, filename))
            except:
                print('ERROR:'+os.path.join(dirpath, filename))

paddle_predict("C:/test","C:/output_new",0.9)

然后为了方便展示效果，进一步优化

# -*- coding: UTF-8 -*-

import os
import cv2
import time
import threading
from shutil import copyfile
import numpy as np
import paddlex as pdx

#处理中文路径
import importlib,sys
importlib.reload(sys)

TEMP_SEC_CALC=0
TEMP_SEC_CALC_ERROR=0
TEMP_SUM=0
TEMP_SUM_DONE=0

model = pdx.load_model('./inference_model') #Paddle加载模型

def time_convert(seconds):
    seconds = seconds % (24 * 3600)
    hour = seconds // 3600
    seconds %= 3600
    minutes = seconds // 60
    seconds %= 60
    return "%02d:%02d:%02d" % (hour, minutes, seconds)

def paddle_predict_calc():
    global TEMP_SEC_CALC
    global TEMP_SEC_CALC_ERROR
    global TEMP_SUM
    global TEMP_SUM_DONE
    while TEMP_SUM!=TEMP_SUM_DONE:
        if TEMP_SEC_CALC:
            print('FPS:'+str(TEMP_SEC_CALC)+' Remain:'+time_convert((TEMP_SUM-TEMP_SUM_DONE)/TEMP_SEC_CALC) + ' ERROR:'+str(TEMP_SEC_CALC_ERROR))
        TEMP_SEC_CALC = 0
        time.sleep(1)

def paddle_predict(source_path,result_path,threshold_value):
    #对源路径的图片进行推理
    #对来自参数一目录下的图片进行分类，按分类名保存在参数二的目录下，当预测的准确度大于参数三时，保存该图片到参数二对应目录下
    global TEMP_SEC_CALC_ERROR
    global TEMP_SUM_DONE
    global TEMP_SEC_CALC
    isExists=os.path.exists(result_path)#判断目标文件夹是否存在
    if not isExists:
        os.makedirs(result_path)
    for dirpath, dirnames, filenames in os.walk(source_path):
        for filename in filenames:
            try:
                im = cv2.imdecode(np.fromfile(os.path.join(dirpath, filename),dtype=np.uint8),-1)
                im = im.astype('float32')
                result = model.predict(im)
                #print(os.path.join(dirpath, filename))
                isExists=os.path.exists(result_path+'/'+result[0]['category'])#判断分类文件夹是否存在
                if not isExists:
                    os.makedirs(result_path+'/'+result[0]['category'])
                if(result[0]['score']>threshold_value):
                    copyfile(os.path.join(dirpath, filename), result_path+'/'+result[0]['category']+'/'+filename)
                    #os.remove(os.path.join(dirpath, filename))  
            except:
                #print('ERROR:'+os.path.join(dirpath, filename))
                TEMP_SEC_CALC_ERROR = TEMP_SEC_CALC_ERROR + 1
            TEMP_SUM_DONE = TEMP_SUM_DONE + 1
            TEMP_SEC_CALC = TEMP_SEC_CALC + 1

def predict(source_path,result_path,threshold_value):
    #对来自参数一目录下的图片进行分类，按分类名保存在参数二的目录下，当预测的准确度大于参数三时，保存该图片到参数二对应目录下
    global TEMP_SUM
    for dirpath, dirnames, filenames in os.walk(source_path):
        for filename in filenames:
            TEMP_SUM = TEMP_SUM + 1
    print('总共发现了：'+str(TEMP_SUM)+'个文件！')
    time.sleep(2)

    main_func = threading.Thread(target=paddle_predict, args=(source_path,result_path,threshold_value))
    calc_func = threading.Thread(target=paddle_predict_calc)
    main_func.start()
    calc_func.start()

predict("C:/test","C:/output_new1",0.9)

运行效果

为了方便对网页图片进行判断，修改了一个精简版的

# -*- coding: UTF-8 -*-

import cv2
import paddlex as pdx

# 处理中文路径
import importlib
import sys
importlib.reload(sys)

Paddle_Func = pdx.load_model('./inference_model')  # Paddle加载模型

def Paddle_Url_Predit(Pic_Url):
    try:
        cap = cv2.VideoCapture(Pic_Url)
        if(cap.isOpened()):
            ret, im = cap.read()
            im = im.astype('float32')
            result = Paddle_Func.predict(im)
            print(result)
        else:
            print('Download Failure!')
    except:
        print('Unknown Error!')

Paddle_Url_Predit('图片url地址')

进一步添加Socket传输图片的url地址

服务端：

# -*- coding: UTF-8 -*-

import cv2
import paddlex as pdx

# 处理中文路径
import importlib
import sys
importlib.reload(sys)

Paddle_Func = pdx.load_model('./inference_model')  # Paddle加载模型

def Paddle_Url_Predit(Pic_Url):
    try:
        cap = cv2.VideoCapture(Pic_Url)
        if(cap.isOpened()):
            ret, im = cap.read()
            im = im.astype('float32')
            result = Paddle_Func.predict(im)
            return(result)
        else:
            return('Download Failure!')
    except:
        return('Unknown Error!')

import os
import stat
import socket

# 创建服务器端套接字
sk = socket.socket()
sk.bind(('127.0.0.1', 8898))
sk.listen()
conn, addr = sk.accept()
while True:
    ret = conn.recv(1024)
    # 打印客户端信息
    Socket_rst = Paddle_Url_Predit(ret.decode('utf-8'))
    print(Socket_rst)
    try:
        conn.send(bytes(str(Socket_rst), encoding='utf-8'))
    except:
        print('Connect Error!')
# 关闭客户端链接
conn.close()
# 关闭服务器套接字
sk.close()

客户端（Python，参考自https://zhuanlan.zhihu.com/p/279968757）：

import socket
# 创建客户端套接字
sk = socket.socket()          
# 尝试连接服务器
sk.connect(('127.0.0.1',8898))
while True:
    # 信息发送
    info = input('>>>')
    sk.send(bytes(info,encoding='utf-8'))
    # 信息接收
    ret = sk.recv(1024)
    # 结束会话
    if ret == b'bye':
        sk.send(b'bye')
        break
    # 信息打印
    print(ret.decode('utf-8'))
# 关闭客户端套接字
sk.close()

客户端（PHP）：

待续

扫描二维码推送至手机访问。

本文链接：https://myfpga.cn/index.php/post/247.html

分享给朋友：

返回列表

上一篇：ZYNQ7010在PYNQ环境下使用NPU加速神经网络推理

下一篇：使用爱快Docker安装Paddle对Paddle生成的模型进行预测

“使用PaddleX对大量图片进行分类(仅包含预测的内容)” 的相关文章

python基础三层深度学习网络

#coding:utf-8 #neural network class definition import numpy import scipy.spatial class neuralNetwork: &...

解决tfClassifier训练报错的问题修正后python 适用于tensorflow2.x python3.x

# -*- coding: utf-8 -*-"""Created on Sun Dec 29 19:21:08 2019@原作者: xiuzhang Eastmount CSDN@修改作者：ChanRa1n修正问题：TensorFlow版本低，学习速率过高，修正为0....

简单OpenCV人脸识别

# -*- coding: utf-8 -*- """ Created on Sat Dec 5 22:39:13 2020 @author:&nb...

基于低性能MCU的DP深度学习可研

待续......

基于M5Stack的UnitV2实现的口罩检测系统(边缘计算+上位机+网站前后端)

硬件介绍及实现的功能本项目实现了一个口罩检测的系统，采用M5Stack提供的M5Stack UnitV2设备，并以该设备为核心。UnitV2设备以Sigmstar SSD202D为核心，通过GC2145摄像头采集图像信息，使用OpenCV和腾讯的开源N...

玩客云安装Armbian基于PaddleLite实现图片分类和目标检查 Cortex-A5等其他可参考

本教程为本站原创，转载请注明本网站链接，否则视为侵权！如果朋友还没有安装Armbian，或者怎么折腾也折腾不好，请直接翻到文章最后下载img文件！教程中碰到出错的地方，可以重复运行代码尝试！其他的ArmV7 32位的也可以参考本文，图片分类速度：1.1帧/秒，每张图片耗时约900ms，生产用途应该是...

使用PaddleX对大量图片进行分类(仅包含预测的内容)

“使用PaddleX对大量图片进行分类(仅包含预测的内容)” 的相关文章

python基础三层深度学习网络

解决tfClassifier训练报错的问题修正后python 适用于tensorflow2.x python3.x

简单OpenCV人脸识别

基于低性能MCU的DP深度学习可研

基于M5Stack的UnitV2实现的口罩检测系统(边缘计算+上位机+网站前后端)

玩客云安装Armbian基于PaddleLite实现图片分类和目标检查 Cortex-A5等其他可参考

Copyright © MyFpga.cn 技术的执着 | 蜀ICP备19035584号-1 | | 川公网安备 51142202000123号版权所有 © 2019-2024, 陈语ChanRa1n(网站仅用于学习和教育目的). 由MyFPGA智慧中心驱动，主站访问统计(360奇安信)，Email:chenyu@myfpga.cn

Powered By Z-BlogPHP. Theme by TOYEAN.

使用PaddleX对大量图片进行分类(仅包含预测的内容)

“使用PaddleX对大量图片进行分类(仅包含预测的内容)” 的相关文章

python基础三层深度学习网络

解决tfClassifier训练报错的问题 修正后python 适用于tensorflow2.x python3.x

简单OpenCV人脸识别

基于低性能MCU的DP深度学习可研

基于M5Stack的UnitV2实现的口罩检测系统(边缘计算+上位机+网站前后端)

玩客云安装Armbian基于PaddleLite实现图片分类和目标检查 Cortex-A5等其他可参考

Powered By Z-BlogPHP. Theme by TOYEAN.

解决tfClassifier训练报错的问题修正后python 适用于tensorflow2.x python3.x