数据处理
SeventhBlue
学习再学习!
展开
-
根据点击图片上显示的类别进行归类
2、归类:鼠标左击上图左侧显示的类别。例如,点击后左侧的第三行,会出现的一张图片并有对应的输出,这里的效果如下。1、运行界面:(输入的图片是什么,就显示什么)信息全在代码里,运行效果。3、一直按照第二步操作即可完成图片归类。原创 2024-03-01 12:09:19 · 477 阅读 · 1 评论 -
xml文件数据处理:删除指定类别,处理空格、中文
【代码】xml文件数据处理:删除指定类别,处理空格、中文。原创 2023-12-21 10:51:05 · 490 阅读 · 0 评论 -
coco数据集添加字段、合并数据集及过滤小分割区域
一、添加字段:#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time :2022/2/17 10:03# @Author :weiz# @ProjectName :coco_evaluate# @File :add_key_word.py# @Description :# Copyright (C) 2021-2025 Jiangxi Institute Of Intelligent Industry原创 2022-03-07 09:43:47 · 1298 阅读 · 5 评论 -
数据格式处理:数据转换(yolo转voc和voc转coco)及voc数据删除等
yolo转voc:#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time :2021/8/31 下午3:06# @Author :# @ProjectName :mmdetection-master# @File :yolo2voc.py# @Description :import osimport codecsimport cv2import randomimport xml.etree.El原创 2021-09-10 10:24:12 · 677 阅读 · 0 评论 -
opencv视频和图片之间的处理
#!/usr/bin/env python#-*-coding:utf-8-*-'''Author: weizdate: 2019/10/6 20:05desc: input: output: '''import numpy as npimport cv2 as cvframes = 100matl = []for i in range(frames): ...原创 2019-10-07 01:02:48 · 1244 阅读 · 0 评论 -
随机移动n个图片到另一文件夹
#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time :2020/10/12 15:59# @Author :weiz# @ProjectName :yoloProcessedData# @File :randomImagesData.py# @Description :随机抽取数据import osimport randomimport sysimport cv2sys.setrecursion.原创 2020-10-12 17:33:56 · 290 阅读 · 0 评论 -
OCR训练文本生成工具
原项目地址:https://github.com/Sanster/text_renderer我做的一些功能扩充后项目地址:https://github.com/SeventhBlue/textGenerationTool1、如何使用 进入工程目录,直接运行main.py,就会生成相应的数据。2、需要根据自己需求更改的设置2.1、parse_args.py...原创 2019-12-22 15:32:21 · 1344 阅读 · 1 评论 -
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 3: invalid start byte
1.问题描述: 需要用到中文预料,所以下载了一篇txt文件小说,但是读取的时候就出现如标题所示的错误。2.问题分析: 通过查找可以知道这是字符编码的问题。网上找到的方法都是说读取该文件时使用“gbk”格式的编码就行。但是,不使用“utf-8”编码格式我总觉的会有问题。 2.1 UTF-8和GBK:GBK是在国家标准GB2312基础上扩容...原创 2019-12-16 11:04:44 · 5462 阅读 · 0 评论 -
最常用的36个Pandas函数
1.生成数据表import numpy as npimport pandas as pd导入外部数据df=pd.DataFrame(pd.read_csv('name.csv',header=1))df=pd.DataFrame(pd.read_Excel('name.xlsx'))c里面有很多可选参数设置,例如列名称、索引列、数据格式等直接写入数据:df = ...原创 2019-12-16 09:22:24 · 543 阅读 · 0 评论 -
用yolov3进行图片分类
使用yoloV3进行图片分类:一个待处理的Images文件夹,里面包含要处理的图片;一个目标文件personFile,我这里需要提取含有行人的图片;一个非目标的文件noPersonFile。实际功能是从Images一张一张的读取,使用yolo返回的结果查看该图片是否包含行人,有则把它写入personFile文件中,否则写入noPersonFile文件中,同时将该图片从Images删...原创 2019-10-12 19:06:17 · 8448 阅读 · 0 评论 -
使用tesseract训练自己的字库提高识别率
问题描述:想使用tesseract识别中文,但是发现有一个字tesseract自带的库会识别错误或者不识别。比如下图的左图,其结果是“肇”变成“告”,明显是识别错了。但是如果将“肇”单独去识别,会发现根本识别不出,结果的txt文本上会是空文件。所以推断在tesseract自带的中文库中是没有训练“肇”这个字的。现在我的目的是训练一个中文识别库,希望能够识别这个“肇”字。 ...原创 2019-09-01 18:13:50 · 28059 阅读 · 13 评论 -
利用pandas将数据保存为csv和Excel格式
代码如下:import numpy as npimport pandas as pddef save_csv(arr, csv_filename=None): """Save the data in csv format""" if csv_filename == None: csv_filename="csv.csv" arr_df = pd....原创 2019-01-23 12:41:41 · 16393 阅读 · 0 评论 -
根据输入的键盘值,生成自己想要的折线图,并保存数据
通过键盘的输入得到自己想要的折线图,并保存该折线图的数据。 如下图所示,输入左图中键盘值,右图会做相应的动作。其中右图中的点的颜色由W和S控制,红色表示增加,蓝色表示减少;点的移动由A和D控制,输入A表示左移,输入D表示右移。 注意:只接受小写的单个字母和[1,999]数值,输入其他的会提示输入错误或者图片不做变化。 是在控制台中输入。比如...原创 2019-01-23 12:19:33 · 1827 阅读 · 0 评论 -
按区间分类txt文件中的数值,并利用matplotlab画其bar图形
先找到所有txt文件的路径,具体详情的可以点击这里。获得其所有路径后,遍历所有路径下的所有txt文件,按区间分类txt文件中的数值,并利用matplotlab画其bar图形。其中txt文件中的数据格式是(只读取每行的后面的两个):其实现代码如下:import osimport numpy as npimport matplotlib.pyplot as plt...原创 2018-11-25 22:35:15 · 398 阅读 · 0 评论 -
python利用pandas读取Excel文件和筛选处理小案例
1.问题描述:想要筛选Excel中的数据,筛选条件是 实际收费 > 消费金额,并且保存筛选的数据为Excel格式! 数据格式如底部所示!2.实现:利用pandas处理数据。3.代码如下:import numpy as npimport pandas as pd# a = np.arange(24).reshape(4, 6)...原创 2018-09-14 14:56:32 · 24166 阅读 · 4 评论 -
python利用pandas库求数据日期的差
1、问题描述:有两个文件,一个文件是会员注册信息。包含会员注册卡号、会员的出生年月、性别(0表示女士、1表示男士)、会员入会登记时间。另一个文件是消费记录。包含会员卡号、会员消费产生的时间、商品编码、销售数量、商品售价、消费金额、商品名称、此次消费的会员积分、 收银机号、单据号(相同的单据号可能不是同一笔消费产生)、柜组编码、柜组名称。现在要得到仅在16年注册的会员,到第一次消费所花的时间。数据格...原创 2018-09-15 16:36:27 · 4611 阅读 · 0 评论