数据整理
锦鲤AI幸运
---2016年---,初来乍到,冲鸭~~~~~
---2020年---,第一次记录博客,好活当赏O(∩_∩)O哈哈~
展开
-
cuda.tensor转为numpy, 以及numpy与tensor互相转换
cuda.tensor转为numpy, 以及numpy与tensor互相转换原创 2022-11-16 16:38:17 · 3068 阅读 · 0 评论 -
Kinetics400/600/700数据集免费下载
Kinetics数据集一组大规模、高质量的URL链接数据集,包含多达,涵盖400/600/700个人类动作类别,具体取决于数据集版本。这些视频包括人与物的互动,如演奏乐器,以及人与人之间的互动,如握手和拥抱。每个动作类别至少有400/600/700个视频片段。每个片段都由人类对一个动作类别进行注释,并持续10秒左右。原创 2022-11-04 11:43:19 · 4988 阅读 · 12 评论 -
解决RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors...CUDA_LAUNCH_BLOCKING=1
RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.For debugging consider passing CUDA_LAUNCH_BLOCKING=1.原创 2022-04-30 15:29:20 · 62347 阅读 · 39 评论 -
解决PermissionError: [Errno 13] Permission denied
解决PermissionError: [Errno 13] Permission denied原创 2022-03-05 21:34:57 · 14191 阅读 · 7 评论 -
计算的三列数据的平均值,pandas存储
数据展示import pandas as pdimport numpy as npimport jsonfrom collections import Counterdata = pd.read_excel("work/Test.xlsx")rows = data.shape[0] #行数col = data.shape[1] #列数user_index = list(data.columns.values)#行标签print(user_index, "\n 一共有:{}行,{}列".原创 2021-08-19 22:21:16 · 1762 阅读 · 0 评论 -
pandas查找值在特定列出现过多少次,返回第一次出现的索引
数据展示import pandas as pdimport numpy as npimport jsonfrom collections import Counterdata = pd.read_excel("work/Test.xlsx")rows = data.shape[0] #行数col = data.shape[1] #列数user_index = list(data.columns.values)#行标签print(user_index, "\n 一共有:{}行,{}列".原创 2021-08-16 13:09:39 · 2796 阅读 · 0 评论 -
pandas处理指定列去除所有重复的值,且按原来读入顺序存储
数据展示import pandas as pdimport numpy as npimport jsonfrom collections import Counterdata = pd.read_excel("work/Test.xlsx")rows = data.shape[0] #行数col = data.shape[1] #列数user_index = list(data.columns.values)#行标签print(user_index, "\n 一共有:{}行,{}列".原创 2021-08-16 12:38:08 · 652 阅读 · 0 评论 -
python中把list列表所有或者部分的数变成整数,或者浮点数,字符串等等
list_x = [1624865249825.0, 316.0, 351.0, 32.0, 107.0, 4.0, 1.7187, 2970.0, -1.0]list_y = [5249825, 4.0, 925, 0.3903, 1.7187, 0.2296, 2970.0, -1.0]list_x = list(map(int, list_x[1:5]))list_y = list(map(int, list_y[:]))list_f = list(map(float, list_y[:].原创 2021-08-12 20:27:41 · 17176 阅读 · 3 评论 -
PPOCRLabel标注数据集与Style Text数据合成工具(身份ID识别)
1、项目简介可直接点我进入项目地址查看代码详情1.1 本项目简单介绍Style text 与ppocrlabel标注工具。系统环境:Win10ppocrlabel运行工具 :PyCharm 2020.3.3 x64开发环境配置工具:Anaconda开发环境:python 3.81.2 关于本项目本项目简单介绍Style text 与ppocrlabel标注工具,使得收集数据更加容易,使用Style text 工具批量制作所需要的数据,然后使用ppocrlabel标注工具做出模型所需要的原创 2021-06-09 10:55:58 · 1738 阅读 · 2 评论 -
表格(xlsx,csv)文件转为txt文件,pandas
import pandas as pd excle_file=pd.read_excel("./data.xlsx") #可以读入.csv,xlsx等等 #excle_file[1]=-1 #将第二列全部修改为-1 excle_file.to_csv('./w_data.txt', sep='\t', index=None)原创 2021-05-31 10:48:01 · 412 阅读 · 0 评论 -
图像锐化,增加亮度与对比度,图像数据集增广处理
直接看代码,详细注释from PIL import Image, ImageFilter, ImageEnhanceimport osdef sharp_data(photo_path,output_path): #(输入路径,输出路径) filelist = os.listdir(photo_path) num_jpg = len(filelist) print("--------原始图像个数-------:",num_jpg) load="../"+photo原创 2021-05-31 10:37:04 · 623 阅读 · 0 评论 -
将图片转为视频python代码,解决转出视频只有几k被损坏的问题
很多代码都没有写图片在文件夹中排序的情况下去组成,可能会导致导出视频异常。import cv2import osdef getvideo(photo_path, video_name, fps): filelist = os.listdir(photo_path) size = (1920, 1080) #图片格式大小 video = cv2.VideoWriter(video_name, cv2.VideoWriter_fourcc('I', '4', '2', '0'),原创 2021-05-27 12:14:56 · 399 阅读 · 0 评论 -
ParseError: not well-formed (invalid token): line 1, column 0问题解决
出现这个问题一般都是文件内部原因,第一行就停止读取,格式不正确。查看自己要读取的文件第一行。使用解析xml文件,代码如下:def extract_xml(infile): tree = ET.parse(infile) root = tree.getroot() size = root.find('size') classes = [] for obj in root.iter('object'): cls_ = obj.find('name'原创 2021-05-08 16:53:05 · 9054 阅读 · 0 评论 -
数据预处理:归一化 (Normalization)、标准化 (Standardization)和中心化/零均值化 (Zero-centered)代码实现
1、 概念 归一化: 1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。 公式如下(Min-max Normalization): &nb原创 2021-05-07 15:50:25 · 1744 阅读 · 3 评论 -
把txt文件转为表格(csv)文件 第一行做表头,不做表头Python代码实现
把txt文件转为表格(csv)文件 Python代码实现 首先查看.txt数据集,观察得出已经有表头和列头,所以无需加上表头和列头 用pandas来处理数据,代码如下:import pandas as pddata=open("pm2.5.txt","r")res=[]for i in data: d=[x for x in i.strip("").split(',')] #strip用于移除字符串头尾指定的字符;split通过","对原创 2021-03-24 14:13:31 · 2340 阅读 · 0 评论