自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 Word2016中给公式加编号问题

解决方法很简单:第一步:公式后加 #(编号);第二步:敲击回车(Enter键)转自:https://blog.csdn.net/weixin_42147487/article/details/88424237

2020-04-07 23:55:53 1261

原创 pandas 某列删除包涵特定字符串所在的行

首先看一下数据,两张表,第一张的物料代码列全是int 类型第二张物料代码有int类型和Str类型两种现在要将第二张匹配到第一张方法:通过列表求交集,取出都包含的int类型物料代码main_list = list(MainCigData['物料代码'])print(main_list)cig_list = list(CigData['物料代码'])print(cig_list)#...

2020-03-11 23:10:13 988

原创 冤家Couple数字

m,n是一对冤家Couple数字(1<=m<n<=9)在十进制中,规定:每一位只由m和n两个数字组成的正整数Y都叫做冤家数。例如:m=3,n=8时,冤家数从小到大的排列为:3, 8,33,38,83,88,333,338…现在需要找到第T个冤家数。输入描述:第一行一个数字K(K<=1000)表示测试的数组接下来K行,每行三个数m,n,t以空格相隔输出描述:对...

2019-10-23 16:07:37 806

原创 机器学习fit时出现---ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

出现ValueError: Input contains NaN, infinity or a value too large for dtype(‘float32’).就如错误一样,数据集里有inf数值# 空值排查nan_list = trains.isnull().sum().tolist()#把每一列的空值个数加起来print(nan_list)print(sum(nan_list...

2019-08-13 14:52:34 9153 1

原创 Pandas---读取数据比较大的文件

文件大,读取时结构有时会出现结构错误先来正确的方式说一下数据大小,这里我的数据大小有一百多兆,以前也用传统的方式读取过,没问题,在这次却有点小麻烦,好在换了个方式解决了,希望对你也有用,同时,如果经常读取比较大的文件时,也建议你这样做。import pandas as pdfile_path = open('E:\数据\20190718_20190725.txt', 'r', enco...

2019-07-27 20:07:26 980

原创 机器学习—特征工程篇

数据预处理最近开始学习用机器学习进行建模,顺便在这里记录一下自己的学习过程。首先说一下自己的工作进度,目前已经对手里的数据清洗完毕,接下来就是找一些机器学习的模型。任何事都要一步一步来,下面开始机器学习的第一步,做特征工程(这里主要分享一下常用的,比较方便的代码,具体的可以根据个人的需求去数据集上使用)1、先瞅瞅数据长啥样train.shape # 用来查看数据的大小,几行几列t...

2019-07-16 14:44:49 146

原创 Pandas---去重drop_duplicates和duplicated

今天分享一个去重在项目中的小应用主要有三列:时间,ID, 等级重复情况:可能同一天同一个ID对应两个不同的等级目标是:找出重复情况对应的时间和ID # 对合并后的数据进行处理 data_range.drop_duplicates(inplace=True) # 对档位数据整体去重,即将同一天同一ID等级相同的去重 print(data_range.info()) # 去...

2019-06-27 11:23:27 305

原创 Pandas --- 取出两列中相同的元素

分别取出两列,将两列转为两个列表先,对两个列表进行比较。# 看一下集市价都有哪些规格def cig_data(file_path1, file_path2): data = pd.read_excel(file_path1, sheet_name=0, encoding='gbk') data.drop_duplicates(subset='物料代码', keep='first...

2019-06-21 21:20:36 15769 6

原创 Python-----合并同一个文件夹下多个txt

https://www.jb51.net/article/138936.htm# -*- coding:utf-8*-# import sys# reload(sys)# sys.setdefaultencoding('utf8')import osimport os.pathimport timetime1 = time.time()######################...

2019-06-19 20:32:18 1023

原创 Python---将某一列设置为str类型

方法一:读取文件时设置代码如下:Data = pd.read_excel(level_path, sheet_name=0, encoding='gbk', dtype={'时间': 'str'})方法二:apply()方法代码如下:num[0] = num[0].apply(str) # 这里num[0]:取的是第一列,在我的代码中实际意义是一列时间列,形如:2019-06-1...

2019-06-01 08:17:47 9674

原创 Pandas——时间序列的处理

时间的几个格式

2019-05-14 19:08:44 351

原创 Python基础之——字典dict

字典不常见的用法一个重要的collections模块和Counter类1.collections模块collections模块包含除了dict、set、list、tuple以外的一些特殊的容器类型,比如下面几个:(1)OrderedDict类:排序字典,是字典的子类。(2)defaultdict:使用工厂函数创建字典,使不用考虑缺失的字典键。(3)Counter类:为hashable对...

2019-05-14 19:07:25 231

原创 Python----时间模块

1.计算昨天,明天的日期from datetime import datetime,timedeltanow = datetime.now()print(now)yestoday = now - timedelta(days=1)print(yestoday)tommorow = now + timedelta(days=1) print(tommorow)next_year ...

2019-05-14 19:04:58 953

转载 Python基础知识点-----字符串和整数,浮点型互相转换

Python基础知识点1.python 字符串和整数,浮点型互相转换(1)int(str) 函数将 符合整数的规范的字符串 转换成 int 型。 num1 = "278"; num2 = int(num1); print("num2: %d" % num2); ''' 输出 num2: 278 '''(2)float(str) 函数将 符合...

2019-03-13 09:18:47 482

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除