Ethan Lee-CSDN博客

转载 Word2016中给公式加编号问题

解决方法很简单：第一步：公式后加 #（编号）；第二步：敲击回车（Enter键）转自：https://blog.csdn.net/weixin_42147487/article/details/88424237

2020-04-07 23:55:53 1403

原创 pandas 某列删除包涵特定字符串所在的行

首先看一下数据，两张表，第一张的物料代码列全是int 类型第二张物料代码有int类型和Str类型两种现在要将第二张匹配到第一张方法：通过列表求交集，取出都包含的int类型物料代码main_list = list(MainCigData['物料代码'])print(main_list)cig_list = list(CigData['物料代码'])print(cig_list)#...

2020-03-11 23:10:13 1088

原创冤家Couple数字

m,n是一对冤家Couple数字（1<=m<n<=9）在十进制中，规定：每一位只由m和n两个数字组成的正整数Y都叫做冤家数。例如：m=3,n=8时，冤家数从小到大的排列为：3， 8,33,38,83,88,333,338…现在需要找到第T个冤家数。输入描述：第一行一个数字K（K<=1000）表示测试的数组接下来K行，每行三个数m,n,t以空格相隔输出描述：对...

2019-10-23 16:07:37 1044

原创机器学习fit时出现---ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

出现ValueError: Input contains NaN, infinity or a value too large for dtype(‘float32’).就如错误一样，数据集里有inf数值# 空值排查nan_list = trains.isnull().sum().tolist()#把每一列的空值个数加起来print(nan_list)print(sum(nan_list...

2019-08-13 14:52:34 9540 1

原创 Pandas---读取数据比较大的文件

文件大，读取时结构有时会出现结构错误先来正确的方式说一下数据大小，这里我的数据大小有一百多兆，以前也用传统的方式读取过，没问题，在这次却有点小麻烦，好在换了个方式解决了，希望对你也有用，同时，如果经常读取比较大的文件时，也建议你这样做。import pandas as pdfile_path = open('E:\数据\20190718_20190725.txt', 'r', enco...

2019-07-27 20:07:26 1088

原创机器学习—特征工程篇

数据预处理最近开始学习用机器学习进行建模，顺便在这里记录一下自己的学习过程。首先说一下自己的工作进度，目前已经对手里的数据清洗完毕，接下来就是找一些机器学习的模型。任何事都要一步一步来，下面开始机器学习的第一步，做特征工程（这里主要分享一下常用的，比较方便的代码，具体的可以根据个人的需求去数据集上使用）1、先瞅瞅数据长啥样train.shape # 用来查看数据的大小，几行几列t...

2019-07-16 14:44:49 203

原创 Pandas---去重drop_duplicates和duplicated

今天分享一个去重在项目中的小应用主要有三列：时间，ID，等级重复情况：可能同一天同一个ID对应两个不同的等级目标是：找出重复情况对应的时间和ID # 对合并后的数据进行处理 data_range.drop_duplicates(inplace=True) # 对档位数据整体去重，即将同一天同一ID等级相同的去重 print(data_range.info()) # 去...

2019-06-27 11:23:27 428

原创 Pandas --- 取出两列中相同的元素

分别取出两列，将两列转为两个列表先，对两个列表进行比较。# 看一下集市价都有哪些规格def cig_data(file_path1, file_path2): data = pd.read_excel(file_path1, sheet_name=0, encoding='gbk') data.drop_duplicates(subset='物料代码', keep='first...

2019-06-21 21:20:36 16120 6

原创 Python-----合并同一个文件夹下多个txt

https://www.jb51.net/article/138936.htm# -*- coding:utf-8*-# import sys# reload(sys)# sys.setdefaultencoding('utf8')import osimport os.pathimport timetime1 = time.time()######################...

2019-06-19 20:32:18 1147

原创 Python---将某一列设置为str类型

方法一：读取文件时设置代码如下：Data = pd.read_excel(level_path, sheet_name=0, encoding='gbk', dtype={'时间': 'str'})方法二：apply（）方法代码如下：num[0] = num[0].apply(str) # 这里num[0]:取的是第一列，在我的代码中实际意义是一列时间列，形如：2019-06-1...

2019-06-01 08:17:47 9972

原创 Pandas——时间序列的处理

时间的几个格式

2019-05-14 19:08:44 458

原创 Python基础之——字典dict

字典不常见的用法一个重要的collections模块和Counter类1.collections模块collections模块包含除了dict、set、list、tuple以外的一些特殊的容器类型，比如下面几个：（1）OrderedDict类：排序字典，是字典的子类。（2）defaultdict：使用工厂函数创建字典，使不用考虑缺失的字典键。（3）Counter类：为hashable对...

2019-05-14 19:07:25 328

原创 Python----时间模块

1.计算昨天,明天的日期from datetime import datetime,timedeltanow = datetime.now()print(now)yestoday = now - timedelta(days=1)print(yestoday)tommorow = now + timedelta(days=1) print(tommorow)next_year ...

2019-05-14 19:04:58 1097

转载 Python基础知识点-----字符串和整数，浮点型互相转换

Python基础知识点1.python 字符串和整数，浮点型互相转换（1）int(str) 函数将符合整数的规范的字符串转换成 int 型。 num1 = "278"; num2 = int(num1); print("num2: %d" % num2); ''' 输出 num2: 278 '''（2）float(str) 函数将符合...

2019-03-13 09:18:47 625