![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
leaf13
这个作者很懒,什么都没留下…
展开
-
python 利用timedelta计算时间的跨度
python可以用于计算相对于某一个时间/日期的前一段时间或者后一段时间的时间格式数据。主要用到 datetime 和 timedelta 模块。from datetime import datetime, timedelta计算前一天# 前一天date_1 = datetime.now()date_2 = date_1 + timedelta(days=-1)print(da...原创 2020-04-30 09:26:45 · 1560 阅读 · 0 评论 -
pandas.DataFrame对行和列求和及添加新行和列
导入模块:from pandas import DataFrameimport pandas as pdimport numpy as np生成DataFrame数据df = DataFrame(np.random.randn(4, 5), columns=['A', 'B', 'C', 'D', 'E'])DataFrame数据预览: A B ...原创 2019-10-12 20:36:08 · 5270 阅读 · 0 评论 -
pandas ValueError: could not convert string to float: (dataframe string 转 float)(object 转 float)
问题:pandas 导入 csv文件之后,有部分列是空的,列的类型为object格式,列中单元格存的是string格式需求:把空的列(object)转化成浮点类型(float)方法:# 读取文件data = pd.read_csv("./data/data.csv", encoding='utf-8') # 前两列丢掉data = data.ix[:, 2:] # 找到列名,转化...原创 2019-10-12 20:32:19 · 3295 阅读 · 2 评论 -
自定义实现min—max 标准化_离差归一化
原创 2019-08-20 11:15:44 · 1539 阅读 · 0 评论 -
特征选择的方法
1、方差选择法2、单变量特征选择原创 2019-08-20 15:28:31 · 144 阅读 · 0 评论 -
PCA对半导体数据进行降维处理(pca封装函数)
原创 2019-08-20 16:13:38 · 870 阅读 · 0 评论 -
数据处理(numpy、pandas、matplotlib、sklearn)
一。 数组要比列表效率高很多numpy高效的处理数据,提供数组的支持,python默认没有数组。pandas、scipy、matplotlib都依赖numpy。pandas主要用于数据挖掘,探索,分析matplotlib用于作图,可视化scipy进行数值计算,如:积分,傅里叶变换,微积分statsmodels用于统计分析Gensim用于文本挖掘sklearn机器学习, keras深度...原创 2019-08-22 18:48:32 · 1089 阅读 · 0 评论