- 博客(5)
- 收藏
- 关注
原创 利用机器学习解决问题的一般流程之0-4数据导入和数据分析
1、定义问题,获取数据 2、导入数据 3、分析数据(以pandas DataFrame类型数据为例) 1、打印数据,简单查看 print(data.head()) 2、数据维度 3、数据属性和类型: 4、描述性统计:通过DataFrame 的describe()方法来查看描述性统计的内容。这个方法给我们展示了八方面的信息:数据记录数、平均值、标准方差、最小值、下四分位数、中位数、上四分位数、最大...
2019-11-19 21:43:13 437
原创 pandas数组中:将文本、float、int类型的日期数据转换为pandas日期数据
In [51]: pd.to_datetime('2010/11/12', format='%Y/%m/%d') Out[51]: Timestamp('2010-11-12 00:00:00') In [52]: pd.to_datetime('12-11-2010 00:00', format='%d-%m-%Y %H:%M') Out[52]: Timestamp('2010-11-12 ...
2019-11-18 15:06:36 2295
原创 将pandas Timestamp数据转换成unix纪元,并将Index类型转化为numpy数组类型的方法
把时间戳转换为纪元 反转上述操作,把Timestamp转换为unix纪元: In [64]: stamps = pd.date_range('2012-10-08 18:15:05', periods=4, freq='D') In [65]: stamps Out[65]: DatetimeIndex(['2012-10-08 18:15:05', '2012-10-09 18...
2019-11-11 11:40:25 244
原创 为什么每个箱子的斜率都是相同的?
import numpy as np import matplotlib.pyplot as plt import mglearn from sklearn.preprocessing import OneHotEncoder from sklearn.linear_model import LinearRegression from sklearn.tree import DecisionTre...
2019-11-10 11:33:04 161
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人