自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习笔记04梯度提升树(GBDT)调参

# -*- coding: utf-8 -*-'''数据: train_modified''''''scikit-learn 梯度提升树(GBDT)算法类库GBDT分类类: GradientBoostingClassifier; GBDT回归类: GradientBoostingRegressorGBDT类库boosting框架参数(1)n_estimators(最大的弱学习...

2019-06-11 01:21:24 915

原创 机器学习笔记03随机森林调参

# -*- coding: utf-8 -*-import osimport pandas as pdimport numpy as np# 读取数据os.chdir(r'F:\python_data_mining\train_modified')data = pd.read_csv('train_modified.csv')data = data.drop(['ID'], ax...

2019-06-11 01:19:55 322

原创 机器学习笔记02线性回归

# -*- coding: utf-8 -*-'''Folds5x2_pp.csv共有9568个样本数据,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。对应PE是样本输出,而AT/V/AP/RH这4个是样本特征, 机器学习的目的就是得到一个线性回归模型''''''不同方法建立线性回归模型一.传统的统计学statsmodels...

2019-06-06 02:24:07 931 1

原创 机器学习笔记01特征工程

一.特征选择的方法1.过滤法选择特征1.1 方差筛选模型训练时,选择方差大的特征,舍弃方差小的特征。skleran.VaricandeThreshold通过指定方差的阈值,筛掉方差小于阈值的特征。1.2 相关系数分别计算训练集中各特征与输出值(输出连续值)的相关系数,通过设定阈值,选取相关系数较大的部分特征。1.3 假设检验a.卡方检验 b.F检验 c.t检验2. 嵌入法选择特征...

2019-06-05 11:17:49 205

原创 数据分析: 线性回归分析之研究二手房价的影响因素,建立房价预测模型

二手房价数据变量说明:dist-所在区roomnum-室的数量halls-厅的数量AREA-房屋面积floor-楼层subway-是否临近地铁school-是否学区房price-平米单价导入相关模块import pandas as pdimport osimport statsmodels.api as smfrom statsmodeld.forlula.api imp...

2019-05-28 00:25:45 4584 2

原创 Pandas描述性分析分类变量及连续变量,Matplotlib简易制图

一 单分类变量描述频数,例如:value_counts()描述分类变量 柱形图二 单连续变量描述统计量(均值,中位数,四分位数,总和等),例如:聚合函数agg()描述价格变量 直方图三 分类变量与分类变量描述频数,例如:交叉表crosstab()描述各地区与是否学区房 交叉表——堆叠柱状图四 单分类变量与单连续变量描述连续变量统计值,例如,分组groupby()描述各地区的房价分布五 双分...

2019-05-10 01:39:14 2513

原创 pd.DataFrame数据分析实际操作

import pandas as pdimport numpy as npimport osdata_series = {'chinese': [55, 66, 72, 90, 85, 85], 'english': [66, 85,85, 87, 80, 80], 'math': [None, 95, 91, 75, 86, 86]}index_series = ['李晓明', '王二...

2019-04-28 18:14:57 2053

原创 Pandas的创建及选择数据操作

Pandas的创建以及数据选择操作,通过例子进行学习#1.通过pd.Series()列表创建pandas.core.series.Seriess1 = pd.Series(['3','6','10','21'],index=['A','B','C','D'])s1A 3B 6C 10D 21dtype: object#2.通过pd.Series()及...

2019-04-19 17:58:19 209

原创 Numpy的切片操作

##关于numpy的索引和切片以及pandas的选择数据操作,通过例子学习几种不同的方式#创建numpy数组import numpy as npimport pandas as pd#1.通过列表创建数组arr_1 = np.array([1,2,5,6,9])arr_1array([1, 2, 5, 6, 9])...

2019-04-19 17:05:13 1133

原创 初尝爬取58同城车辆信息

想获取下一页面的url 不知如何入手,用了一个for语句对页码进行替换,不知有什么更好的办法

2019-04-15 01:47:25 749

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除