- 博客(6)
- 资源 (20)
- 收藏
- 关注
原创 优化:一种将grid-search速度提升10倍的方法
Python 2.7 IDE Pychrm 5.0.3 sci-kit learn 0.18.1前言 抖了个机灵,不要来打我,这是没有理论依据证明的,只是模型测试出来的确有效,并且等待时间下降(约)为原来的十分之一!!刺不刺激,哈哈哈。原理 基本思想:先找重点在细分,再细分,伸缩Flexible你怕不怕。以下简称这种方法为FCV不知道CV的请看@MrLevo520–总结:Bias(偏
2016-11-25 15:17:50 7537 4
原创 总结:Bootstrap(自助法),Bagging,Boosting(提升)
前言 最近在理清一些很必要的也很基础的东西,记录一下,结合网上和文献,自己也有些易化使之更轻松理解,如有错误,请不吝赐教,多谢!Bootstrap(自助法) Bootstrap是一种抽样方法核心思想子样本之于样本,可以类比样本之于总体栗子:我要统计鱼塘里面的鱼的条数,怎么统计呢?假设鱼塘总共有鱼1000条,我是开了上帝视角的,但是你是不知道里面有多少。步骤:1. 承包鱼塘,不让别人捞鱼(
2016-11-17 17:10:30 11931 1
原创 解决:xpath取出指定多标签内所有文字text
Python 2.7 Pycharm 5.0.3问题 再写一个markdown自动引用的小脚本的时候新出现的问题,也就是利用xpath取出字符串的问题,记录一下取出如下字符串我要取出mrlevo520的内容,怎么取呢,很多方法,bs4也可以,正则也可以,动态selenium也可以,这次我想尝试用xpath来做,一则是为了和selenium接轨,xpath的确很强大,二来是firefox提供f
2016-11-14 14:39:27 44230 9
原创 解决:win10_x64 xgboost python安装所遇到问题
Python 2.6.7/3.6.4 Window10 X64 Git 2.10前言 到处找啊找啊找啊找好用的分类器,抓到xgboost,听说表现比GBDT好,那我还玩什么GBDT。。。搞起实测可用安装教程Python2 + Win10windows 新版xgboost Python包安装教程 win10 64 亲测是可以完成安装的请大家可以看看,但是排版有点难受是不是,恩,我也觉的,哈
2016-11-12 16:56:13 6720 1
原创 总结:Bias(偏差),Error(误差),Variance(方差)及CV(交叉验证)
Error = Bias + Variance+Noise 什么是Bias(偏差) Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力什么是Variance(方差) Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。列表内容什么是Noise Error
2016-11-11 18:45:54 12576 3
原创 混淆矩阵可视化接口(子函数)
Pyhon 2.7 IDE Pycharm 5.0.3 numpy 1.11.0目前接口库@MrLevo520–数据转化接口仍在不断更新目的 将混淆矩阵可视化展现出来准备工作 亲先安装numpy,matplotlib接口代码新建一个confusion_matrix_png.py文件,输入如下代码# -*- coding: utf-8 -*-import numpy as npim
2016-11-02 10:57:39 3803 2
基于python豆瓣自定义电影抓取2.0
2016-10-01
knn算法实例Python版本
2016-09-08
Python+MySQL用户加密存储验证系统
2016-08-04
基于python豆瓣自定义电影抓取GUI版本
2016-07-22
参考文献生成器1.0
2016-07-21
基于python豆瓣自定义电影抓取
2016-07-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人