XGboost-网格调参法

一、原理 个人认为写的通俗易懂的一篇好文: https://www.jianshu.com/p/7467e616f227 二、网格调参 用xgboost既可以用来做二分类、多分类,也可以用来做回归预测数值,除了特征之外,影响模型的是如何调参了,一般是按一定的步骤、网格搜索最优参数,如下两篇...

2018-08-23 14:56:16

阅读数 1299

评论数 0

python3常用的数据清洗方法

首先载入各种包: import pandas as pd import numpy as np from collections import Counter from sklearn import preprocessing from matplotlib import pyplot as...

2018-08-16 15:58:27

阅读数 8396

评论数 0

matplotlib不能显示中文的解决方法

import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\msyh.ttc&a...

2018-08-14 17:21:31

阅读数 86

评论数 0

基于用户的协同过滤算法python实现

基于用户的CF,用的是距离计算方法是余弦相似度。 W3=Usersim(dic) Last_Rank=Recommend('A',dic,W3,2) print (Last_Rank) 输入: 一个字典、对谁进行推荐,2是指相似的若干人,这里的2就是相似的2个人 输出: 产品和用...

2018-08-13 18:23:54

阅读数 292

评论数 0

DBSCAN的python实现

两个重要的参数: 1)eps: 越大类别数越少——参数越大的话,多个簇和大部分对象会归并到同一个簇中 2)min_samples: MinPts(min_samples)的选取有一个指导性的原则,MinPts≥dim+1,其中dim表示待聚类数据的维度。MinPts设置为1是不合理的,因为...

2018-08-13 17:05:01

阅读数 1685

评论数 0

FPgrowth用python3实现挖掘频繁项集

参考的是以下的博客: https://blog.csdn.net/Gamer_gyt/article/details/51113753 输入: simpDat = [['r', 'z', 'h', 'j', 'p'], ['z', 'y', 'x',...

2018-08-13 14:51:56

阅读数 1450

评论数 0

Anaconda3安装pyecharts并作图

https://download.csdn.net/download/skj1995/10561358 将其复制到安装Anaconda3的目录下,比如我的Anaconda3的安装目录为C:\Users\Administrator\Anaconda3,我就将下载下来的这个文件放在目录C:\User...

2018-08-09 16:36:56

阅读数 1801

评论数 0

Apriori的python3版本实现

参考以下一片写的很详细的文章: https://blog.csdn.net/sinat_17196995/article/details/71124284 其中把旧代码在python3中报错的都改过来了!良心~~ 以下的链接是图解整个过程,个人觉得清晰明了: https://www.cnb...

2018-08-09 12:10:37

阅读数 2884

评论数 0

如何在jupyter中调用同一文件夹下另一个ipynb文件中的函数

1、 新建一个.py文件 Ipynb_importer.py https://blog.csdn.net/wangjian1204/article/details/67633614 这个内容在jupyter中输入后,在打开的文件中file->dow...

2018-08-08 16:06:05

阅读数 4285

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭