![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
scikit-learn
duanlianvip
这个作者很懒,什么都没留下…
展开
-
【sklearn】线性回归 - 预测波士顿房价
目的本文使用Python的sklearn类库,基于对机器学习线性回归算法的理论学习,利用sklearn中集成的波士顿房价数据,以此来对线性回归的理论知识进行一次实践总结。本文不以预测的准确率为目的,只是简单的对机器学习的线性回归等理论知识进行一次实践总结,以此来体验下sklearn类库的使用方法。美国波士顿房价的数据集是sklearn里面默认的数据集,sklearn内置的数据集都位于d...原创 2019-09-14 14:50:37 · 13259 阅读 · 1 评论 -
【sklearn】随机森林 - 预测用户是否离网
目的本文使用Python的sklearn类库,基于对随机森林算法的理论学习,利用工程中的数据,以此来对随机森林的理论知识进行一次实践总结。利用过往1年的数据训练专家系统,目的是判断用户3个月内是否会离网。训练集主要来自工程中的数据集,一共100万条样本数据,16个维度。实现导入依赖类库:#!-*- coding:utf-8 -*-import pandas as pd...原创 2019-09-15 18:23:41 · 1036 阅读 · 0 评论 -
【sklearn】SVM(支持向量机) - 预测在网具有单卡转合约倾向的客户
训练数据本实验的特征维度取自实际工程,但具体数据纯属模拟,只是想以此对SVM理论进行一次实践。数据集-数据字典 序号 名称 说明 类型 备注 1 user_id 用户标识 int 2 service_kind 业务类型 string 2G、3G、4G 3 call_duration 主叫时...原创 2019-09-16 23:37:48 · 619 阅读 · 0 评论 -
【sklearn】K-Means聚类与PCA降维实践 - 用户信用分群和分析
目的本实验使用电信用户的通信行为数据集,进行用户信用分群和分析。由于是没有标注的训练样本,使用降维和聚类等无监督方法将用户进行分群,然后对不同群体数据进行人工分析,确定群体的信用行为特点。数据本实验中数据集来自开源的电信用户的通信行为数据集,共30000条数据,7个字段:入网时间、套餐价格、每月流量、每月话费、每月通话时长、欠费金额、欠费月份数。实现代码import pand...原创 2019-09-18 18:14:53 · 6320 阅读 · 31 评论 -
【sklearn】GBDT(Gradient Boosting Decision Tree) - 预测在网具有单卡转合约倾向的客户
本文主要完成如下内容简单介绍GBDT; 介绍sklearn中GBDT算法(GradientBoostingClassifier)的参数; 介绍使用pandas模块分析训练数据的方法; 介绍使用网格搜索对GBDT调参的方法技巧;GBDT介绍GBDT全称梯度下降树,可以用于分类(做二分类效果还可以,做多分类效果不好)、回归(适合做回归)问题,也可以筛选特征。本次使用GBDT解决分类、特...原创 2019-10-09 16:39:56 · 3409 阅读 · 2 评论