自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JR_lu的博客

machine learning 初学者

  • 博客(10)
  • 问答 (1)
  • 收藏
  • 关注

转载 机器学习(十)使用sklearn库对时间特征进行处理

转自寒老师的七月算法ML课程,加了一点自己理解# -*- coding: utf-8 -*-"""Created on Mon Oct 31 20:27:11 2016@author: Sirius特征工程之时间型特征处理"""import pandas as pddata=pd.read_csv('kaggle_bike_competition_train.csv',

2016-10-31 22:10:55 15426

原创 机器学习(九)使用sklearn库进行数据分析_——文本特征处理

# -*- coding: utf-8 -*-"""Created on Wed Oct 26 21:35:31 2016@author: siriustest word2word"""from sklearn.feature_extraction.text import CountVectorizerimport numpy as npvectorizer=CountVectoriz

2016-10-27 17:00:00 1242

原创 机器学习(八)使用sklearn库进行数据分析_——特征处理之过滤、包裹、嵌入型

# -*- coding: utf-8 -*-"""Created on Thu Oct 27 10:53:56 2016@author: siriusfeature chioce""""""---------------------特征处理之--过滤型-----------------------------------评估单个特征和结果值之间的相关程度,排序留下TOP相关的特征部分"

2016-10-27 16:57:03 1488

原创 机器学习(七)使用pandas库进行数据分析_——统计信息和离散化

在特征工程中,对于数值型数据(比如年龄为25岁、31岁。。,商店某个时间段的销量为20W件等等),通常要对这些数值型数据进行统计分析,比如求取它们的最大最小值、期望方差等,pandas库在数据分析中非常好用。 对 数值型数据进行离散化,也用到pandas的cut函数,具体操作如下代码:# -*- coding: utf-8 -*-"""Created on Wed Oct 2

2016-10-26 16:30:57 2576

原创 机器学习(六)使用sklearn库的model存储

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 21:39:04 2016@author: Administratormodel说明,normalization"""from sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sk

2016-10-26 10:43:14 2834

原创 机器学习(五)使用sklearn库的cross validation

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom

2016-10-26 10:06:05 1395

原创 机器学习(四)使用sklearn库的练习normalization和model的一些参数

“`-- coding: utf-8 --“”” Created on Tue Oct 25 21:39:04 2016@author: Administrator model说明,normalization “”” import numpy as np from sklearn import datasets from sklearn.cross_validation import t

2016-10-25 22:09:03 1421

原创 机器学习(三)使用sklearn库的datasets练习LinearRegression

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:42:24 2016@author:SiriusLinearRegression"""from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionfrom sklearn.cross_valid

2016-10-25 21:00:50 1162

原创 机器学习(二)使用sklearn库的datasets练习KNN分类

# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom

2016-10-25 20:38:16 1320

原创 机器学习(一)概率论基础

**1. 期望** 定义: 期望有两种形式,离散型: 和连续型: 期望的意思就是概率加权下的“平均值”。性质: 补充一点: 随机事件是随机变量取某一特定值时的情况,有两个重要性质: 独立性: 互斥性: 2.方差定义: n个样本的分布规律偏离于平均值的程度 性质: 3.协方差定义: 性质: 协方差矩阵: ——–怎样评价多个特征属性之间的相关关系呢?

2016-10-24 11:11:51 855 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除