- 博客(10)
- 问答 (1)
- 收藏
- 关注
转载 机器学习(十)使用sklearn库对时间特征进行处理
转自寒老师的七月算法ML课程,加了一点自己理解# -*- coding: utf-8 -*-"""Created on Mon Oct 31 20:27:11 2016@author: Sirius特征工程之时间型特征处理"""import pandas as pddata=pd.read_csv('kaggle_bike_competition_train.csv',
2016-10-31 22:10:55 15426
原创 机器学习(九)使用sklearn库进行数据分析_——文本特征处理
# -*- coding: utf-8 -*-"""Created on Wed Oct 26 21:35:31 2016@author: siriustest word2word"""from sklearn.feature_extraction.text import CountVectorizerimport numpy as npvectorizer=CountVectoriz
2016-10-27 17:00:00 1242
原创 机器学习(八)使用sklearn库进行数据分析_——特征处理之过滤、包裹、嵌入型
# -*- coding: utf-8 -*-"""Created on Thu Oct 27 10:53:56 2016@author: siriusfeature chioce""""""---------------------特征处理之--过滤型-----------------------------------评估单个特征和结果值之间的相关程度,排序留下TOP相关的特征部分"
2016-10-27 16:57:03 1488
原创 机器学习(七)使用pandas库进行数据分析_——统计信息和离散化
在特征工程中,对于数值型数据(比如年龄为25岁、31岁。。,商店某个时间段的销量为20W件等等),通常要对这些数值型数据进行统计分析,比如求取它们的最大最小值、期望方差等,pandas库在数据分析中非常好用。 对 数值型数据进行离散化,也用到pandas的cut函数,具体操作如下代码:# -*- coding: utf-8 -*-"""Created on Wed Oct 2
2016-10-26 16:30:57 2576
原创 机器学习(六)使用sklearn库的model存储
# -*- coding: utf-8 -*-"""Created on Tue Oct 25 21:39:04 2016@author: Administratormodel说明,normalization"""from sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sk
2016-10-26 10:43:14 2834
原创 机器学习(五)使用sklearn库的cross validation
# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom
2016-10-26 10:06:05 1395
原创 机器学习(四)使用sklearn库的练习normalization和model的一些参数
“`-- coding: utf-8 --“”” Created on Tue Oct 25 21:39:04 2016@author: Administrator model说明,normalization “”” import numpy as np from sklearn import datasets from sklearn.cross_validation import t
2016-10-25 22:09:03 1421
原创 机器学习(三)使用sklearn库的datasets练习LinearRegression
# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:42:24 2016@author:SiriusLinearRegression"""from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionfrom sklearn.cross_valid
2016-10-25 21:00:50 1162
原创 机器学习(二)使用sklearn库的datasets练习KNN分类
# -*- coding: utf-8 -*-"""Created on Tue Oct 25 20:10:51 2016@author: SIriustest sklearn"""import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom
2016-10-25 20:38:16 1320
原创 机器学习(一)概率论基础
**1. 期望** 定义: 期望有两种形式,离散型: 和连续型: 期望的意思就是概率加权下的“平均值”。性质: 补充一点: 随机事件是随机变量取某一特定值时的情况,有两个重要性质: 独立性: 互斥性: 2.方差定义: n个样本的分布规律偏离于平均值的程度 性质: 3.协方差定义: 性质: 协方差矩阵: ——–怎样评价多个特征属性之间的相关关系呢?
2016-10-24 11:11:51 855 1
空空如也
C++调用python脚本(test.py这个脚本中import numpy)程序崩溃
2017-01-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人