算法
妄念驱动
这个作者很懒,什么都没留下…
展开
-
决策树demo(python)
%matplotlib inlineimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.datasets.california_housing import fetch_california_housinghousing = fetch_california_housing()print(housing.DESCR)h原创 2017-09-13 12:23:29 · 1136 阅读 · 0 评论 -
梯度下降求解逻辑回归(Python)
Logistic RegressionThe data我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,我们将建立一个分类模型,根据考试成绩估计入学概率。import numpy as原创 2017-09-12 21:41:11 · 5602 阅读 · 3 评论 -
KNN算法demo(R)
KNN算法###### knn 算法 ################## KNN 在R中使用到的包有“class包”,“gmodels包”“FNN”“rKnn”########## 以iris为例 ##############library(class)#####划分数据及,训练集,70%随机抽样######index=sample(1:nrow(iris),0.7*nrow(iris))原创 2017-09-01 10:36:26 · 579 阅读 · 0 评论 -
决策树实现(R)
###### decision tree ##########install.packages('rpart.plot')install.packages('rattle')install.packages('RColorBrewer')library(rpart)library(rattle)library(rpart.plot)library(RColorBrewer)######原创 2017-09-01 10:41:37 · 683 阅读 · 0 评论 -
聚类(R)
####聚类######随机产生三个簇点c1<-cbind(rnorm(100,2,1),rnorm(100,2,2))c2<-cbind(rnorm(80,3,1),rnorm(80,20,1))c3<-cbind(rnorm(60,15,1),rnorm(60,25,1))v=rbind(c1,c2,c3)vplot(v)cl=kmeans(v,3)clcl$itercl$原创 2017-09-01 10:53:28 · 376 阅读 · 0 评论 -
随机森林(R)
#### random forest ############install.packages('randomForest')library(randomForest) data(iris) attach(iris)table(iris$Species)class=as.factor(iris$Species)######描述 ############biplot(princom原创 2017-09-01 10:57:02 · 578 阅读 · 0 评论 -
招聘数据分析<一>
描述性分析部分:rm(list = ls()) ## 清空工作目录############# 设置工作路径****## 使用setwd函数,设置自己的工作路径***## setwd(.....)## package: readxl 用于读取Excel文件## package: ggplot2 用于绘制各类图表## package: jiebaR 用于分词library(readxl)原创 2017-09-01 14:07:09 · 765 阅读 · 0 评论 -
招聘数据分析<二>
回归分析:############# 设置工作路径****## 请使用setwd函数,设置自己的工作路径,并将上述所提到的文件放到该工作路径下***## setwd(.....)## package: ggplot2 用于绘制各类图表library(ggplot2)load("temp.rda") ## 调用描述性统计“descriptive statsics.R”的中间运行结果## 图片颜原创 2017-09-01 14:30:05 · 613 阅读 · 0 评论 -
招聘数据分析<三>
词云分析:############# 设置工作路径****## 请使用setwd函数,设置自己的工作路径,并将上述所提到的文件放到该工作路径下***## setwd(.....)## package: readxl 用于读取Excel文件## package: ggplot2 用于绘制各类图表## package: jiebaR 用于分词## package: wordcloud2 用于原创 2017-09-01 14:35:44 · 697 阅读 · 0 评论 -
Python-基于用户的协同过滤算法
数据来源:https://grouplens.org/datasets/movielens/#--------------------------------------------------------# Purpose: 基于已知的训练集,"测试集"中的user的item进行评分预测,并进行用户没有接触过的物品进行推荐.#---------------------------------原创 2017-09-09 19:18:39 · 2997 阅读 · 7 评论 -
Python-基于物品的协同过滤算法(附两种算法的对比)
与上一篇UserCF数据来源一致。先贴代码ItemCF:#coding=utf-8import mathclass ItemCF: def __init__(self,basefile,testfile): self.datafile = basefile self.testfile = testfile self.readData()原创 2017-09-10 19:32:59 · 3025 阅读 · 0 评论 -
贝叶斯新闻分类demo(Python)
#pip install jiebaimport pandas as pdimport jieba数据源:http://www.sogou.com/labs/resource/ca.php df_news = pd.read_table('./data/val.txt',names=['category','theme','URL','content'],encoding='utf-8')df原创 2017-09-13 22:02:23 · 7449 阅读 · 3 评论 -
贝叶斯拼写检查器(python)
import re, collectionsdef words(text): return re.findall('[a-z]+', text.lower()) def train(features): model = collections.defaultdict(lambda: 1) for f in features: model[f] += 1 ret原创 2017-09-13 15:10:55 · 1118 阅读 · 0 评论 -
XGBoost调参demo(Python)
XGBoost我们用的是保险公司的一份数据# 各种库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import RandomForestClassifier原创 2017-09-22 16:32:19 · 4838 阅读 · 1 评论