R语言——机器学习
记录自学过程,和解决一些常见问题
墨竹水华
数据分析 机器学习 数据挖掘 数据可视化
展开
-
R语言实现 预测数值型数据——回归方法(线性回归、回归树、模型树)
Example: Predicting Medical ExpensesPart 1: Linear RegressionStep 1: Exploring and preparing the data ----insurance <- read.csv("F:\\rwork\\Machine Learning with R (2nd Ed.)\\Chapter 06\\insuran...原创 2020-01-16 07:59:15 · 8017 阅读 · 1 评论 -
R语言实现 独立而治之——规则分类(区分有毒蘑菇)
Example: Identifying Poisonous Mushrooms ----每年都会有很多人因为摄入有毒的野生蘑菇生病,有时甚至死亡。由于许多蘑菇在外观上彼此都非常相似,所以有时甚至经验丰富的蘑菇采集者都会中毒。与识别其他有毒的植物(比如有毒的橡树或者有毒的常春藤)不- -样,识别- -种野生蘑菇是否有毒或者是否可以食用并没有明确的规则,如(有毒的常春藤)“三片叶子,不要碰它们...原创 2020-01-15 09:31:20 · 1693 阅读 · 1 评论 -
R语言实现 分而治之——应用决策树
2007——2008年的全球金融危机凸显了透明度和严密性在银行业务中的重要性。由于信贷供应受到了限制,所以银行正日益紧缩其贷款体系,转向机器学习来更准确地识别高风险贷款。因为决策树的准确性高,以通俗易懂的方法建立统计模型的能力强,所以它广泛地应用于银行业。由于许多国家的政府机构密切监控贷款业务,所以银行的高管必须能够解释为什么一个申请者被拒绝贷款申请,而其他人获得批准。此信息对于希望判断为何自己...原创 2020-01-14 11:03:17 · 1092 阅读 · 1 评论 -
R语言实现 懒惰学习——使用近邻分类
Example: Classifying Cancer Samples ----乳腺癌数据包括569例细胞活检案例,每个案例有32个特征。一个特征是识别号码,一个特征是癌症诊断结果,其他30个特征是数值型的实验室测量结果。癌症诊断结果用编码“M”表示恶性,用编码“B”表示良性。Step 1: Exploring and preparing the data ----import the C...原创 2020-01-13 09:49:58 · 2194 阅读 · 1 评论 -
R语言实现 黑箱方法——支持向量机
Support Vector Machines -------------------Step 1: Exploring and preparing the data ----read in data and examine structure将输入读入到R中,确认接收到的数据具有16个特征,这些特征定义了每一个字母的案例。letters <- read.csv("F:\\rwork...原创 2020-01-12 17:01:16 · 686 阅读 · 0 评论 -
R语言实现 黑箱方法——神经网络
用人工神经网络对混泥土的强度strength进行建模** ----Step 1: Exploring and preparing the data ----探索与准备数据以下有8个描述混合物成分的特征read in data and examine structure读入数据concrete <- read.csv("F:\\rwork\\Machine Learning wit...原创 2020-01-11 16:08:01 · 2059 阅读 · 1 评论 -
R语言实现 朴素贝叶斯分类
用R进行朴素贝叶斯分类Example: Filtering spam SMS messages ----Step 2: Exploring and preparing the data ----read the sms data into the sms data frameexamine the structure of the sms dataconvert spam/ham to facto...原创 2020-01-10 19:35:34 · 6167 阅读 · 3 评论