![](https://img-blog.csdnimg.cn/20201227140043875.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
⑉་ 机器学习及实践(书) ་⑉
文章平均质量分 52
友利奈绪赛高
萌新待开发
该还的还是要还的,记住学无止尽,闲是不可能闲下来的。
展开
-
PRML 第三章
3 回归的线性模型1.之前说的是无监督学习:密度估计+聚类。这里讨论监督学习:回归。2.回归就是维变量对应目标变量的问题。第一章由多项式曲线拟合。最简单就是线性回归。但如果将输入变量进行非线性函数变化后进行线性组合,可以得到基函数。3.过程就是有个观测量和对应目标变量的训练数据集。目标有新的x预测新的t。就构建函数 y(x) 来预测输出。从概率角度看就是对每个x的目标t值的不确定性进行建模。最小化一个合适的损失函数,比如1.5.5节中的平方损失函数。4.虽然线性模型有局限性,但对于高维输入问原创 2021-04-27 18:24:07 · 957 阅读 · 2 评论 -
PRML第二章
2 概率分布本章学习各种特殊的概率分布。讨论的概率分布的一个作用:在有限观测下,对 p(x) 进行建模-----密度估计(假设每次取样都是独立同分布的)。我们用离散随机变量的二项分布和多项式分布,连续随机变量的高斯分布的参数估计。引入两种观点:频率派计算似然函数之类的确定参数。 贝叶斯派引入参数的先验,来计算后验。还有个重要的概念:共轭先验:后验概率和先验概率分布的函数形式相同。也会介绍非参数密度估计的方法。2.1 二元变量1.一个二元随机变量,即x只能取0或1。取...原创 2021-04-13 22:06:15 · 1452 阅读 · 2 评论 -
Pattern Recognition And Machine Learning 第一章
1 绪论1.训练数据的样本包含输⼊向量以及对应的⽬标向量的应⽤叫做有监督学习(supervised learning)问题。3.在其他的模式识别问题中,训练数据由⼀组输⼊向量x组成,没有任何对应的⽬标值叫做⽆监督学习(unsupervised learning)问题。4.给每个输⼊向量分配到有限数量离散标签中的⼀个,被称为分类(classification)问题。如果要求的输出由⼀个或者多个连续 变量组成,那么这个任务被称为回归(regression)。5.是发现数据中相似样本的 分组,这被原创 2021-03-25 22:19:28 · 1321 阅读 · 0 评论 -
Random Forest(七)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Improting the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.原创 2021-03-22 21:06:25 · 145 阅读 · 0 评论 -
Decision Tree Classification(六)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Importing the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.原创 2021-03-22 20:31:55 · 213 阅读 · 0 评论 -
Support Vector Machine(五)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Importing the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.原创 2021-03-22 19:48:26 · 147 阅读 · 0 评论 -
Implementing Logistic Regression(四)
#Step1 Dara Pre-Processing#importing the Librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as sns#import the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].values #get the.原创 2021-03-22 17:39:47 · 128 阅读 · 1 评论 -
Multiple Linear Regression(三)
#Step1 Data Preprocessing#importing the librariesimport pandas as pdimport numpy as np#importing the datasetdataset = pd.read_csv("50_Startups.csv")X = dataset.iloc[:,:-1].valuesy = dataset.iloc[ : , 4 ].values#Encoding Categorical datafrom sk.原创 2021-03-21 17:48:18 · 252 阅读 · 0 评论 -
Simple Linear Regression(二)
#Data Preprocessingimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltdataset =pd.read_csv("studentscores.csv")X = dataset.iloc[ : , :1].valuesy = dataset.iloc[ : ,1].valuesfrom sklearn.model_selection import train_test_splitX_t.原创 2021-03-21 17:19:58 · 151 阅读 · 0 评论 -
Data PreProcessing(一)
#Importing the librariesimport numpy as npimport pandas as pd#import the datasetdataset = pd.read_csv("Data.csv")X = dataset.iloc[ : , :-1].valuesy = dataset.iloc[ : ,3].values#handling the missing datafrom sklearn.impute import SimpleImputerim.原创 2021-03-21 16:51:47 · 337 阅读 · 0 评论 -
实战篇
Titanic罹难乘客预测import pandas as pdfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.ensemble import RandomForestClassifierfrom xgboost import XGBClassifierfrom sklearn.model_selection import cross_val_scorefrom sklearn.model_selection原创 2021-02-27 22:46:00 · 272 阅读 · 1 评论 -
进阶篇
模型实用技巧特征提升特征抽取DicVectorizer对使用字典存储的数据进行特征抽取与向量化#定义一组字典列表,用来表示多个数据样本(每个字典代表一个数据样本)measurements = [{'city':'Dubai','temperature':33.},{'city':'London','temperature':12.},{'city':'San Fransisco','temperature':18.}]#从 sklearn.feature_extravtion原创 2021-02-18 23:06:50 · 309 阅读 · 0 评论 -
基础篇
监督学习经典模型分类学习良/恶行乳腺癌肿瘤数据处理import pandas as pdimport numpy as npimport osfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import LogisticRegressionfrom sklearn.line原创 2021-02-10 00:57:59 · 402 阅读 · 1 评论