2020年12月_Lin叮当

原创 Python学习DAY10

1.基本文件的写入：创建文件对象，写入数据，关闭文件2.用writelines()输入时想要换行需要自行添加换行符3.finally异常机制确保文件一定会被关闭try: f = open(r"a.txt","a") s=" i love python" f.write(s)except BaseException as e: print (e)finally: f.close()4.with可以自动关闭现场，用的最多with open(r"b.tx

2020-12-30 09:56:19 130 1

原创机器学习基础DAY8

第八章线性回归先从定义说起：误差大小：######sklearn线性回归正规方程、梯度下降API:sklearn.linear_model.LinearRegression正规方程普通最小二乘线性回归coef_：回归系数sklearn.linear_model.SGDRegressor梯度下降通过使用SGD最小化线性模型coef_：回归系数回归性能评估:MSE两种方法的比较：特点：线性回归器是最为简单、易用的回归模型。从某种程度上限制了使用，尽管如此，在不知道特征之间关

2020-12-18 15:31:29 80

原创机器学习基础DAY7

第七章决策树决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-then结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法1.信息增益：特征A对训练数据集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定条件下D的信息条件熵H(D|A)之差，即公式为：注：信息增益表示得知特征X的信息而使得类Y的信息的不确定性减少的程度信息熵的计算：条件熵的计算：######常见决策树使用的算法：####ID3信息增益最大的准则####C4.5信息增益比最大

2020-12-18 15:30:50 134

原创 Python学习DAY9

1.异常：python中一切都是对象,异常也釆用对象的方式来处理。处理过程：1抛出异常:在执行一个方法时,如果发生异常,则这个方法生成代表该异常的一个对象,停止当前执行路径,并把异常对象提交给解释器。2.捕获异常:解释器得到该异常后,寻找相应的代码来处理该异常。...

2020-12-18 12:45:54 146

原创 Python学习DAY8

1.class Person: def work(self): print("努力上班！") def work(self): print("努力上班，我就不")#定义同名方法，只有最后一个有效def play_game(s): print("{0}在玩游戏".format(s))def work2(s): print("好好工作赚钱")Person.play=play_game#一切都是对象，函数也是对象，可以为类添加

2020-12-17 09:48:42 127 1

原创机器学习基础DAY6

第六章朴素贝叶斯算法

2020-12-10 09:52:50 131

原创 Python实验之——集合与字典

刚开始我没仔细看，写的有点着急，后来发现这章只要把实验PPT给的例子看懂就差不多了。。。随机产生 2 组各个数字的列表，每组 10 个数字，如下要求：每个数字取值范围 [10,20]，统计 20 个数字中，一共有多少个不同的数字？2 组中，不重复的数字有几个？分别是什么？2 组中，重复的数字有几个？分别是什么？import randomx=[random.randint(10,20) for i in range(10)]y=[random.randint(10,20) for i in ran

2020-12-07 14:46:25 1710

原创机器学习基础DAY5

第五章，K近邻算法定义：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。来源：KNN算法最早是由Cover和Hart提出的一种分类算法。两个样本的距离可以通过如下公式计算，又叫欧式距离。比如说，a(a1,a2,a3),b(b1,b2,b3)，那么它们之间的欧氏距离就用下图方法计算：######K近邻算法API：sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorith

2020-12-05 14:05:57 114

原创机器学习基础DAY4

第四章机器学习概述机器学习一般的数据集会划分为两个部分：训练数据：用于训练，构建模型测试数据：在模型检验时使用，用于评估模型是否有效训练集与测试集占比一般是（0.8,0.2）,(0.7,0.3),(0.75,0.25)，其中最后一种用的最多...

2020-12-04 07:21:14 178

原创机器学习基础DAY3

第三章数据降维方式：1.特征选择 2.主成分分析1.特征选择（1）原因：冗余：部分特征的相关度高，容易消耗计算性能噪声：部分特征对预测结果有负影响（2）定义：特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征，特征在选择前和选择后可以改变值、也不改变值，但是选择后的特征维数肯定比选择前小，毕竟我们只选择了其中的一部分特征。（3）主要方法（三大武器）：1,Filter(过滤式):VarianceThreshold######API:sklearn.feature_sel

2020-12-03 14:42:15 84

gtt683559的博客