2019年06月_weixin_44778883

原创自己在机器学习中利用别人的数据修改创建的数据集

主要用于BP神经网络，曲线分类。原数据集为-0.017612 14.053064 0-1.395634 4.662541 1-0.752157 6.538620 0-1.322371 7.152853 00.423363 11.054677 00.406704 7.067335 10.667394 12.741452 0-2.460150 6.866805 10.569411 ...

2019-06-30 17:36:51 673

原创自己利用Logistic函数做一个梯度下降模型

数据来源于《机器学习算法原理与编程实践》中的“testset.txt”import numpy as npimport matplotlib.pyplot as pltdef scatter_data(data): plt.figure(figsize=(10, 9)) for i in range(data.shape[0]): if data[i, -...

2019-06-26 19:31:38 139

原创六级英语考试的一次模拟

同学刚考完六级英语，想到一个概率模型。大家争论不休，于是自己兴趣来潮，用计算机模拟证明了自己的正确性。问题描述及代码如下。问题描述：英语六级作文有三种类型，问三个人选中同一个作文题目的概率。（哎，这种问题都能纠结，就算列出来也可以知道答案，不过大家都死心的认准自己算出的答案）代码如下：（刚开始对shuffle封装了，但是算了，还是直接暴力干吧，毕竟也就那几行。） num = 0 ...

2019-06-18 09:29:28 151

原创 SVR三种不同的核预测情况对比

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.svm import SVRfrom sklearn.metrics import mean_squared_errorif __name__ == '__main__': N = 100 # 准备创建的数据个数 np.random.se...

2019-06-17 15:46:25 4269

原创利用SVM对手写字体进行识别并和随机森林对比

来自邹博机器学习课件，自己根据教学内容又做了小部分改变，但是部分问题还是不太清楚，故发表于次以供以后探讨。'''利用SVM进行手写字体识别'''import pandas as pdimport numpy as npfrom sklearn.svm import SVCfrom sklearn.metrics import accuracy_scorefrom sklearn.e...

2019-06-17 15:17:37 1032

原创 np.tile()的应用

tile就是“瓷砖”的意思，在numpy中就是将数组像瓷砖一样铺展开来。在Titanic预测实验中，将训练集x和y多复制了几份，结果在测试集上有很好的表现，猜测是因为增加训练样本，使得模型的泛化能力加强。import numpy as nptest = np.array([[1, 2], [3, 4]])# 横向复制np.tile(test, (1, 4))`# 纵向复制np.t...

2019-06-10 20:15:37 163

原创利用决策树探讨鸢尾花数据集分类问题，并可视化了数的深度和过拟合的关系

代码来自邹博老师的机器学习课程。其中对鸢尾花label转换为int，plt.pcolormesh()、决策树的可视化等方法都有一定的讲述。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import treefrom skle...

2019-06-01 14:34:23 1309

weixin_44778883的博客