- 博客(7)
- 收藏
- 关注
原创 自己在机器学习中利用别人的数据修改创建的数据集
主要用于BP神经网络,曲线分类。原数据集为-0.017612 14.053064 0-1.395634 4.662541 1-0.752157 6.538620 0-1.322371 7.152853 00.423363 11.054677 00.406704 7.067335 10.667394 12.741452 0-2.460150 6.866805 10.569411 ...
2019-06-30 17:36:51 673
原创 自己利用Logistic函数做一个梯度下降模型
数据来源于《机器学习算法原理与编程实践》中的“testset.txt”import numpy as npimport matplotlib.pyplot as pltdef scatter_data(data): plt.figure(figsize=(10, 9)) for i in range(data.shape[0]): if data[i, -...
2019-06-26 19:31:38 139
原创 六级英语考试的一次模拟
同学刚考完六级英语,想到一个概率模型。大家争论不休,于是自己兴趣来潮,用计算机模拟证明了自己的正确性。问题描述及代码如下。问题描述:英语六级作文有三种类型,问三个人选中同一个作文题目的概率。(哎,这种问题都能纠结,就算列出来也可以知道答案,不过大家都死心的认准自己算出的答案)代码如下:(刚开始对shuffle封装了,但是算了,还是直接暴力干吧,毕竟也就那几行。) num = 0 ...
2019-06-18 09:29:28 151
原创 SVR三种不同的核预测情况对比
import numpy as npimport matplotlib.pyplot as pltfrom sklearn.svm import SVRfrom sklearn.metrics import mean_squared_errorif __name__ == '__main__': N = 100 # 准备创建的数据个数 np.random.se...
2019-06-17 15:46:25 4269
原创 利用SVM对手写字体进行识别并和随机森林对比
来自邹博机器学习课件,自己根据教学内容又做了小部分改变,但是部分问题还是不太清楚,故发表于次以供以后探讨。'''利用SVM进行手写字体识别'''import pandas as pdimport numpy as npfrom sklearn.svm import SVCfrom sklearn.metrics import accuracy_scorefrom sklearn.e...
2019-06-17 15:17:37 1032
原创 np.tile()的应用
tile就是“瓷砖”的意思,在numpy中就是将数组像瓷砖一样铺展开来。在Titanic预测实验中,将训练集x和y多复制了几份,结果在测试集上有很好的表现,猜测是因为增加训练样本,使得模型的泛化能力加强。import numpy as nptest = np.array([[1, 2], [3, 4]])# 横向复制np.tile(test, (1, 4))`# 纵向复制np.t...
2019-06-10 20:15:37 163
原创 利用决策树探讨鸢尾花数据集分类问题,并可视化了数的深度和过拟合的关系
代码来自邹博老师的机器学习课程。其中对鸢尾花label转换为int,plt.pcolormesh()、决策树的可视化等方法都有一定的讲述。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import treefrom skle...
2019-06-01 14:34:23 1309
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人