Machine Learning
Dynamicw
菜鸟起飞
展开
-
sklearn.model_selection中train_test_split的坑
坑无论是做机器学习还是深度学习,有个叫做数据集的东西不可忽视,有时候数据集的好坏会影响最后学习的效果。特别是没有现成处理好的数据集时需要我们自己动手搜集整理得到训练和测试的数据集。我在处理数据集的时候喜欢把数据放在一个列表,label放在一个一个列表,然后利用sklearn.model_selection中的train_test_split函数来分割得到训练集和数据集。该函数的具体返回值和用法如下:train_x,test_x,train_y,test_y = train_test_split(dat原创 2020-08-14 17:30:10 · 888 阅读 · 0 评论 -
主成分分析(PCA)原理及过程
首先,感谢一下这篇文章的作者:主成分分析原理及过程PCA原理及过程在机器学习中,对于数据维度过多问题,提出了一种降维算法叫做PCA算法。具体的降维:例如评估一个国家的GDP水平,需要考量到人口、收入、人均工资等等成千上万个因素。这每一个因素,我们叫做一个feature。如果feature过多,对于我们编写机器学习算法会有很大影响。而feature过多就是我们所说的维度灾难,为了解决这一问题,就提出了众多的降维算法,而今天所说的PCA只是其中一种。降维就是将原本过多的feature,映射到数量更少的fea原创 2020-07-17 11:24:04 · 2188 阅读 · 0 评论 -
感知机实现
感知机算法原理感知机学习算法的原始形式:输入:T=(x1,y1),...,(xn,yn)T={(x_1,y_1),...,(x_n,y_n)}T=(x1,y1),...,(xn,yn)其中,xix_ixi属于RnR^nRn,yiy_iyi属于{-1,1},i = 1,2,3,…,N;学习率a(0<a<=1)输出:w,b;模型为f(x)=sign(w∗x+b)f(x)...原创 2019-12-04 21:23:01 · 261 阅读 · 0 评论 -
多项式使用最小二乘法拟合数据
最小二乘法将所有的点利用初始得到的多项式的值和实际值的差的平方做和,这就是所谓的误差函数,而我们所要做的就是使该误差函数取得它的极小值。E=∑(f(xi)−yi)2E=\sum(f(x_i)-y_i)^2E=∑(f(xi)−yi)2通常我们假设f(xi)=Axi2+Bxi+Cf(x_i)=Ax_i^2 + Bx_i+Cf(xi)=Axi2+Bxi+C之后的误差函数就如下所示:E=...原创 2019-12-02 21:35:01 · 1795 阅读 · 0 评论 -
Anaconda3的安装
Anaconda3 安装首先下载anaconda安装包,然后bash一下,一路yes,最后问是否安装VScode,根据需要进行选择。安装完成后conda info发现还是不好使,是因为有添加环境变量在文件/home/username/.bashrc/home/username/.bashrc/home/username/.bashrc中添加环境变量具体操作sudo vim .bashrc...原创 2019-11-21 22:41:00 · 258 阅读 · 0 评论