- 博客(3)
- 收藏
- 关注
转载 机器学习分类问题中,数据不均衡时的解决方法
数据不均衡是指数据集中每种类别的数据的数量相差比较大。比如一个数据集S中,a类数据有100个,b类有1个,一般相差一个以上数量级的就算是数据不均衡了,需要进行预处理。 数据不均衡会导致最终的分类结果有偏差。同样以数据集S作为说明,如果不作任何处理直接用S作为训练数据,那么用训练模型对一个新的数据进行测试,得到的结果将有约100/(100+1)即近似为1的概率被预测为类别a,而被预测为b类的概率只...
2018-04-19 14:35:24 1770
原创 MongoDB安装后,浏览器中输入localhost:27017无法打开
安装了mongodb之后,可以启动,但发现在浏览器中输入http://localhost:27017始终无法打开。参考网上说是 mongodb貌似不支持浏览器页面访问,你如果是想访问并管理创建的mongo实例,可以安装第三方管理应用我尝试用pycharm作为可视化工具,发现在配置Mongo server时,也无法成功。后来参考了下面这种做法,成功的配置好了pycharm: ...
2018-04-11 18:18:13 37419
转载 numpy的广播机制(broadcast)
本文转自博客:对Numpy广播操作的理解(https://www.cnblogs.com/sgdd123/p/7600283.html)1.首先检查两个矩阵维数是否相同,若不同,对维数少的补一。注意这里的维数不是指n行d列中的n和d的值,对于一般的矩阵维数就是2。若一个两维的矩阵(n,d)和一个一维的数组(m,)相乘,补一操作就是将那个一维的数组变为(1,m),补一总是在shape数组的开...
2018-04-10 11:21:43 820
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人