- 博客(8)
- 收藏
- 关注
原创 机器学习之验证码识别
项目背景:之所以做这个其实很久就有这个想法了,因为搞爬虫有大半年了,怕热很多网站,也模拟登陆了许多网站,包括知乎微博等,但是有个问题是,当我们遇到验证码的时候,就需要人工打验证码了,特别是用selenium登录新浪手机端的时候,每次都需要人为打验证码,感觉还不够全自动。所以就有了这个摸索。---------------------------------------------------
2017-03-24 10:50:32 17568 13
原创 浅谈机器学习中的特征缩放
引言在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),比如:在随机梯度下降(stochastic gradient descent)算法中,特征缩放有时能提高算法的收敛速度。下面我会主要介绍一些特征缩放的方法。什么是特征缩放特征缩放是用来标准化数据特征的范围。机器算法为什么要特征缩放特征缩放还可以使机器学习算法工作的更好。比如在K近邻
2017-03-28 16:24:49 1378
转载 [Python]项目打包:5步将py文件打包成exe文件
1.下载pyinstaller并解压(可以去官网下载最新版):http://nchc.dl.sourceforge.net/project/pyinstaller/2.0/pyinstaller-2.0.zip2.下载pywin32并安装(注意版本,我的是python2.7):http://download.csdn.net/download/lanlandechong/436
2017-03-22 14:14:15 788
原创 机器学习--sklearn的常见使用
from sklearn.naive_bayes import GaussianNBclf = GaussianNB() #训练模型clf.fit(features_train,labels_train) pred = clf.predit(features_test) #给出测试变量,预测结果from sklearn.metrics imp
2017-03-11 15:54:26 1129
转载 sklearn常用模块及类及方法----机器学习Python
常见机器学习模型 所在的位置补充StandardScalersklearn.preprocessingLabelEncodersklearn.preprocessingtrain_test_splitsklearn.cross_validation方法(小写)PCAsklearn
2017-03-06 17:58:38 1397
转载 从头开始实现神经网络:入门
本文中我们会从头实现一个简单的3层神经网络。我们不会推导所有的数学公式,但会给我们正在做的事情一个相对直观的解释。我也会给出你研读所需的资源链接。这里假设你已经比较熟悉微积分和机器学习的概念了。比如,你知道什么是分类和正则化。当然你也应该了解一点优化技巧,如梯度下降是如何工作的。但是即使你对上面提到的任何一个概念都不熟悉,你仍然会发现本文的有趣所在。但是为什么要从头实现一个神经网络呢?即使
2017-03-04 16:41:04 680
原创 神经网络激活函数--tanh双曲正切函数
Tanh 是双曲正切函数,是三角学中普遍使用的Tan 圆函数的双曲类比.Tanh[α] 定义为对应的双曲正弦和双曲余弦函数的比值,即 via .Tanh 也可以定义为,其中 是自然对数Log 的底数.当变量是有理数的(自然)对数时,Tanh 会自动计算出精确值. 当给出精确数值表达式作为变量时,Tanh 可以算出任意精度的数值结果. TrigFactorList
2017-03-04 16:11:04 9740
原创 微博爬虫之问题种种
好不容易模拟登陆上了微博,想着可以好好执行我的爬虫之旅了,然而并没有,,,,,,一个微博账号以及一个IP地址不能爬太多信息,否则微博会当成机器人(事实也是机器人,哈哈),于是上万能的淘宝买了两个微博账号想着拿来轮换登陆爬信息,GG,在微博页面上是可以的登陆的,然而在代码上获取微博网页代码却不可以,想着应该是买的账号有问题,于是用了同事的小号,结果是可以的。但是这也只是解决账号问题,反爬好像是看IP
2017-03-03 10:42:05 2608
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人