python
lan2720
这个作者很懒,什么都没留下…
展开
-
【《机器学习实战》第2章读书笔记】手写数字识别系统剖析
用Python构建一个K近邻分类器,识别手写数字,其中书中给出的训练集数据1934个,测试集数据946个, 在没有交叉验证的情况下,最终的识别率为98.2% 手写数字经过图像处理之后,变成只由0、1构成32*32矩阵,存放在.txt文件中,如下图: 好了,详细剖析如下: """ 用 k-nearest neighbors实现手写数字识别 步骤: 1、每一个训练的数字存放在原创 2014-03-08 22:15:51 · 1628 阅读 · 2 评论 -
python+lxml+xpath提取nature网站中的article基本信息【初级版】
下图为网站上的一篇article,可以明显提取到:题目,作者,作者单位(afiliation),贡献情况,通讯作者(corresponding author), 期号,卷号,投稿时间,接收时间,发表时间 摘要,主题(下图中未截取,可点击网页查看) 1、html源码的获取,保存到nature.txt def fetch(url): http_request = urllib2.Re原创 2014-03-08 23:57:42 · 5427 阅读 · 0 评论