- 博客(4)
- 收藏
- 关注
原创 在文本的特征选择中学习到的东西——构建词典
这一段时间在学习从以标注好的文本中生成词典。 今天读到的这段代码,真的学习到了很多。 indexes=[1]表示要训练的指标项,默认为1,也可以是其他,如[3,4,5]等等。 首先读到的这段代码(python):f= file(filename,'r') for line in f.readlines(): sample = line.strip().split(
2016-03-30 16:43:28 2534 1
转载 转载——python和爬虫的正则表达式
接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。以下内容转自CNBLOG:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html一、 正则表达式基础1.1.概念介绍正则表达式是用于处理字
2015-12-07 16:47:07 734
原创 收藏夹不够用,超链接来补
最近在学习python做bishe,发现网上好的资源太多,收藏夹又满足不了自己的需求,老是忘记自己收藏了什么,所以就找了一些有价值的、让人惊叹的资源。也希望帮助到大家的学习。(持续补充中......)1.python爬虫: 1. 崔庆才的爬虫入门1-8 2.2.网站的模拟登录 1.在路上——走别人没走过的路,让别人有
2015-12-01 09:26:33 928
转载 抓包软件fiddler
Fiddler是最强大最好用的Web调试工具之一,它能记录所有客户端和服务器的http和https请求,允许你监视,设置断点,甚至修改输入输出数据. 使用Fiddler无论对开发还是测试来说,都有很大的帮助。阅读目录Fiddler的基本介绍Fiddler的工作原理同类的其它工具Fiddler如何捕获Firefox的会话Firefox 中使用Fiddler插件Fiddler如何捕
2015-11-30 14:46:36 867
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人