python
岛上的小黑猫
这个作者很懒,什么都没留下…
展开
-
python 爬虫
http://cuiqingcai.com/1052.html转载 2016-04-25 10:55:07 · 393 阅读 · 0 评论 -
python3 匹配任意字符
re.conpile(任意特征(.*)任意特征)原创 2016-07-27 15:19:07 · 3185 阅读 · 0 评论 -
python3 爬虫学习-根据关键词爬取百度百科内容
小白编了好久才写出来,记录一下免得之后再用的时候都忘了还得重新学~学习爬虫最开始是学习了慕课上的python课程,然后学习了慕课和网易云上的爬虫教程。这两个自己去查一下就好了~开始还比较费劲,毕竟熟悉需要时间么,而且python也不太熟悉。关于python版本:我一开始看很多资料说python2比较好,因为很多库还不支持3,但是使用到现在为止觉得还是pythin3比较好用,因为编码什么原创 2016-07-14 11:41:03 · 12160 阅读 · 4 评论 -
python 去除空格和换行
join:在序列中添加元素 split: 将字符串分解成序列 两者为互逆方法 Python代码 s = "as, asdas \r\nasda" print s.split(); # result: ['as,', 'asdas', 'asda'] print "".join(s.spl转载 2016-06-29 16:24:17 · 6723 阅读 · 0 评论 -
Python正则表达式如何进行字符串替换
Python正则表达式在使用中会经常应用到字符串替换的代码。有很多人都不知道如何解决这个问题,下面的代码就告诉你其实这个问题无比的简单,希望你有所收获。1.替换所有匹配的子串用newstring替换subject中所有与正则表达式regex匹配的子串result, number = re.subn(regex, newstring, subject) 2.替换所有匹配的转载 2016-06-08 11:47:30 · 1208 阅读 · 0 评论 -
python3 requests模块安装
先下载requests包 解压下载的包进入有setup.py 的目录 ,用windows的cmd先执行 python setup.py build然后执行 python setup.py install如果不出什么问题,提示安装成功新建立一个测试项目,import requests 之前下载了https://github.com/kennethreitz/requests给出的req转载 2016-05-20 16:18:27 · 1570 阅读 · 0 评论 -
python dict与json转换
可以先生成字典,然后使用 json.dumps()函数将字典转为json1 生成的json不能输出汉字,只输出utf8原始编码,形如 u\x55..格式,需要在 json.dumps()参数列表指定 ensure_ascii=false2 indent =1 单行输出 不换行, indent=2 多行输出如下{ "证券公司\r>华泰证券": { "colour"转载 2016-05-19 11:38:04 · 1249 阅读 · 0 评论 -
python3中文乱码问题
python3对python2的改变主要在编码,python3的编码是unicodeunicode是utf-16(而不是utf-8)因此fout = codecs.open('output.html','w',encoding='utf-16')fout.write("")fout.write("")fout.write("")fout.write("哈哈哈哈")...原创 2016-05-06 16:34:49 · 5956 阅读 · 1 评论 -
python urllib获取带有中文参数url内容的方法
本文实例讲述了python通过urllib2获取带有中文参数url内容的方法。分享给大家供大家参考。具体如下:对于中文的参数如果不进行编码的话,python的urllib2直接处理会报错,我们可以先将中文转换成utf-8编码,然后使用urllib2.quote方法对参数进行url编码后传递。?12345转载 2016-05-27 11:01:59 · 1293 阅读 · 0 评论 -
根据值删除列表中的某些元素
del语句可以通过给定索引(而不是值)来删除列表中的项,它与返回一个值的pop()方法不同。del语句也可以移除列表中的切片,或者清除整个列表 :23456789lst=[1,2,3,4,5,6,7,8,9]dellst[2] # 删除指定索引项原创 2016-05-27 10:13:42 · 1585 阅读 · 0 评论 -
python中split实现字符串分割方法
1 str.split([seq [,maxsplit]]) 我们最常用到的!姓名,年龄|另外一个用户姓名,年龄name:haha,age:20|name:python,age:30|name:fef,age:55那我们可以通过字符串对象的split方法切割字符串对象为列表。a = 'name:haha,age:20|name:python,age:30|nam转载 2016-05-11 20:46:55 · 1217 阅读 · 0 评论 -
爬虫学习1
网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。这篇博客主要对爬虫以及抓取系统进行一个简单的概述。一、网络爬虫的基本结构及工作流程 一个通用的网络爬虫的框架如图所示: 网络爬虫的基本工作流程如下: 1.首先选取一部分精心挑选的种子URL; 2.将这些URL放入待转载 2016-04-25 09:26:38 · 705 阅读 · 0 评论 -
python3 无覆盖写入&读入
fout = open('view_points.txt', 'a', )覆盖原内容写入:foit = open('name.txt','w')原创 2016-05-11 17:27:32 · 1634 阅读 · 0 评论 -
python3 爬虫基础(一本书推荐)
http://www.ituring.com.cn/book/1709原创 2017-10-19 10:04:34 · 13265 阅读 · 0 评论