python爬虫
文章平均质量分 71
喵了个咪咪咪
爬虫爱好者,机器学习,数学建模~
展开
-
欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl转载 2017-08-14 16:19:31 · 350 阅读 · 0 评论 -
Python 正则表达式笔记(一)
自从学习Python以来,正则表达式已经在很多地方经常使用了,特别是对于文本处理,以及网络爬虫上。如今对于Python的正则表达式进行整理,方便以后查阅。在Lunix系统中对于正则表达式也有着广泛的运用。 1.python的re模块 python的re模块是自带的,并不需要额外的安装。对于正则表达式的匹配模式是匹配正则表达式对象(Regex对象)。 1.1 创建正则表达式原创 2017-08-19 22:20:49 · 373 阅读 · 0 评论 -
讲html网页保存为pdf
使用wkhtmltopdf插件+ pdfkit插件的安装:wkhtmltopdf的安装参考:https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf安装pdfkit pip install pdfkit关于wkhtmltopdf的使用:1.一定要把wkhtmltopdf的安装路径加入到Pat...原创 2018-04-28 14:21:58 · 588 阅读 · 0 评论 -
Python使用MongoDB保存文件,几个细节需要注意
当单个文件的大小小于16M的时候用bison直接导入就可以需要导入的库import pymongo import bson.binary from cStringIO import StringIO from gridfs import *完整代码:def lead_in_Mongodb(filename_lst, id_lst, url_lst): client = pymongo.M...原创 2018-04-28 14:39:37 · 3396 阅读 · 0 评论