![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
淡之梦
这个作者很懒,什么都没留下…
展开
-
【Python】sort与sorted
语法sort语法: python2: iterable.sort(cmp[, key[, reverse]]) python3: iterable.sort(*, key=None, reverse=False) sorted 语法: python2: sorted(iterable[, cmp[, key[, reverse]]]) python3: sorted(iter...原创 2018-04-09 18:47:47 · 354 阅读 · 0 评论 -
【Python】 简单关键字爬取公众号文章
序爬取目标:微信公众号“纵梦广科”中“表白墙”(可选“吐槽墙”)的文章 爬取字段:表白对象、表白内容 爬取缘由:分析“表白墙”上的同学什么说得多的词 爬取工具:matplotlib、wordcloud、jieba 爬取结果: “表白墙”文章160篇 爬取收获:简单爬取公众号文章、简单生成词云 爬取注意: 1、因为爬取内容可以简洁地直接保存txt文本进行绘画词云分析,但因为作业项目...原创 2018-06-26 12:59:13 · 3330 阅读 · 0 评论 -
【Python】Scrapy ItemLoader 处理空列表让数据库字段为空值
问题描述我需要爬取某些招聘网页上的信息,但不是所有招聘网页中展示的信息都一样,例如有些网页上并没有附上公司网址,而如果没有需要在数据库相应的字段中赋值为空。方法一:不使用itemLoader使用extract_first()取得列表第一个元素,默认值为‘’,但这不适用列表中有多个元素,比如不止爬取一个标签def parse_detail(self, response): a...原创 2018-10-20 23:10:18 · 2485 阅读 · 0 评论 -
【Python】 @classmethod 在实际项目中的应用
在项目中,多数作用于获取项目配置文件的配置属性。原创 2018-10-29 22:50:08 · 836 阅读 · 1 评论 -
【Python】 日志管理之loguru库-自定义日志旋转和压缩
loguru 是一个友好的python 日志库但目前版本尚存在一些问题,有时日志的旋转需要自定义。原创 2019-04-08 14:31:06 · 2356 阅读 · 1 评论