- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 scrapy入门
一、爬取豆瓣9+评分书籍 http://www.bubuko.com/infodetail-1533174.html 在cmd里面直接创建scrapy工程,然后进入工程genspider一个爬虫工程。创建main函数,对settings 和 items进行设置 # -*- coding: utf-8 -*- import scrapy import re from doubanbook.i...
2019-03-29 09:18:51 164
原创 python常用函数总结
1 Python中struct.pack()和struct.unpack()用法详细说明 2 找到列表里长度最大的词语 max( m_names , key=len) 3 建立单词和索引的映射 # chars 为单词集合 res = dict((c, i) for i, c in enumerate(chars)) 4 实现名称label数字化 genderMap={'M':0,...
2019-03-22 14:46:25 194
原创 python 分析qq聊天记录
一、导出聊天记录.txt。 二、通过正则表达式对txt匹配得到:日期,时间,QQ号码,聊天内容四个列表。 正则表达式分析: 1、'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子。 raw string。 2、[]定义字符范围。[\d-]匹配数字和-格式的字符;\s+ 匹配多个空格。 [^\n]代表任何字符除了\n,任...
2019-03-20 17:21:16 7194
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人