自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 scrapy入门

一、爬取豆瓣9+评分书籍 http://www.bubuko.com/infodetail-1533174.html 在cmd里面直接创建scrapy工程,然后进入工程genspider一个爬虫工程。创建main函数,对settings 和 items进行设置 # -*- coding: utf-8 -*- import scrapy import re from doubanbook.i...

2019-03-29 09:18:51 164

原创 python常用函数总结

1 Python中struct.pack()和struct.unpack()用法详细说明 2 找到列表里长度最大的词语 max( m_names , key=len) 3 建立单词和索引的映射 # chars 为单词集合 res = dict((c, i) for i, c in enumerate(chars)) 4 实现名称label数字化 genderMap={'M':0,...

2019-03-22 14:46:25 194

转载 python生成嵌套字典

https://blog.csdn.net/chinacmt/article/details/51965743

2019-03-21 17:51:52 1206

原创 python 分析qq聊天记录

一、导出聊天记录.txt。 二、通过正则表达式对txt匹配得到:日期,时间,QQ号码,聊天内容四个列表。 正则表达式分析: 1、'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子。 raw string。 2、[]定义字符范围。[\d-]匹配数字和-格式的字符;\s+ 匹配多个空格。 [^\n]代表任何字符除了\n,任...

2019-03-20 17:21:16 7194

KDD Cup 2012 Track1 数据集

KDD Cup 2012 Track1 数据集。数据集包含了用户特征和Item特征。文件为百度云链接。可快速下载。

2019-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除