• 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

转载 python 伪原创 中文近义词工具包【转】

Chinese Synonyms for Natural Language Processing and Understanding.最好的中文近义词工具包。synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。Table of Content:InstallUsageQuick Get StartValuationB...

2018-06-24 23:44:04 9034

转载 python3 xpath获取同级元素的各种方法

XPath轴(XPath Axes)可定义某个相对于当前节点的节点集: 1、child 选取当前节点的所有子元素 2、parent 选取当前节点的父节点 3、descendant 选取当前节点的所有后代元素(子、孙等) 4、ancestor 选取当前节点的所有先辈(父、祖父等) 5、descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身 6、ancestor-...

2018-06-19 07:58:53 4958

原创 python3 json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 col

需要把字符串类型的json转换成字典,但是一直提示 json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)后面查看资料才知道是因为字典的  键 位有两个少了引号{q:"python",p:false,s:["python基础教程","pytho...

2018-06-16 02:00:11 7894 2

转载 新手需要知道decode 和 encode 区别【转载】

转自:http://blog.csdn.net/a921800467b/article/details/8579510为什么会报错“UnicodeEncodeError:'ascii' codec can't encode characters in position 0-1: ordinal notin range(128)”?本文就来研究一下这个问题。字符串在Python内部的表示是unico...

2018-06-16 01:01:51 60421 5

转载 python3 URL拼接代码

感谢网友的分享,先自己保存起来;因为网上的是基于 python2.x版本的,所以自己修改了一下能在3.x用了。将不完整的url拼接成为完整的url;比如在网页中经常遇到相对路径的 url1 = http://www.bachejian.comur2 = /abc/efc/123.html需要将他们拼接成为http://www.bachejian.com/abc/efc/123.html 就用以下代...

2018-06-10 23:31:10 10270

原创 python3 区间日期生成列表形式的类方法

import datetimeclass Quriqi(): """取区间日期模块,主要传入两个参数: Quriqi('20180601','20180608').suanriqi() 将会返回list类型 此类用的模块为datetime """ def __init__(self,qishi,jiezhi): self.start...

2018-06-08 16:26:25 1518

原创 python3的url编码和解码,自定义gbk、utf-8

因为很多时候要涉及到url的编码和解码工作,所以自己制作了一个类,废话不多说 码上见!# coding:utf-8import urllib.parseclass Urlchuli(): """Url处理类,需要传入两个实参:Urlchuli('实参','编码类型'),默认utf-8 url编码方法:url_bm() url解码方法:url_jm()""" ...

2018-06-07 12:47:44 4932 1

原创 Scrapy学习之items设计

【settings模块】ITEM_PIPELINES ={} (传入的数据要干什么)IMAGES_URLS_FIELD = '' (去哪里获取url地址)project_dir = os.path.dirname(os.path.abspath(__file__))IMAGES_STORE = ""   (将文件存储到哪里去)# 'scrapy.pipelines.images.ImagesPip...

2018-06-04 13:25:59 2015

原创 Scrapy入门模版编写

scrapy startproject ArticleSpider #创建名称为ArticleSpider的项目文件【创建爬虫项目】通过以上命令来创建爬虫项目。命令行创建爬虫模板(需要在项目文件夹内执行,避免模板创建到其他地方)scrapy genspider jobbole blog.jobbole.com(正确的创建模板路径应该是:E:\boo\zidongpa\ArticleSpider\执...

2018-06-03 18:34:50 1185

ipython/jupyter notebook解决浏览器空白的注册文件

用于解决ipython/jupyter notebook在浏览器中无法打开(打开空白)的注册文件,双击添加即可

2019-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除