自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 写一个函数,判断两个列表是否有交集(不要用for)

# Determine whether two lists have intersection.def isInter(a,b): result = list(set(a)&set(b)) if result: return True else: return False # test lst1 = [0,1,2,3,4,5,6,7,8,...

2018-08-30 18:00:54 3232 1

原创 依存句法分析结果的输出怎么看【已解决】

如题,本人是自然语言处理小白,虚心求教各位大佬~通过对“苹果被我吃了”进行分词、词性标注、依存句法分析得到如下结果:分词结果:苹果    被      我      吃      了词性分析结果:苹果/n  被/p  我/r  吃/v  了/u依存句法分析结果:4:FOB   4:ADV   2:POB   0:HED   4:RAD将以上结果绘制成语法树得出:这个结果 4:F...

2018-08-29 17:46:16 4414 1

原创 python爬虫实习生面试经验分享【卖座网】

十六号那天,我在宿舍睡到11:44分,收到HR电话商量面试时间,因为是被电话吵醒的,没考虑就说了当天下午15:00。说完挂了电话,我马上意识到犯了个很严重的错误,我应该说明天下午三点的,当天下午就去面准备时间太少了。。吃一堑长一智。时间紧迫,准备面试(搜了一些python题目,爬虫面试题,看了以前写的自我介绍),一边胡乱吃了午饭(超市乌冬面),穿好黑色长裤和一件短袖衬衫,时间来到两点半,还没打...

2018-08-27 20:11:45 3937 3

原创 在scrapy源码中添加功能,对HTTP响应状态码493的url进行保存

在scrapy爬虫过程中,遇到了这样一个问题:[scrapy.spidermiddlewares.httperror] INFO: Ignoring response <493> HTTP status code is not handled or not allowed我们翻译一下(百度翻译):忽略响应< 493 >不处理或不允许HTTP状态代码经测试...

2018-08-19 09:48:34 4554

原创 python学习日志_错误解析#5——Syntax Error: Non-UTF-8 code starting with '\xd5' in file TestReNum.py on line 8

翻译:语法错误:第8行文件TestReNum.Py中用“\xd5”开始的非UTF-8代码出错的源代码:import redef ReTel(tn): reg = "1[3|4|5|7|8][0-9]{9}" return re.findall(reg, tn) print(ReTel("17722548365")) # 正确print(ReTel("xxddew...

2018-08-17 16:53:00 5722

原创 手机号码的正则表达式【python描述】

# -*- coding:utf-8 -*-import redef ReTel(tn): reg = "1[3|4|5|7|8][0-9]{9}" return re.findall(reg, tn) print(ReTel("17722548365")) # 正确print(ReTel("xxddewl")) # 号码不合法print(ReTel("12...

2018-08-17 16:46:47 5056

原创 python快速排序算法

今天见到一个很棒的快排算法,只用三行语句就完成了:def qsort(L): if len(L) <= 1: return L return qsort([lt for lt in L[1:] if lt < L[0]]) + L[0:1]+ qsort([ge for ge in L[1:] if ge >= L[0]])接下来我们测试一下,写一些...

2018-08-16 13:10:42 221

原创 规范进行一个爬虫项目【经验分享:参考教学书籍,爬取books.toscrape.com上的书籍信息】

如何规范开始一个python爬虫?传送门:https://blog.csdn.net/GBA_Eagle/article/details/81611348教学书籍:《精通Scrapy网络爬虫》项目需求:爬取http://books.toscrape.com网站中的书籍信息。(1)信息包括:书名、价格、评价等级、产品编码、库存量、评价数量。(2)将爬取结果保存到csv文件中。...

2018-08-13 18:43:54 2816

原创 规范开始一个scrapy爬虫项目

【示例环境】系统 WIN10语言及版本 python3.6   安装好scrapy(装好python,在命令行中输入pip install scrapy)首先,我们要创建一个scrapy项目,打开命令提示符(win+R, 输入cmd回车),cd到你要创建项目的目录下,使用scrapy startproject <project_name>命令, 该参数表示你为项目起的名:(...

2018-08-12 22:34:34 619

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除