自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

keenan的博客

大海无平期,我心无绝时

  • 博客(13)
  • 收藏
  • 关注

原创 windown conda 安装 pyhanlp

window 安装 pyhanlp

2022-04-16 10:09:32 932 1

原创 豆瓣搜索爬虫

豆瓣读书代码window.__data__参数破解:

2019-08-16 16:54:19 1435 3

原创 大众点评评论抓取-CSS加密破解

前言:大众点评的评论信息做了前端字体加密,在PC端的展示数据是通过CSS来控制的,从网页上看不出来太大的区别,但是用普通的脚本取获取时,会发现数据是获取不到的,具体的源代码是下面这样的:部分字体被标签包含,实际它是一张svg背景图,用css样式控制雪花图显示加载,并且可以看到他的css的background-image属性,可自行更改看看效果这里我们看到了jazj3i这个变量对应的两个像素...

2019-03-22 15:01:04 2743 1

原创 cookie中各参数含义

Name:该Cookie的名称。一旦创建,该名称便不可更改。Value:该Cookie的值。如果值为Unicode字符,需要为字符编码。如果值为二进制数据,则需要使用BASE64编码。Domain:可以访问该Cookie的域名。例如,如果设置为.zhihu.com,则所有以zhihu.com,结尾的域名都可以访问该Cookie。Max Age:该Cookie失效的时间,单位为秒,也常和Exp...

2018-11-04 16:26:23 8479

原创 python马蜂窝网站的爬取和简单分析。

完整代码https://github.com/wkd-lidashuang/py-/tree/master/mafengwo获得热门省编号和直辖市编号蚂蜂窝中的所有城市、景点以及其他都有一个专属的5位数字编号,我们第一步要做的就是获取城市(直辖市+地级市)的编号,进行后续的进一步分析先获得热门目的地,提取直辖市和省编码def find_province_url(url): ...

2018-09-24 10:14:08 7320 12

原创 硬链接与符号链接

硬链接-rw-rw-r–. 1 DS DS 0 Sep 19 14:45 abc数字代表改文件硬链接的次数ln target linknameln abc ./text/abc2命名创建一个硬链接后硬链接次数加1-rw-rw-r–. 2 DS DS 58892 Sep 19 14:50 abc用ls - i 命令你可以看到两个文件的inode是一样的删除abc文件,并不会abc...

2018-09-19 15:26:48 213

原创 centos7文件查找

locat 文件名:非实时,模糊匹配,查找的是根据全系统文件数据库进行的updatedb更新文件数据库速度快find 查找路径 查找标准 查找到以后的处理动作查找路径:默认当前路径查找标准:默认当前路径下的所有文件默认显示匹配标准:-name ’filename‘:对文件名进行精确匹配-iname ’filename‘:文件名匹配时不区分大小写-user USERNA...

2018-09-17 21:54:39 1343

原创 python中可变对象与不可变对象

什么可变/不可变对象: 可变对象,对象所指向内存中的值不可变 不可变对象,该对象所指向的内存中的值可以改变 不可变对象:int,string,float,tuple和bytes 可变对象 :list,dictionarya = 0print(id(a)) a = a + 1print(id(a)) # 两个id 并不相同li = [1, 2, 3...

2018-09-17 16:09:51 150

原创 LintCode字符串压缩

设计一种方法,通过给重复字符计数来进行基本的字符串压缩。例如,字符串 aabcccccaaa 可压缩为 a2b1c5a3 。而如果压缩后的字符数不小于原始的字符数,则返回原始的字符串。可以假设字符串仅包括a-z的字母。样例str=aabcccccaaa 返回 a2b1c5a3 str=aabbcc 返回 aabbcc str=aaaa 返回 a4class Soluti...

2018-09-16 12:47:35 293

原创 lintcode 约翰的后花园

约翰的后花园约翰想在他家后面的空地上建一个后花园,现在有两种砖,一种3 dm的高度,7 dm的高度。约翰想围成x dm的墙。如果约翰能做到,输出YES,否则输出NO。样例给出 x = 10,返回YES。解释: x = 3 + 7 : 即需要1匹3 dm高度的砖和1匹7 dm 高度的砖。 给出 x = 5,返回 NO。解释: 不能用高度为3 dm的砖和高度为7 dm的砖...

2018-09-16 12:29:20 555

原创 字符串写入行数

字符串写入的行数把字符串S中的字符从左到右写入行中。 每行最大宽度度为100,如果往后新写一个字符导致该行宽度超过100,则写入下一行。 注意:一个字符的宽度不为1!给定一个数组widths,其中widths[0]是字符a的宽度,widths[1]是字符b的宽度,…,widths[25]是字符’z’的宽度。问:把S全部写完,至少需要多少行?最后一行用去的宽度是多少? 将结果作为长度为2的...

2018-09-16 11:58:25 226

原创 python. 输入流 给出两个输入流inputA和inputB,有Backspace,如果两个输入流最后的结果相等,输出YES,否则输出NO。

class Solution: """ @param inputA: Input stream A @param inputB: Input stream B @return: The answer """ def result_input(self, input_): # 返回处理backspace之后的输入流 b ...

2018-09-16 11:09:45 1113

原创 itertools中combinations与permutations函数作用与区别

import itertoolss = [1, 2, 3]print(itertools.permutations(s,2))print(list(itertools.permutations(s,2)))lis = list(itertools.combinations('abc', 3))print(lis)permutations和combinations都是得到一个迭代...

2018-09-15 17:05:41 5071

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除