- 博客(16)
- 资源 (555)
- 问答 (2)
- 收藏
- 关注
原创 Python爬虫入门教程 65-100 爬虫与反爬虫的修罗场,点评网站,字体反爬之三
爬虫与反爬虫的修罗场哪种平台最吸引爬虫爱好者,当然是社区类的,那里容易产生原生态,高质量的数据啊,你看微博,知乎,豆瓣爬的不亦乐乎。评论也是产生内容的好地方生活类点评网站旅游类点评网站音乐类点评只要有点评的地方,总有成千上万的爬虫趴着。这些都是爬虫与反爬虫的修罗场,他不想叫你爬,你越想爬对他是核心数据,对你也是核心数据今天要分析的网站今天我们弄一下大众点评学习阶段,我们要抱...
2019-04-30 09:47:27 20606 24
原创 刚毕业去面试Python工程师,这几道题太难了,Python面试题No11
文章目录写在前面第1题: docstring是什么?第2题:PYTHONPATH变量是什么?第3题: Python中的不可变集合(frozenset)是什么?第4题:如何检查字符串中所有的字符都为字母数字?第5题:什么是Python中的连接(concatenation)?第6题:Python的不足之处写在前面本想停一段时间这个系列,但是好多朋友给我发信息说让我继续整理下去,so,继续吧~第1...
2019-04-30 08:48:14 20054 3
原创 Python爬虫入门教程 64-100 反爬教科书级别的网站-汽车之家,字体反爬之二
说说这个网站汽车之家,反爬神一般的存在,字体反爬的鼻祖网站,这个网站的开发团队,一定擅长前端吧,2019年4月19日开始写这篇博客,不保证这个代码可以存活到月底,希望后来爬虫coder,继续和汽车之间对抗。CSDN上关于汽车之家的反爬文章千千万万了,但是爬虫就是这点有意思,这一刻写完,下一刻还能不能用就不知道了,所以可以一直不断有人写下去。希望今天的博客能帮你学会一个反爬技巧。今天要爬去的网...
2019-04-27 21:47:09 20628 15
原创 朋友去面试Python工程师,又带回来几道基础题,Python面试题No10
文章目录第1题: print 调用 Python 中底层的什么方法?printinput第2题:range 和 xrange 的区别?第3题: 4G 内存怎么读取一个 5G 的数据?方法一方法二第4题:在except中return后还会不会执行finally中的代码?怎么抛出自定义异常?介绍一下 except 的作用和用法?第5题:在Python中输入某年某月某日,判断这一天是这一年的第几天?(可...
2019-04-25 23:05:07 19750 3
原创 又面试了Python爬虫工程师,碰到这么几道面试题,Python面试题No9
文章目录第1题:动态加载又对及时性要求很高怎么处理?第2题:python 爬虫有哪些常用框架?第3题: Scrapy 的优缺点?优点:scrapy 是异步的缺点:基于 python 的爬虫框架,扩展性比较差第4题: scrapy 和 request?第5题: 描述下 scrapy 框架运行的机制?第6题: 实现模拟登录的方式有哪些?第6题: 你遇到过的反爬虫的策略?后续面试问题第1题:动态加载又...
2019-04-24 09:48:03 19261 11
原创 从B站源码泄露事件入手,说一下团队协作中版本管理的安全意识
背景新浪科技讯 4月22日消息,据微博@互联网的那点事 爆料称,哔哩哔哩(B站)整个网站后台工程源码泄露,并且“不少用户名密码被硬编码在代码里面,谁都可以用。”互联网那点是,微博大号,发布之后,瞬间互联网新媒体圈圈子全部知晓,头部意见领袖的作用,立马发挥,大量转载,文章铺天盖地出现。事情发酵起因一名为openbilibili的用户在Github上创建“go-common”代码库。开源库,...
2019-04-22 21:51:47 19753 17
原创 面试Python工程师,这几道编码题有必要背背,Python面试题No8
第1题:列表[1,2,3,4,5],请使用map()函数输出[1,4,9,16,25],并使用列表推导式提取出大于10的数,最终输出[16,25]。第2题:设计一个函数返回给定文件名的后缀?第3题: 这两个参数是什么意思:*args,**kwargs?我们为什么要使用它们?第4题: 求出`0~n`的所有正整数中数字k(0~9)出现的次数。编程语言不限,Python优先。第5题: 如何在python中使用三元运算符?
2019-04-22 15:07:51 19707 12
原创 周三面试Python开发,这几道Python面试题差点答错,Python面试题No7
第1题:阅读下面的代码,默读出A0,A1至An的最终值。第2题:如何提高python的运行效率?第3题: Python字典有什么特点,从字典中取值,时间复杂度是多少?第4题: 多线程、多进程?第5题: 请尽可能列举python列表的成员方法,并给出以下列表操作的答案:
2019-04-18 22:38:32 19459 6
原创 昨天去面试,这5个Python面试题都被考到了,Python面试题No6
文章目录第1题:字符串的拼接–如何高效的拼接两个字符串?第2题: list = ['a','a','a',1,2,3,4,5,'A','B','C']提取出”12345”?第3题: 什么是pickling和unpickling?第4题: 说一说Python自省?第5题:什么是python猴子补丁python monkey patch?第1题:字符串的拼接–如何高效的拼接两个字符串?字符串拼接...
2019-04-17 23:20:37 19838 21
原创 梦想橡皮擦写的 Python 面试系列文章清单
为什么写这个系列的文章互联网很多python面试分享的资料,但是都是对题目进行了非常简单的解读,我想针对每个面试题都深入并且细致的解释清楚,从这个出发点去帮助你建立python体系,所以有了这个系列的文章Python基础面试,看这篇文章画重点吧,Python面试题No1Python面试快问快答,理论要的就是速度与精准,Python面试题No2学习Python一年,基础忘记了,看看面试题回忆...
2019-04-17 16:08:00 22532 34
原创 2019年,Python工程师必考的6个面试题,Python面试题No5
第1题:Python里面如何实现tuple和list的转换?第2题:Python里面search()和match()的区别?match()search()第3题: 如何用Python删除一个文件?第4题: is 和 == 的区别?第5题:a=1, b=2, 不用中间变量交换a和b的值?第6题:说说你对zen of python的理解,你有什么办法看到它?
2019-04-16 23:12:46 19524 2
原创 去面试Python工程师,这几个基础问题一定要能回答,Python面试题No4
第1题:列表和元组有什么不同?语法差异是否可变重用与拷贝内存开销第2题:什么是负索引?第3题: 如何随机打乱列表中元素,要求不引用额外的内存空间?第4题:解释 Python 中的 join() 和 split() 函数?第5题:如何删除字符串中的前置空格?第6题:Python 中的 pass 语句有什么作用?第7题:解释 Python 中的成员运算符?成员运算符身份运算符
2019-04-15 22:30:42 19332
原创 学习Python一年,基础忘记了,看看面试题回忆回议,Python面试题No3
第1题:你如何管理不同版本的代码?第2题:python中生成随机整数、随机小数、0~1之间小数方法?第3题:迭代器、可迭代对象、生成器?第4题:单引号,双引号,三引号的区别?第5题:Python是如何进行内存管理的?第6题:写一个函数, 输入一个字符串, 返回倒序排列的结果?
2019-04-11 15:26:36 20106
原创 Python爬虫入门教程 63-100 Python字体反爬之一,没办法,这个必须写,反爬第3篇
在反爬圈子的一个大类,涉及的网站其实蛮多的,目前比较常被爬虫coder欺负的网站,猫眼影视,汽车之家,大众点评,58同城,天眼查…还是蛮多的,技术高手千千万,总有五花八门的反爬技术出现,对于爬虫coder来说,干!就完了,反正也996了~作为一个系列的文章,那免不了,依旧拿猫眼影视“学习”吧,为什么?因为它比较典型~猫眼影视打开猫眼专业版,常规操作,谷歌浏览器,开发者工具,抓取DO...
2019-04-09 16:12:37 19352 7
原创 Python爬虫入门教程 62-100 30岁了,想找点文献提高自己,还被反爬了,Python搞起,反爬第2篇
学习理论的知识少不了去检索文献,好多文献为你的实操提供了合理的支撑,我所在的大学内网默认是有知网账户的,非常NICEPython爬虫入门教程 62-100 30岁了,想找点文献提高自己,还被反爬了,Python搞起,反爬第2篇今天要完成的网站是 http://ac.scmor.com/ > Google学术搜索是一个文献检索服务,目前主要是提供维普资讯、万方数据等几个学术文献资源库的检索服务。通过Google学术搜索只能够查找到这些学术资料的“报告、摘要及引用内容... 来源百度百科
2019-04-02 19:18:36 20135 4
原创 Python爬虫入门教程 61-100 写个爬虫碰到反爬了,动手破坏它!
python3爬虫遇到了反爬当你兴冲冲的打开一个网页,发现里面的资源好棒,能批量下载就好了,然后感谢写个爬虫down一下,结果,一顿操作之后,发现网站竟然有反爬措施,尴尬了。接下来的几篇文章,我们研究一下各种反爬虫套路,当然互联网没有100%的反爬措施,只要你能使用浏览器访问的网页,都是可以爬取到了,所有的人不能杜绝爬虫,只能在一定程度上增加你爬取的成本,说白了,就是让你的技术爬不到~爬虫和...
2019-04-01 19:45:31 19632 10
数据库课程设计.pptx
2024-01-12
OpenCV教程或项目资源.pptx
2023-11-27
Linux常用命令.pptx
2023-11-21
Python 编程练习题,每页一个.pptx
2023-11-09
华为OD面试开放数据PPT大纲.pptx
2023-11-07
如何学习MATLAB.pptx
2023-10-25
用Python实现爱心代码.pptx
2023-10-19
华为OD-技术综合面,手撕代码真题整理(99):最小生成树在城市规划中的应用-最长公共子序列问题.md
2023-10-15
AmazonCodeWhisperer.pptx Amazon CodeWhisperer是一个用于代码审查和优化的工具
2023-09-28
rk3399android71平台新增HDMI特殊分辨率输出改补丁.pptx
2023-09-20
matplotlib.pptx
2023-09-20
使用Rational Rose创建模型:详细教程与示例代码.md
2023-09-14
KMP算法C++实现.pptx
2023-09-13
KMP 算法,即 Knuth-Morris-Pratt 算法,是一种用于字符串匹配的经典算法 与朴素的字符串匹配算法相比,KMP
2023-09-13
大学生 Python爬虫入门指南.pptx
2023-09-08
Python爬虫的网页内容提取与数据分析:提升SEO效果实战指南.pptx
2023-09-08
MATLAB是一种编程语言和数学计算环境
2023-08-29
MATLAB三维数组详解与应用
2023-08-23
python itertools.pptx
2023-08-21
Pythonlower函数用法PPT.pptx
2023-08-21
预测模型与数据分析.md
2023-08-16
Java面试题精选与解析.md
2023-08-16
Python爬虫课程:网络数据采集与分析-课件脚本
2023-08-16
人工智能课程:探索智能的未来 课程脚本设计,可用于大学课件制作
2023-08-16
网页设计大作业:打造创意与功能兼具的旅游信息网站
2023-08-15
计算机课程设计脚本:构建实用的网络安全管理系统.md
2023-08-15
每日一问 | 学习 Python 时,你最想解决的问题是?
2020-12-18
说出你心目中的 Python 学习路线吧
2020-12-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人