python
文章平均质量分 78
KIDD5433
python爬虫小学生
展开
-
scrapy-新浪关注用户内容爬取
第一个需求从新浪主页抓取当天的所有热门内容。有文字就爬取文字,图片就爬图片,其实直接爬取博文的连接就好。抓取内容以内容作者为主要的id爬取作者的昵称和发表日期,博文链接,博文标题。这里不用登录,因为,热门内容主要是在微博首页,主要的要求就是使用selenium渲染工具去采集动态内容。第一个问题:新浪微博的采用下拉式更新的方式,所以需要使用selenium去执行js代码完成下拉的操...原创 2020-04-26 19:48:22 · 245 阅读 · 0 评论 -
王者荣耀爬虫
绪论网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。所以用python进行网络爬虫是简单且快捷的。需求分析本...原创 2020-02-20 14:48:25 · 5592 阅读 · 0 评论 -
使用python编写十二进制与十进制转换程序
我在面试前,面试公司发来一道python题,我觉得还挺有意思的。题目如下。"""“”"我们知道 2 进制数字由 2 种字符(01)组成,10 进制数字由 10 种字符(0123456789)组成,16 进制由 16 种字符(0123456789ABCDEF)。不同进制的数字之间可以相互转换。我们定义一种 “十二地支进制” 数字,这种数字由中国古代地支的 12 种字符(子、丑、寅、卯、辰、巳、...原创 2019-06-13 00:41:47 · 2773 阅读 · 0 评论 -
python学习笔记-数据结构与语句
基础元素学习一门编程语言的时候,我最先考虑的事情就是如何操作值,值(value)在程序组可以是一个数字1,2,3,4,字符'hello,word'.我们使用变量来保存这些值。又把变量保存的值成为对象,计算机会给变量的对象和变量分配内存空间。python使用的内存分配方式成为引用语义或者对象语义,而像c语言使用的时值语义。接下来具体说明一下这两种语义的区别。值语义:所谓值语义是指目标对象由源对象...原创 2019-08-03 15:37:26 · 357 阅读 · 0 评论