自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 scrapy淘宝爬虫(通过模拟登录获取cookie)获取价格信息评论

项目要求:爬取淘宝某领域下的商品名称,价格,评论。(我贼怂,如果阿里巴巴的朋友发现,请联系我,我立刻删帖,谢谢。)一、构思流程模拟登陆获取cookiescrapy爬取数据二、分步分析(一)、测试cookie是否能够满足我们爬取相应数据的要求(确定了cookie能满足我们的需求,才能确保项目的可行性)1、安装scrapy框架(直接pip安装就行)pip install scrapy...

2020-04-04 12:02:13 3919 1

原创 Scrapy:b站爬虫之抓包过程

Scrapy:b站爬虫之抓包过程一、内容说明一共爬取八个数据,可分为四项:1、标题(直接xpath,不用抓包)2、点赞、投币、收藏3、在线观看人数4、弹幕内容、时间、发送时间二、抓包过程1、点赞,投币,收藏1、获取信息源:用xpath试过之后,发现无法获取,推测是api内容2、尝试获取api接口:F12,netwoek下ctrl+f搜索转发的数量(上热门的一般就转发量比较少...

2020-02-17 16:45:32 997

原创 scrapy完成爬取内容的入库操作(mongodb数据库)。(windows下)

scrapy完成爬取内容的入库操作(mongodb数据库)。一、安装mongodb数据库并完成一次连接(已安装的可跳过)1、下载mongodb安装包(.msi)(1)MongoDB 提供了可用于 32 位和 64 位系统的预编译二进制包,你可以从MongoDB官网下载安装,MongoDB 预编译二进制包下载地址:下载链接(2)百度网盘下载mongodb-win32-x86_64-2008p...

2020-02-14 14:47:55 192

原创 scrapy中useragent(用户代理)的“随机更换”功能

scrapy中useragent(用户代理)的“随机更换”功能##一、在middlewares.py文件中自定义user-agentimport random from XXX.settings import USER_AGENTS #XXX=你建立的爬虫项目名称#随机的user-agent,从settings中获取USER_AGENTS列表,随机选择一个交给当前request对象...

2020-02-11 18:36:21 308

原创 对mysql的一些学习笔记

一、安装时注意事项最好不要安装8.0之后版本和5.5.4之前的版本,8.0版本太大(对初学者无用)且卸载可能有点麻烦。5.5.4之前的版本的utf-8可能不支持四字符中文。安装一般有两种方法,(1):下载zip文件然后改电脑配置.(2):下载.msi文件安装。个人推荐第二种,对小白来说第一种方法很容易出现问题,而且中途出错,后续还要删除些东西。安装包来源.能官网就官网,真不能就网盘吧,镜像...

2019-11-28 09:56:38 109

原创 MySQL5.7安装过程(.msi)

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代...

2019-11-28 09:24:29 1404

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除