
爬虫
小M姐姐呀~
计算机在读研究生
每日更新大数据相关内容
展开
-
爬虫:Scrapy分类爬取苏宁易购书城
爬取苏宁图书信息原创 2021-12-11 16:08:19 · 1147 阅读 · 0 评论 -
valueError:I/O opetation on close file
解决方式:使用with方法打开了文件,生成的文件操作实例在with语句之外是无效的,因为with语句之外文件已经关闭了。原创 2021-06-20 21:00:40 · 483 阅读 · 0 评论 -
scrapy做爬虫时,导入Module的时候总显示no module named ×××.items
报错情况:原因:这是由于pycharm编辑器的原因,项目名称与爬虫文件夹名称一致,所以导包错误。解决方法:1.选中项目>>右键>>选择Mark directory as >> Source RootMark directory as Source Root 表示如下...原创 2021-07-28 16:19:25 · 994 阅读 · 0 评论 -
前程无忧51Job岗位爬取~~新手路过,请多指教
import urllib.request # 用于请求打开网页from bs4 import BeautifulSoup # 网页解析获取数据import re # 引入正则表达式import xlwt # 保存文件为excel# 正则表达式提取岗位信息jobHref = re.compile(r'"job_href":"(.*?)"', re.S) # 岗位链接jobName = re.compile(r'"job_name":"(.*?)"', re.S) # 岗...原创 2021-07-15 17:33:31 · 1197 阅读 · 0 评论 -
利用EXCEL进行数据爬虫
说到爬虫,相信大家出现在脑海中的一定是python。python在最近几年确实热火朝天,对于不会编程人员来说,利用好EXCEL一样也可以爬取一些简单的数据,并且方式非常简单。 1.爬取东方财富网上基金信息。网址为:http://fund.eastmoney.com/trade/pg.html2.在浏览器任意地方右键 -> Network->Headers3.向下拉找到Request Headers 中的user-Agent,并复制其value...原创 2021-06-24 21:18:30 · 5574 阅读 · 2 评论