自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 关于scrapy 默认settings的坑

scrapy默认的配置文件settings,里面的配置必须要全大写,不然获取的时候无法获取到,自己由于这个踩了很久的坑啊!!!!!!!!!! 以下的是我自己的小程序, 配置文件部分代码: MYQL_HOST = '127.0.0.1' MYSQL_DATABASE = 'spiders' MYSQL_USER = 'root' MYSQL_PASSWORD = '123' MYSQL_PORT =...

2019-04-21 23:13:10 785

原创 scrapy,itemloader,add_xpath()选择器返回结果为空

response.body.decode('gbk') loader = YjsLoader(item=jobSyjs(), response=response) # 创建item loader loader.add_xpath('jobCompany', '//div[@class="main mleft"]//h1/text()') load...

2019-04-19 12:00:04 862 4

原创 求解:scrapy 的回调函数,在parse中先把当前页面列表中每一项遍历,该页结束跳转到下一页,但是执行结果是我只得到了第一页的爬取结果

def parse(self, response): # print(response.text) uri = 'https://www.liepin.com' h3List = response.css('h3') print(len(h3List)) del h3List[len(h3List) - 3:len(h3List)] print(le...

2019-04-08 10:29:49 1038 1

原创 python Scrapy Itempipline 到底实在什么时候被调用?

python Scrapy Itempipline 到底实在什么时候被调用 最近在写毕设,用到了Scrapy ,爬取一个url的时候,dubug能执行自定义的PipLine,把一条item存到数据库,但是当我爬取多个url时,发现,要等到start_url中的url全部爬取完毕才会最后去执行保存到数据库的操作(也即是pipline里的),执行过程中 刷新数据库不显示新的数据,所有当我开始知道Scr...

2019-04-07 21:17:04 284

原创 C# File的Exists和Create方法,大家看看这么用是不是错的,错在参数是路径,而没有文件名

File.Exists(Application.StartupPath + “\TEMP\SHOW”) var myfile = File.Create(Application.StartupPath + “\TEMP\TRUE”); 我个人认为这是错误的用法,

2018-10-12 13:56:27 1867

原创 本地报表处理期间出错

** * 本地报表处理期间出错 ** 本来在win10 vs 2013下开发的rdlc报表程序,开发机运行没问题,到了目标机xp的系统上报出以上错误,网上看了很多方法,希望都有大神帮忙; ...

2018-10-08 17:15:39 1133

DotNET4.0报表发布必备文件

里面包含4个dll文件,都是rdlc必备的,整理一下也不必去c盘copy

2018-10-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除