自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Beyond_F4的博客

清风拂杨柳 , 敢问是段友 ?

  • 博客(14)
  • 收藏
  • 关注

原创 scrapy报错之 ‘’Item does not support field:.......“

scrapy 运行报错  does not support field:xxxxxxx究其原因是因为不需要保存字段,所以在item中没有定义field,只是象征性的写了一个title而在spider中用却到了yield item,系统检测出yield出的变量在item中没有提前定义,所以它是拒绝的正确做法是将需要yield的变量定义在item.py中 然后就可正常运行...

2018-03-29 17:57:24 10554 6

原创 scrapy报错之:XX Spider.parse callback is not defined

好久没用过scrapy,这两天用到了,写了一个爬虫,今天一运行,竟然报错了,突然一下有点摸不着头脑因为用到了linkextractor了,网上搜了半天也没有类似的问题,报错截图spider部分代码截个图然后item、pipline、settings、middware一路检查过去,发现都没有问题,最后 有点想放弃了,出去厕了个所,回来突然眼前一亮,发现原来是爬虫继承的父类没有改,为避免下次再遇到这种...

2018-03-29 11:41:35 8506 7

原创 redhat7环境下配置Python3.6.2的详细过程

公司服务器环境是redhat,因此把自己的也换成了redhat,前前后后、断断续续搞了半个月了,终于搞定了由于redhat系统普遍都是收费版本,个人用户较少,所以网上的相关资料并不是很多,费了老大劲了;(有需要redhat系统镜像文件的请给我留言);1、修改yum源(这样以后下载依赖包就不受redhat限制了):1.1、删除redhat7.0系统自带的yum软件包;rpm -qa| grep yu...

2018-03-28 11:29:10 3619 6

原创 分享几个Python逻辑小题

# 传入一个数组,返回一个新的数组,这个数组是由原始数组中当前位置以外元素乘积构成的# 例如:原始数组:[1,2,3,4]# 新数组:[24,12,8,6]def func(): array = eval(input("输入一个整数数组")) n = len(array) new_array = [] index = 0 for m in array...

2018-03-21 11:46:35 3108

原创 microsoft visual c++ 14.0 is required问题解决办法

最近公司台笔记本,需要配置环境,乍得竟然有点忘了5557pip install Scrapy时出错:error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tool...

2018-03-21 11:45:20 9164 2

翻译 scrapy框架动态切换ua

scrapy爬虫防止被禁止 ,动态切换UA1)新建一个middlewares.py文件,内容如下,文件放在与items.py, settings.py所在的文件夹下。[html] view plain copy#!/usr/bin/python  #-*-coding:utf-8-*-    import random  from scrapy.downloadermiddlewares.user...

2018-03-16 11:09:06 2780

翻译 爬虫突破封禁的6种常见方法

为何大量网站不能抓取?爬虫突破封禁的6种常见方法在互联网上进行自动数据采集(抓取)这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”,有时会把网络数据采集程序称为网络机器人(bots)。最常用的方法是写一个自动化程序向网络服务器请求数据(通常是用 HTML 表单或其他网页文件),然后对数据进行解析,提取需要的信息。 本文假定读者已经了解如何用代码来抓取一个远程的 URL,...

2018-03-15 19:55:16 1988

原创 Centos7安装搜狗拼音

Centos7安装搜狗拼音转自:https://www.cnblogs.com/Yiutto/p/6204085.html方法一:Fedora 19/20/21/rawhide 使用以下命令添加源: # yum install dnf-plugins-core # dnf copr enable mosquito/myrepo # yum localinstall http://download1...

2018-03-14 11:44:14 5687

转载 Centos7安装python3并与python2共存

linux-Centos7安装python3并与python2共存 1.查看是否已经安装PythonCentOS 7.2 默认安装了python2.7.5 因为一些命令要用它比如yum 它使用的是python2.7.5。使用 python -V 命令查看一下是否安装Python然后使用命令 which python 查看一下Python可执行文件的位置可见执行文件在/usr/bin/ 目录下,切换...

2018-03-13 19:46:21 3144

原创 centos7下安装pip3

来源:http://www.th7.cn/Program/Python/201612/1024072.shtml一、添加epel源yum install epel-release二、安装Python3.4,装完再升级吧yum install python34三、安装pip3yum install python34-setuptoolseasy_install-3.4 pip之后就可以使用pip3了...

2018-03-13 19:36:13 2478

原创 centos7下安装pip

1、首先检查linux有没有安装python-pip包,直接执行 yum install python-pip2、没有python-pip包就执行命令 yum -y install epel-release(3)、执行成功之后,再次执行yum install python-pip(4)、对安装好的pip进行升级 pip install --upgrade pip至此,pip工具就安装好了。...

2018-03-13 19:03:46 1953

转载 redhat6.5修改yum源

最近公司要统一开发环境,向服务器靠拢,避免开发环境和和生产环境差异问题造成的冲突,服务器是redhat6.5,因此我们这些用Ubuntu和centos的统统要改,头都大了,查了一圈资料,也就下面的比较实用1.检查yum包 rpm -qa |grep yum 2.删除自带包 rpm -aq | grep yum | xargs rpm -e –nodeps 3.再检查一下 rpm -qa |grep...

2018-03-13 17:29:11 1773

转载 redhat修改yum源

由于redhat商业化,注册才能使用其源,这里用阿里的centos源代替1 .下载CentOS-Base.repo文件 该文件会下载到 /etc/yum.repos.d 这个目录下面wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 2. 将$releaseserve替换为7,...

2018-03-13 17:25:50 2131

转载 redhat6.5修改yum源

最近公司要统一开发环境,向服务器靠拢,避免开发环境和和生产环境差异问题造成的冲突,服务器是redhat6.5,因此我们这些用Ubuntu和centos的统统要改,头都大了,查了一圈资料,也就下面的比较实用1.检查yum包 rpm -qa |grep yum 2.删除自带包 rpm -aq | grep yum | xargs rpm -e –nodeps 3.再检查一下 rpm -qa |grep...

2018-03-12 17:22:30 1854

爬虫基础-第四章-requests

爬虫入门课程-第四章 requests库的使用方法介绍; 简介; 安装; 使用; 一大推请求方式; 基本GET; 带参数的GET请求; Json数据; 获取二进制数据; 添加header; 基本post请求: 请求头; 响应头; 响应状态码; 响应体属性方法;

2022-11-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除