- 博客(12)
- 资源 (4)
- 收藏
- 关注
转载 python scrapy d 去重
1. scrapy对request的URL去重yield scrapy.Request(url, self.parse, dont_filter=False)注意这个参数:dont_filter=False2. Jobs: 暂停,恢复爬虫启用一个爬虫的持久化,运行以下命令:scrapy crawl somespider -s JOBDIR=crawls/somespider-1然后,你就能在任何时...
2018-05-23 15:44:34 422
转载 如何用django框架存放静态图片
首先,创建static文件夹static文件夹与settings.py/urls.py在同级目录。static文件夹下创建css/images/js三个文件夹其次,设置settings.py文件1.INSTALLED_APPS需要加入静态文件的安装: 'django.contrib.staticfiles',INSTALLED_APPS = ( 'django.contrib.auth...
2018-05-20 13:53:06 1857
原创 scrapy 爬取数据递归回掉出错 错误日志【Filtered offsite request to】
爬取zol 网站图片,无法抓取.在 setting.py 文件中 设置 日志 记录等级 LOG_LEVEL= 'DEBUG'LOG_FILE ='log.txt'查看日志 发现报2015-11-07 14:43:43+0800 [meizitu] DEBUG: Filtered offsite request to 'bbs.zol.com.cn': <GET http://bbs.zol....
2018-05-18 19:07:10 481
转载 django项目部署到服务器
如何在阿里云上部署 Django 应用程序概述与目的此帖介绍了如何(利用 Ubuntu 操作系统)在阿里云上启动和部署 Django 应用程序。这两个流程的详细步骤说明如下所述:● 使用阿里云管理控制台启动您的第一个 Linux 实例● 在此实例上安装和部署 Django 应用程序关于 DjangoDjango 是一个用 Python 语言写的开源 Web 框架,可帮助开发人员在构想形成后仅数小时...
2018-05-18 11:02:16 18549 4
原创 天涯数据存入数据库和csv
csv版 完整代码import urllib.requestfrom lxml import etreeimport csvdef tian_url(url): url = url headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like G...
2018-05-17 19:39:46 800
原创 MySQL数据库的连接与数据库的基本操作
一: 导入数据库并连接import pymysql.cursors#链接数据库connect = pymysql.Connect( host='127.0.0.1', port=3306, user='root', passwd='root', db='sz1704', charset='utf8mb4')# print("连接成功")...
2018-05-14 17:48:05 277
原创 多线程练习【赶集】
一: 所要用到的包和常量import urllib.requestfrom queue import Queueimport timeimport threadingfrom lxml import etreequeue = Queue()DOWNLOADER_NUM = 10threads = []url = "http://sz.ganji.com/site/s/_pyt...
2018-05-14 10:50:20 864
原创 python基础正则【糗事】
一: 导入的包和网址请求import urllib.requestimport redef handle_url(url,page): url = url + str(page) headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Ge...
2018-05-14 08:58:14 131
转载 将数据存储成csv格式的文件
读写CSV数据问题你想读写一个CSV格式的文件。解决方案对于大多数的CSV格式的数据读写问题,都可以使用 csv 库。 例如:假设你在一个名叫stocks.csv文件中有一些股票市场数据,就像这样:Symbol,Price,Date,Time,Change,Volume"AA",39.48,"6/11/2007","9:36am",-0.18,
2018-05-09 23:56:54 3724
原创 怎么将数据存储成csv
一:打开编写python程序的软件。二:新建一个python文件,用于编写python程序。三:首先引入python编程需要的包。四:然后就是定义一个列表,用于存放再csv文件里面的数据。五:再然后就是定义存储为csv文件后,列表对应的每一列的列名。六:接着就是使用pandas里面的函数,将已经定义好的列表以及定义好的每一列的名字,整合起来。七:然后
2018-05-08 23:28:00 10986 2
原创 xpath 语法运用实例【爬取智联】
智联招聘网的工作岗位爬取一:页数的处理def zhi_page(url, startpage, endpage): for page in range(startpage, endpage): page = url + str(page) return page二:响应数据的获取import urllib.requestimport url
2018-05-08 21:02:15 653
原创 xpath 语法运用实例【爬取boos】
一:url的处理import urllib.requestfrom lxml import etreedef bo_url(url): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3
2018-05-08 11:22:39 331
csv文件合并.bat
2020-09-02
xpath+helper
2020-03-25
ntp离线安装包 autogen ntpdate ntp
2019-04-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人