![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
keepggoing
记录自己的成长引擎!
展开
-
用正则表达式+Requests爬取猫眼电影Top100
import json import requests import requests.exceptions import re #返回单页的信息 def get_single_page(url): response = requests.get(url) try: if(response.status_code ==200): retur原创 2018-01-12 21:09:37 · 424 阅读 · 0 评论 -
爬取今日头条图片
用requests+正则表达式+BeautifulSoup爬取今日头条的美图! import json import os import pymongo import requests import requests.exceptions import re from bs4 import BeautifulSoup from hashlib import md5 from test.confi原创 2018-01-16 01:22:29 · 593 阅读 · 0 评论 -
爬取淘宝美食信息
用selenium+pyquery爬取淘宝美食的搜索信息,并用mongodb存储! from selenium import webdriver from selenium.common.exceptions import TimeoutException from selenium.webdriver.common.by import By from selenium.webdriver.su原创 2018-01-16 21:36:10 · 438 阅读 · 0 评论 -
Python3生成一个exe文件
首先,必须安装pyinstaller pip install pyinstaller 接着在项目目录下运行 pyinstaller -w --onefile main.py 其中的-w是不弹出输出框的意思,你也可以指定弹出输出框 --console...原创 2018-11-01 15:25:33 · 597 阅读 · 0 评论 -
Linux的nohup命令重定向日志文件
使用如下 nohup python3 -u autocheck.py > amazon.log 2>&1 &原创 2018-11-01 15:27:44 · 895 阅读 · 0 评论