Python 学习之路
文章平均质量分 64
七凉可以不悲伤
我是一枚小小的程序猿,但我有一个大大的梦想!
展开
-
Python random 模块详解 sample、randint、shuffle、choice 随机函数
一、random模块简介 Python标准库中的random函数,可以生成随机浮点数、整数、字符串,甚至帮助你随机选择列表序列中的一个元素,打乱一组数据等。 二、random模块重要函数 1 )、random() 返回0 2 )、choice(seq) 从序列seq中返回随机的元素; 3 )、getrandbits(n) 以长整型形式返回n个随机位; 4 )、shuffle转载 2017-11-04 15:20:53 · 7669 阅读 · 0 评论 -
Python 爬虫实战案例 : 微信公众号的爬取
# -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup from requests.exceptions import RequestException import time import random import MySQLdb import threading import socket import ma原创 2017-11-04 11:15:55 · 9317 阅读 · 0 评论 -
Python 爬虫 抓取豆瓣读书TOP250
# -*- coding:utf-8 -*- # author: yukun import requests from bs4 import BeautifulSoup # 发出请求获得HTML源码的函数 def get_html(url): # 伪装成浏览器访问 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win转载 2017-10-30 17:23:47 · 874 阅读 · 0 评论 -
Python 爬虫实战案例 : 煎蛋网全站图片爬虫
import requests import os import time from bs4 import BeautifulSoup import random # 发出请求获得HTML源码 def get_html(url): # 指定一个浏览器头 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64转载 2017-10-31 11:51:37 · 687 阅读 · 0 评论 -
Python 中的json解析
情景:爬虫离不了json的解析,但是目前很多网站中都使用json进行数据传输,动态展现,所以json的解析对于爬虫是很重要的 python解析json的包是json,使用时需要先引入json包 import json 常用的三个函数load(),loads(),dumps() (1)json.loads():传入一个json字符串,返回一个字符串解析出来的list或d转载 2017-10-28 17:05:50 · 1466 阅读 · 1 评论 -
Python 模拟知乎登陆,保存登陆cookie
import requests from bs4 import BeautifulSoup as BS import time from subprocess import Popen # 打开图片 import http.cookiejar import re # 模拟浏览器访问 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6转载 2017-10-28 16:14:35 · 2923 阅读 · 0 评论 -
python 爬虫之 Urllib库的基本使用
官方文档地址:https://docs.python.org/3/library/urllib.html 什么是Urllib Urllib是python内置的HTTP请求库 包括以下模块 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser robots.txt解析模块转载 2017-10-28 14:59:21 · 282 阅读 · 0 评论 -
Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了,我们可以利用它来抓取远程的数据进行保存哦,下面整理了一些关于urllib使用中的一些关于header,代理,超时,认证,异常处理处理方法,下面一起来看看。 python3 抓取网页资源的 N 种方法 1、最简单 import urllib.request res转载 2017-10-28 14:00:06 · 883 阅读 · 0 评论 -
Python 实现简单的爬虫功能: 图片的抓取
#!/usr/python3 import urllib.request # 导入urllib中的request类 import re # 导入 re 模块 主要包含了正则表达式 def gethtml(url): page=urllib.request.urlopen(url) # 用于打开一个URL地址。 html=page.read() # 用于读取URL上的数据,向原创 2017-10-27 10:37:35 · 556 阅读 · 0 评论 -
Python time 模块详解
一、python time 模块的简介 在Python编程语言中,只要涉及到时间日期的操作,就会用到这个time模块。 应用的时候,有2种方式用来表示时间: 1 )、时间戳 2 )、格式化的时间str(字符串) 3 )、元组 (struct_time)以及calendar 二、python time模块函数讲解 要注意的是元组struct_转载 2017-11-04 15:26:34 · 505 阅读 · 0 评论