python
python学习资料
aaakirito
GRIT
展开
-
python进阶爬虫class 2(缓存)
下载缓存通过缓存已经下载好了的url网页,来检查是否有重复下载的情况将网页信息保存在本地磁盘上时,要注意不同操作系统的文件系统的合法字符和最大长度,以确保做到兼容,同时要注意替换后是否会产生同名现象。默认保存的网页名称为路径后的文件名,也可以使用哈希值来保存网页路径。但是也存在着文件名为空的可能性,那么文件名为空的文件默认为index可以同过 urllib.parse 里的 urlsplit(url)方法来实现对url的解析对下载的html网页进行压缩在二进制写文件下:.原创 2020-05-20 09:11:22 · 176 阅读 · 0 评论 -
python进阶爬虫class 2(Lxml)
lxmllxml.html.fromstring(str)将str转为lxml.html.HtmlElement类型的对象lxml.html.tostring(lxml.html.HtmlElement, pretty_print)将lxml.html.HtmlElement转化为str类型lxml使用css选择器tree.cssselect(css)css为选择器中的模式语句,如同re里头的compile此函数返回所有匹配的内容,以list形式存放的是lx...原创 2020-05-13 08:54:45 · 350 阅读 · 0 评论 -
python数据分析基础class 4(IPython的使用(2))
Ipython是一个加强版的python解释器Ipython中大多数Python对象被格式化为更可读、更美观的形式Ipython的补全功能使用<tab>键可以产生补全的效果,默认下不产生以下划线为开头的补全Ipython的内省功能在对象后面加?可以显示对象的具体信息在函数后面加?可以显示函数内部的字符串信息在函数后面加??可以显示函数的源代码...原创 2020-05-06 10:14:44 · 237 阅读 · 0 评论 -
python数据分析基础class 3
原创 2020-05-06 09:18:24 · 152 阅读 · 0 评论 -
python数据分析基础class 2(引力波的绘制)
引力波数据https://www.python123.io/dv/grawave.html# 引力波import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import wavfilerate_h, hstrain = wavfile.re...原创 2020-05-06 09:08:19 · 537 阅读 · 0 评论 -
python进阶爬虫class 1(对基础爬虫的补充)
识别网站所用的技术builtwith库,不一定完美支持python3,且有时会获取不到信息使用builtwith.parse(url)来获取原创 2020-05-03 19:23:42 · 968 阅读 · 1 评论 -
python数据分析基础class 1(图像素描)
图像素描,这里使用一张冷鸟的微博图来做示范import numpy as npfrom PIL import Imagea = np.asarray(Image.open('yousa.jpg').convert('L')).astype(np.float)depth = 12 # (0-100)grad = np.gradient(...原创 2020-04-29 17:05:07 · 206 阅读 · 0 评论 -
scrapy爬取股票信息
这里讨论的股票信息没有隐藏在js当中的方法首先利用终端/cmd生成项目scrapy startproject pythonstocks在进入项目cd pythstocks生成stcok爬虫scrapy genspider stockhq.gucheng.com这时spider里头生成了爬虫的启动文件stocks.py,编写stocks.py# -*- co...原创 2020-04-06 17:06:49 · 720 阅读 · 0 评论 -
requests爬取股票信息
这里讨论的股票信息没有隐藏在js当中的方法主要利用requests来get每个股票的text再交替利用re和bs4来解析text里的信息最后再按照当前的时间来保存股票的信息由于requests的爬取速度慢,可以选择关闭每个界面编码的识别(假设每个界面的编码相同),可以略微提升速度显示了完成的进度状况生成的数据大概在2M左右# 股域网 https://...原创 2020-04-06 16:49:19 · 807 阅读 · 0 评论 -
python爬虫基础class 4(scrapy爬取股价)
stock.py# -*- coding: utf-8 -*-import scrapyimport refrom scrapy.selector import Selectorclass StocksSpider(scrapy.Spider): name = 'stock' start_urls = ['https:...原创 2020-04-06 16:39:20 · 273 阅读 · 0 评论 -
python爬虫基础class 3(爬取京东商品姓名和爬取股票信息)
# 京东笔记本import requestsimport reimport bs4num = 0def getHtmlText(url): try: hd = {'user-agent': 'Mozilla/5.0'} r = requests.get(url, headers=hd, timeout=...原创 2020-04-06 16:29:36 · 531 阅读 · 0 评论 -
python爬虫基础class 2(中国大学排名)
import requestsimport bs4def getdata(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding retur...原创 2020-04-06 16:05:37 · 191 阅读 · 0 评论 -
python爬虫基础class 1(图片视频爬取)
图片###################图片import requestsimport osurl = 'https://www.apple.com/v/macbook-air/f/images/meta/og__wmayxefn276q.png'root = '/Users/yu/Documents/python3/crawler/'path...原创 2020-04-06 14:59:20 · 346 阅读 · 0 评论 -
python基础 class9
原创 2020-03-18 19:52:50 · 94 阅读 · 0 评论 -
python基础 class8(体育竞技分析)
# 体育竞技分析问题import randomdef printIntro(): print('''这个程序模拟两个选手A和B的某种竞技比赛程序运行需要A和B的能力值(以0-1之间的小数表示)''')def getInputs(): a = eval(input('请输入选手A的能力值(0-1):')) b = eva...原创 2020-03-18 19:46:18 · 329 阅读 · 0 评论 -
python基础 class7(自动轨迹绘制、政府工作报告词云)
# coding=utf-8# 自动轨迹绘制# (行进距离,转向判断[0左:1右️],转向角度,[r,g,b]rgb三色道,画笔粗细)import turtle as turfp = open('轨迹.txt', 'r')fp.readline()tur.pendown()tur.setup(1000, 800, 200, 200)for line in f...原创 2020-03-18 17:28:50 · 305 阅读 · 0 评论 -
python基础 class6(基本统计值计算、文本词频统计)
# 不定长度输入def getNum(): nums = [] iNumStr = input('输入数字:') while iNumStr != '': # 空字符结束 nums.append(eval(iNumStr)) iNumStr = input('输入数字:') return n...原创 2020-03-18 17:17:25 · 169 阅读 · 0 评论 -
python基础 class5(七段数码管、科赫雪花)
# 七段数码管import turtleimport timedef drawline(draw): if draw: turtle.pendown() else: turtle.penup() turtle.fd(50) turtle.right(90)def drawdigit(number):...原创 2020-03-18 16:13:53 · 176 阅读 · 0 评论 -
python基础 class4(蒙特卡罗法算圆周率)
from random import randomfrom time import perf_counterDARTS = 10000 * 10000hits = 0.0start = perf_counter()for i in range(1, DARTS + 1): x, y = random(), random() dist=...原创 2020-03-02 16:52:58 · 184 阅读 · 0 评论 -
python基础 class3(动态进度条)
import timescale = 100print('执行开始'.center(scale, '-'))start = time.perf_counter()for i in range(scale + 1): a = '*' * i b = '.' * (scale - i) c = (i / scale) ...原创 2020-03-02 16:43:52 · 190 阅读 · 0 评论 -
python基础 class2 (绘画蟒蛇)
代码# 绘制蟒蛇from turtle import *setup(650, 350, 200, 200)# speed(1)penup()fd(-250)pendown()pensize(25)seth(-40)for i in range(4): circle(40, 80) circle(-40, 80)c...原创 2020-02-19 16:54:10 · 189 阅读 · 0 评论 -
python基础 class1 (温度转换问题)
温度转换代码1(官方)x = input("输入华氏度/摄氏度:")if x[-1] in ['f', 'F']: C = (eval(x[0:-1]) - 32) / 1.8 print("{:.2f}C".format(C))elif x[-1] in ['c', 'C']: F = eval(x[0:-1]) * 1.8 + 32 ...原创 2020-02-19 16:46:39 · 301 阅读 · 0 评论 -
AtCoder Beginner Contest 092 A - Traveling Budget
w=[]for i in range(4): w.append(input())print min(w[0],w[1])+min(w[2],w[3])原创 2018-03-27 15:19:58 · 190 阅读 · 0 评论 -
Codeforces Round #462 (Div. 2) B. A Prosperous Lot
B. A Prosperous Lottime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputApart from Nian, there is a daemon named Sui, which terrifies children and cause...原创 2018-02-18 10:58:22 · 315 阅读 · 0 评论 -
Codeforces Round #462 (Div. 2) A. A Compatible Pair
A. A Compatible Pairtime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputNian is a monster which lives deep in the oceans. Once a year, it shows up on t...原创 2018-02-17 22:59:26 · 214 阅读 · 0 评论 -
CF 1A - Theatre Square
A. Theatre Squaretime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputTheatre Square in the capital city of Berland has a rectangular shape with the siz...原创 2018-02-10 19:48:10 · 211 阅读 · 0 评论 -
python 输入一个数n,求n个数求乘或求和
求和try: while True: n=input() s=1 for x in raw_input().split(): s=s+int(x) print sexcept EOFError: exit()求乘try: while True: n=input() ...原创 2018-02-10 19:51:36 · 19189 阅读 · 0 评论