无脑的Python笔记
哎,学点Python吧,大数据必备
嘻嘻哈哈Man
这个作者很懒,什么都没留下…
展开
-
爬虫-最好大学
import bs4import requestsfrom bs4 import BeautifulSoupdef getHTMLTEXT(URL): #将URL信息爬取出来 try: r = requests.get(URL,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except:原创 2020-07-21 17:54:46 · 127 阅读 · 0 评论 -
记录-爬虫
爬取考古文物信息和图片代码import osimport bs4import requestsimport refrom bs4 import BeautifulSoup#文本信息保存在test.txtfrom lxml import htmldef look_img(i): # 抓取图片地址 # 抓取img标签 img_src = soup.findAll("img") n = 1 url_img = [] # 保存需要爬取图片的地址原创 2020-07-21 17:08:50 · 160 阅读 · 0 评论 -
python爬取网站图片url并保存在本地文件夹
import osimport requestsfrom bs4 import BeautifulSoupimport urllib.requestdef look_img(soup,i): # 抓取图片地址 # 抓取img标签 img_src = soup.findAll("img") n = 1 url_img = [] # 保存需要爬取图片的地址 for img in img_src: n = n + 1原创 2020-07-21 17:07:36 · 2690 阅读 · 0 评论 -
爬虫--requests、BeautifulSoup入门
1、通过关键字进行搜索import requests#百度关键词搜索https://www.baidu.com/s?wd=keywordkv = {'wd':'Python'}header = {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9'} #添加Accept跳过百度验证原创 2020-06-28 17:17:40 · 169 阅读 · 0 评论 -
Python组合数据类型
1、列表通常使用[ ]将数据 包裹起来创建一个列表。这种 创建方式适用于对于列表中元素个数及其数值已知时。列表中的元素的数据类型可以各不相同,列表中的元素也可以是列表1.1 列表的遍历list1=["string",23,[1,10]]#1for L in list1: print(L)#2for i in range(len(list1)): print(list1[i])1.2 替换列表和字符串不同,列表是可变的,可以在列表中指定下标的值对元素进行修改1.3 增原创 2020-06-23 18:32:09 · 3776 阅读 · 1 评论 -
Python编码风格
下面是应该遵守主要的规则: 使用space(空格)来表示缩进,而不要用tab(制表符)表示。和语法相关的每一层缩进都用4个空格来表示。每行的字符数不应超过79。 采用ASCII或UTF-8编码文件。对于占据多行的长表达式来说,除了首行之外的其余各行,它都应该在通常的缩进级别之上再加4个空格。文件中的函数与类之间应该用两个空行隔开。不要在行尾加分号,也不要用分号将两条命令放在同一行。在同一个类中,各方法之间应该用一个空行隔开。在使用下标来获取列表元素、调用函数或给..原创 2020-06-22 11:56:52 · 180 阅读 · 0 评论 -
数据类型
1、浮点类型1.1浮点数int()函数可以将浮点数转换成整数,返回整数部分;round()函数将小数四舍五入;math.floor()函数向下取整,math.ceil()函数向上取整;浮点数的小数表示(分子和分母形式)可是使用float.as_integer_ratio(x)方法获取;使用float.hex()方法,可以将浮点数以十六进制形式表示为字符串,相反的装换可以使用float.fromhex()实现。1.2复数复数由实数部分和虚数部分组成,一般形式为x+yj。复数原创 2020-06-22 11:50:27 · 214 阅读 · 0 评论