自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 大学排名信息爬取

import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return

2017-09-30 16:28:54 430

原创 format函数

format 函数可以接受不限个参数,位置可以不按顺序>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world'>>> "{0} {1}".format("hello", "world") # 设置指定位置'hello world'>>> "{1} {0} {1}".format("hello", "world")

2017-09-30 16:27:35 6976 1

原创 BeautifulSoup0929

补充: 创建Beautiful Soup对象: soup = BeautifulSoup(html, ‘html.parser’)一、Beautiful Soup类基本元素(5):例、<p class="title">...</p><p>...</p>:标签Tag'p':标签名字nameclass="title":属性Attri...

2017-09-29 10:40:19 272

原创 Requests20170928

HTTP协议: URL格式:http://host:port[path] host:合法的Internet主机域名或IP地址 path:请求资源的路径URL是通过HTTP协议存取资源的Internet路径。requests库的主要方法: 1、r = requests.request():构造一个请求,支撑以下各方法的基础方法 2、r = requests.get():获取HTML网页的主要

2017-09-28 22:54:41 204

转载 pandas数据分析0723

import pandas as pdimport numpy as npdf = pd.read_csv(r"C:\Users\Administrator\Desktop\python 0712\DataAnalyst.csv",encoding = 'gb2312')df.head()len(df.positionId.unique())df_duplicates = df.dro

2017-09-28 14:44:24 316

原创 淘宝商品数据爬取

import requestsimport redef getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text exc

2017-09-28 14:40:51 1960

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除