- 博客(6)
- 收藏
- 关注
原创 大学排名信息爬取
import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return
2017-09-30 16:28:54 430
原创 format函数
format 函数可以接受不限个参数,位置可以不按顺序>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world'>>> "{0} {1}".format("hello", "world") # 设置指定位置'hello world'>>> "{1} {0} {1}".format("hello", "world")
2017-09-30 16:27:35 6976 1
原创 BeautifulSoup0929
补充: 创建Beautiful Soup对象: soup = BeautifulSoup(html, ‘html.parser’)一、Beautiful Soup类基本元素(5):例、<p class="title">...</p><p>...</p>:标签Tag'p':标签名字nameclass="title":属性Attri...
2017-09-29 10:40:19 272
原创 Requests20170928
HTTP协议: URL格式:http://host:port[path] host:合法的Internet主机域名或IP地址 path:请求资源的路径URL是通过HTTP协议存取资源的Internet路径。requests库的主要方法: 1、r = requests.request():构造一个请求,支撑以下各方法的基础方法 2、r = requests.get():获取HTML网页的主要
2017-09-28 22:54:41 204
转载 pandas数据分析0723
import pandas as pdimport numpy as npdf = pd.read_csv(r"C:\Users\Administrator\Desktop\python 0712\DataAnalyst.csv",encoding = 'gb2312')df.head()len(df.positionId.unique())df_duplicates = df.dro
2017-09-28 14:44:24 316
原创 淘宝商品数据爬取
import requestsimport redef getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text exc
2017-09-28 14:40:51 1960
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人