2017年09月_单明火

11月 10月 09月

原创大学排名信息爬取

import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return

2017-09-30 16:28:54 430

原创 format函数

format 函数可以接受不限个参数，位置可以不按顺序>>>"{} {}".format("hello", "world") # 不设置指定位置，按默认顺序'hello world'>>> "{0} {1}".format("hello", "world") # 设置指定位置'hello world'>>> "{1} {0} {1}".format("hello", "world")

2017-09-30 16:27:35 6976 1

原创 BeautifulSoup0929

补充：创建Beautiful Soup对象： soup = BeautifulSoup(html, ‘html.parser’)一、Beautiful Soup类基本元素（5）：例、<p class="title">...</p><p>...</p>：标签Tag'p'：标签名字nameclass="title"：属性Attri...

2017-09-29 10:40:19 272

原创 Requests20170928

HTTP协议： URL格式：http://host:port[path] host:合法的Internet主机域名或IP地址 path:请求资源的路径URL是通过HTTP协议存取资源的Internet路径。requests库的主要方法： 1、r = requests.request():构造一个请求，支撑以下各方法的基础方法 2、r = requests.get()：获取HTML网页的主要

2017-09-28 22:54:41 204

转载 pandas数据分析0723

import pandas as pdimport numpy as npdf = pd.read_csv(r"C:\Users\Administrator\Desktop\python 0712\DataAnalyst.csv",encoding = 'gb2312')df.head()len(df.positionId.unique())df_duplicates = df.dro

2017-09-28 14:44:24 316

原创淘宝商品数据爬取

import requestsimport redef getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text exc

2017-09-28 14:40:51 1960

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 大学排名信息爬取

原创 format函数

原创 BeautifulSoup0929

原创 Requests20170928

转载 pandas数据分析0723

原创 淘宝商品数据爬取

空空如也

空空如也

原创大学排名信息爬取

原创淘宝商品数据爬取