自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 我的pyhon数据分析之路(3)——Pandas数值运算的方法

数值运算即:对pandas里的数据进行加减乘除运算和高级函数运算。 当使用sub、add等通用函数运算时,panda的索引(index)有两个特点:(1)保留索引和列标签 (2) 索引自动对齐 特点1:索引的保留` 我们通过一个series列子演示: rng=np.random.RandomState(42) ser = pd.Series(rng.randint(0,10,4)) 0 6 ...

2019-04-27 22:08:38 595

原创 我的pyhon数据分析之路(2)——series和datafram的数据选择

Series的数据选择 data = pd .Series([0.25,0.5,0.75,1],index=['a','b','c','d']) a 0.25 b 0.50 c 0.75 方法1:将series 看作字典,通过index进行索引 print(data['a':'c']) b 0.50 c 0.75 方法2:根据行数进行切片,即隐式索引 print...

2019-04-12 23:05:47 153

原创 我的python数据分析之路(1)——Series和Dataframe创建

Series Series是一种一维的数组,由一组数据(numpy数据类型)和一组索引构成。 pd.Series([2,4,6]) 0 2 1 4 2 6 #0,1,2 为index,可以通过series.index查看 #2,4,6为值,可以通过series.values查看 print(s1.index) RangeIndex(start=0, stop=3, step...

2019-04-12 22:01:54 538

原创 使用reques+正则表达式t爬取猫眼电影

import requests from requests.exceptions import RequestException import re import json 获取top100的html代码 status_code 网页状态码,200表示正常打开网页 def get_one_page(url): try: response=requests.get(ur...

2018-09-12 13:20:49 202

原创 nurllib.request 爬取猫眼top100

加载必要模块 import urllib.request import re import json 定义一个函数爬取网页,offset参数为网页页码参数 def main(offset): 设立爬虫网址 url='http://maoyan.com/board/4?offset='+str(offset) 设立headers,模拟浏览器 headers={'Us...

2018-08-18 00:02:11 265

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除