- 博客(5)
- 收藏
- 关注
原创 我的pyhon数据分析之路(3)——Pandas数值运算的方法
数值运算即:对pandas里的数据进行加减乘除运算和高级函数运算。 当使用sub、add等通用函数运算时,panda的索引(index)有两个特点:(1)保留索引和列标签 (2) 索引自动对齐 特点1:索引的保留` 我们通过一个series列子演示: rng=np.random.RandomState(42) ser = pd.Series(rng.randint(0,10,4)) 0 6 ...
2019-04-27 22:08:38
595
原创 我的pyhon数据分析之路(2)——series和datafram的数据选择
Series的数据选择 data = pd .Series([0.25,0.5,0.75,1],index=['a','b','c','d']) a 0.25 b 0.50 c 0.75 方法1:将series 看作字典,通过index进行索引 print(data['a':'c']) b 0.50 c 0.75 方法2:根据行数进行切片,即隐式索引 print...
2019-04-12 23:05:47
153
原创 我的python数据分析之路(1)——Series和Dataframe创建
Series Series是一种一维的数组,由一组数据(numpy数据类型)和一组索引构成。 pd.Series([2,4,6]) 0 2 1 4 2 6 #0,1,2 为index,可以通过series.index查看 #2,4,6为值,可以通过series.values查看 print(s1.index) RangeIndex(start=0, stop=3, step...
2019-04-12 22:01:54
538
原创 使用reques+正则表达式t爬取猫眼电影
import requests from requests.exceptions import RequestException import re import json 获取top100的html代码 status_code 网页状态码,200表示正常打开网页 def get_one_page(url): try: response=requests.get(ur...
2018-09-12 13:20:49
202
原创 nurllib.request 爬取猫眼top100
加载必要模块 import urllib.request import re import json 定义一个函数爬取网页,offset参数为网页页码参数 def main(offset): 设立爬虫网址 url='http://maoyan.com/board/4?offset='+str(offset) 设立headers,模拟浏览器 headers={'Us...
2018-08-18 00:02:11
265
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人