bingquanweidao-CSDN博客

原创数据分析初体验2-pandas1

Series 创建# 由nparray直接创建s = pd.Series(np.random.rand(5))# 由字典创建dic = {'a':1 ,'b':2 , 'c':3, '4':4, '5':5}s = pd.Series(dic)# 由list 或nparry 和index创建s = pd.Series(arr, index = ['a','b','c','d','...

2020-05-08 16:36:10 133

原创数据分析初体验1-numpy2

numpy 读取csv文件with open(url,encoding = 'utf-8') as f: data = np.loadtxt(f) print(data[:5]链接: python利用numpy模块读取csv文件.lambda函数链接: 详解lambda函数.max比较重的lambda用法函数形式：max( x ,key=lambda a : b ) ...

2020-04-22 20:44:20 197

原创数据分析初体验1-numpy1

导入和初始化import numpy as npdata = [1,2,3,4,5,3]arr = np.array(data)一些重要（或不重要）的属性arr.itemsize # 查看arr每个元素的大小（所占空间）arr.dtype # 查看arr中元素的数据格式arr.shape # 查看arr的行列数（也可以是三维或多维）arr.size # 查看arr的大小（行*列）...

2020-04-19 08:52:02 369

原创爬虫初体验2：requests+xpath

流程获取网络源赋值url制作headers req = requests.get（）获取 htm = req.text获得html格式字符串线程关闭可参考链接: link.xpath匹配初始化tree = etree.HTML(html)匹配result = etree.xpath('//html//body'）for div in result: ...

2020-04-14 22:17:06 149

原创爬虫初体验1：requests+re

流程获取网络源导入requests和re给url变量赋值，记得准备好headersreq = requests.get(url,headers = headers)获得网页内容，html = req.text 获得html格式的网页内容为了反扒，或许还要对线程进行关闭。s = request.session()s.keep_alive = False正则表达式匹配patte...

2020-04-14 21:53:40 161

原创 etree学习纪要1

一、初始化及逆运算代码# 初始化result = etree.HTML（）# 逆运算shuchu = etree.tostring()print(shuchu.decode('utf-8'))注意点1初始化之后，会自动加上等进行补齐，这一点如果不注意，在应用xpath做匹配时，直接.xpath（‘/div’）就会出错，因为前面已经被偷偷加上了其他父节点。注意点2tostrin...

2020-04-14 20:58:28 204

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 数据分析初体验2-pandas1

原创 数据分析初体验1-numpy2

原创 数据分析初体验1-numpy1

原创 爬虫初体验2：requests+xpath

原创 爬虫初体验1：requests+re

原创 etree学习纪要1

空空如也

空空如也

原创数据分析初体验2-pandas1

原创数据分析初体验1-numpy2

原创数据分析初体验1-numpy1

原创爬虫初体验2：requests+xpath

原创爬虫初体验1：requests+re