自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据分析初体验2-pandas1

Series 创建# 由nparray直接创建s = pd.Series(np.random.rand(5))# 由字典创建dic = {'a':1 ,'b':2 , 'c':3, '4':4, '5':5}s = pd.Series(dic)# 由list 或nparry 和index创建s = pd.Series(arr, index = ['a','b','c','d','...

2020-05-08 16:36:10 133

原创 数据分析初体验1-numpy2

numpy 读取csv文件with open(url,encoding = 'utf-8') as f: data = np.loadtxt(f) print(data[:5]链接: python利用numpy模块读取csv文件.lambda函数链接: 详解lambda函数.max比较重的lambda用法函数形式:max( x ,key=lambda a : b ) ...

2020-04-22 20:44:20 197

原创 数据分析初体验1-numpy1

导入和初始化import numpy as npdata = [1,2,3,4,5,3]arr = np.array(data)一些重要(或不重要)的属性arr.itemsize # 查看arr每个元素的大小(所占空间)arr.dtype # 查看arr中元素的数据格式arr.shape # 查看arr的行列数(也可以是三维或多维)arr.size # 查看arr的大小(行*列)...

2020-04-19 08:52:02 369

原创 爬虫初体验2:requests+xpath

流程获取网络源赋值url制作headers req = requests.get()获取 htm = req.text获得html格式字符串线程关闭可参考链接: link.xpath匹配初始化tree = etree.HTML(html)匹配result = etree.xpath('//html//body')for div in result: ...

2020-04-14 22:17:06 149

原创 爬虫初体验1:requests+re

流程获取网络源导入requests和re给url变量赋值,记得准备好headersreq = requests.get(url,headers = headers)获得网页内容,html = req.text 获得html格式的网页内容为了反扒,或许还要对线程进行关闭。s = request.session()s.keep_alive = False正则表达式匹配patte...

2020-04-14 21:53:40 161

原创 etree学习纪要1

一、初始化及逆运算代码# 初始化result = etree.HTML()# 逆运算shuchu = etree.tostring()print(shuchu.decode('utf-8'))注意点1初始化之后,会自动加上等进行补齐,这一点如果不注意,在应用xpath做匹配时,直接.xpath(‘/div’)就会出错,因为前面已经被偷偷加上了其他父节点。注意点2tostrin...

2020-04-14 20:58:28 204

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除