自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 python3爬虫实战01--爬取简单文字内容

20200205调用BeautifulSoup和requests库爬取网页内容import requestsfrom bs4 import BeautifulSoupdef crawle(): url = 'https://www.kanunu8.com/book3/7474/' req = requests.get(url=url) req.encoding =...

2020-02-05 22:08:40 455

原创 利用kettle解决excel数据量过大卡顿问题

excel输入excel输入可以有两种方式①是csv;②是xls。由于xls的行数不够,所以我一般用的csv输入需要注意的点是:①:注意数据输入的长度和格式,例如:日期格式·百分率·数据类型等等2. 两个excel数据重合①:要想两个excel根据一定的主键将数据组合在一起就需要用到kettle的“排序记录”“记录集连接”需要注意的是:a. 两个excel都要接排序记录,...

2019-03-31 23:01:40 8456

原创 利用pandas简单处理csv文件数据

引入pandasimport pandas as pd导入csv文件,r"不转义,encoding确定编码,nrows读取行数import pandas as pddf=pd.read_csv(r"csv文件地址",encoding='gbk',nrows=5)print(df)求均值df.mean()#求指定列均值df["指定列"].mean()求中位数...

2019-03-19 16:04:24 684

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除