- 博客(14)
- 收藏
- 关注
原创 html操作
import asynciofrom pyppeteer import launchimport pandas as pdimport openpyxlwidth, height = 1366, 768 # 固定好页面大小#时间,取昨天import datetimetoday = datetime.date.today() #今天日期yes=today - datetime.timedelta(days=1)yes=yes.strftime('%Y/%m/%d')yester
2021-10-10 17:52:43 128
原创 pandas取时间
#时间,取昨天import datetimetoday = datetime.date.today() #今天日期yes=today - datetime.timedelta(days=1) #减掉一天昨天yes=yes.strftime('%Y/%m/%d') #日期格式
2021-10-10 17:45:57 664
原创 pyppeteer、asyncio解决淘宝免验证自动登录
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-09-29 22:30:00 1057 2
原创 numpy笔记之数值的修改
大于小于等于,筛选print(t2)print(t2<10)t2[t2<10]=3 #t2中数值小于10的赋值为3print(t2[t2>20]) #大于20的值显示出来三元运算符np.where(t<10,0,10) # 值小于10,赋值为0,否则赋值为10裁剪clipt.clip(10,18)#小于10的替换为10,大于18替换为18...
2021-09-26 00:08:30 174
原创 pandas笔记之取值
取连续多行例如以下,舍弃0,1行:代表取到最后一行t1[2:]取数t2[x,y] #x代表横线下标,y代表纵向下标t2[:,0] #代表第一列t2[:,5] #代表第六列取多列x取:,证明是下标x从0开始y取2:,证明下标y从2开始则(0,2),(0,3),(0,4)…(1,2),(1,3),(1,4 )…(2,2) ……t2[:,2:] #第二列后面取多行多列#取第三行到第五行t2[2:5,:]#第二列到第四列t2[:,1:4]#取第三行到第五行
2021-09-25 23:33:51 123
原创 UA伪装,携带参数发起requests请求
请求载体的身份标识import requestsheaders={ 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36"}
2021-09-24 14:02:17 325
原创 百度页面爬取
import requestsresponse=requests.get("https://www.baidu.com/")page_text=response.textwith open('./badu.html','w',encoding='utf-8') as fp: fp.write(page_text)print('爬取数据成功')
2021-09-24 13:21:57 117
原创 python爬取王者荣耀皮肤集
依赖库导入from selenium import webdriverfrom bs4 import BeautifulSoup as bsfrom lxml import etree获取网页源代码driver = webdriver.Chrome('D:\\数据分析\\chromedriver_win32\\chromedriver.exe') #下载好对应chromedriver.exedriver.get('https://pvp.qq.com/web201605/herolist.sh
2021-09-23 00:00:35 413
原创 数据分析--淘宝用户消费
数据来源https://www.heywhale.com/mw/project/612e43d08608050017ffbecd/dataset提取周数据import pandas as pddf = pd.read_excel('D:\\hospital\\datas\\data2.xlsx')#取在2020-04-24到2020-04-30时间内的数据open_day='2020-04-24'close_day='2020-04-30'con1=df['event_time']&g
2021-09-14 11:42:23 529
原创 2020东京奥运会奖牌排行--数据可视化
爬取数据11、数据来源:https://2020.cctv.com/medal_list/index.shtml数据为下面图片的表格数据2、具体代码2.1需要提前下载好的pip install 库名from selenium import webdriverimport lxml.htmlimport csv2.2获取网页完整代码#自动打开chrome,获取代码driver = webdriver.Chrome('D:\\数据分析\\chromedriver_win32\\chrom
2021-09-10 02:24:24 5115 3
原创 python 读取.xlsx
import pandas as pd #pip install pandasl=pd.read_excel('nations.xlsx') #文件读取print(l.head()) #打印前5项
2021-09-04 13:08:08 155
原创 CSV格式转换为xlsx格式
1、把 file.csv用记事本打开2、另存为file.csv保存类型选择所有文件编码选择ANSI保存3、双击直接打开file.csv另存为保存类型直接选择.xlsx
2021-09-04 11:18:25 4820
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人