- 博客(18)
- 收藏
- 关注
原创 chromedriver executable needs to be in PATH”亲测有效解决
Anaconda环境下, 把chrome driver 放在Anaconda的script 文件夹里添加一行代码CHROME_PATH=“c:/Users/…/anaconda/scripts/chromedriver”
2022-04-11 22:34:19
676
原创 Not recognized as the name
亲测有效,have met same issue when I install Python, and it is resolved when I set a PATH in system, here are the steps. Navigate to “Control Panel” -> “System”Click “Advanced system settings” on the leftClick “Environment Variables”Search and click “Pat
2022-01-20 10:14:21
362
原创 安装pillow成功后仍然报错 亲测有效
安装pillow成功后仍然报错 cannot find module PIL 亲测有效卸载Pillow与PIL 重新安装Pillowpip uninstall Pillowpip uninstall PILpip install Pillow
2021-08-16 07:52:01
376
1
原创 2021-05-29
爬虫4—find和find_allfind 返回的对象类型是tagfind_all 返回的数据类型是resultsettag型数据中包含text, 所以可以直接从find的结果中打印出textresultset型数据中不包含text,所以用find_all的结果直接打印text会报错解决方法是,从 resultset结果中进一步提取tagitem_1=find_all(“标签”)item_1_1=item_1[0]print(item_1_1.text)出现报错时可以打印出错的数据类型来寻
2021-05-29 19:53:38
51
原创 2021-05-23
爬虫3—JSON转换数据requests直接提取出的是字符串,无法进行下一步的查找处理。需要用JSON把requests的数据转换成字典格式,进行下一步查找import requestsres_名称=requests.get(“URL”)json_名称=res_名称.json()list_名称=json_名称[“字典键名称外”][“名称中”][“名称内”]#一层一层取到需要的位置为止for x in list_名称:…print(x[“字典键名称”])...
2021-05-23 16:18:13
44
原创 2021-05-17
爬虫2—提取数据 beautifulsouppip install bs4bs = BeautifulSoup(解析文本,解析器)解析文本必须是字符串格式解析器一般用"html.parser"
2021-05-17 20:57:46
70
原创 2021-05-15
## 爬虫笔记1—保存到本地import requestsfrom kkb_tools import open_fileres =requests.get(’ ')html=res.textk= open(‘文件名’, a+)k.write(html)k.close()open_file(‘文件名’)
2021-05-15 20:43:32
70
原创 2021-04-17
Pands 笔记十–数据清洗和分析应用查看数据情况data.info()删除有缺失数据的行或列data.drop([" "],axis=1/0, inplace=True)删除含有nan的数据data.dropna(inplace=True)删除重复数据先计算重复数据有多少条print (len(data.duplicated()[data.duplicated()==True]))删除重复data.drop_duplicates(inplace=True)整理数据把数值部分拆分出
2021-04-17 13:51:52
47
原创 2021-04-04
Pandas笔记九–绘制双Y轴需要用ax先绘制单Y轴图再用twinx()添加第二条Y轴设置边框颜色及原点位置spines[].set_color.set_position
2021-04-04 10:47:09
76
原创 2021-04-01
Pandas 笔记九–画图表柱形图 plt.bar(x, height,width,color)plt.text(x,y,s,ha,va)可以为每个柱形标注高度get_x() get_width() get_height() 可以拿到高度x值等eg,for rect infects:height=rect.get_height()plt.text(text.get_x()+text.get_width()/2,height+0.3, str(height), ha=“center”)直方图
2021-04-01 20:14:15
60
原创 2021-03-14
pandas笔记六–多层索引创建多层索引pd.MultiIndex.from_product([index1, index2])1>2由外层到内层index=pd.MultiIndex.from_product([‘exam’,‘names’])
2021-03-14 10:53:19
74
原创 2021-03-12
pandas 笔记五–分组及统计分组后数据groupby分组查看分组后每组数据的情况分组后一次用多个方式统计,agg插入自己的函数,注意插入时不不字符串用变不用担心
2021-03-12 21:00:10
47
原创 2021-03-10
提取含有某个字段的数据contains()bools=df[‘列名’].str.contains(‘字段名’)根据选择出的内容排序df=df[bools].sort_values(by=’ ', ascending=False)
2021-03-10 20:33:45
40
原创 2021-03-10
排序 dataframesort_valuesdf= pd.read_csv(’/. ')df.sort_values(by=‘country code’, ascending=False, inplace=True)sort_index需要在读取时先设定标签df= pd.read_excel(’/. ', index_col=‘coutry code’)df.sort_index(inplace= True, ascending=True)...
2021-03-10 19:17:44
52
原创 2021-03-08
根据某列的值进行筛选bool1= df [列名]>100bool2= df[列名]>10df2=df[bool1&bool2]
2021-03-08 21:46:26
56
原创 2021-03-08
运行script.py 的script要在cmd里运行。具体步骤先把需要运行的文件放入Python安装的同一个文件夹打开cmd输入 powershell输入 Python 需要运行的派森文件名
2021-03-08 20:21:01
53
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人