linkedin_54361233-CSDN博客

原创 chromedriver executable needs to be in PATH”亲测有效解决

Anaconda环境下，把chrome driver 放在Anaconda的script 文件夹里添加一行代码CHROME_PATH=“c:/Users/…/anaconda/scripts/chromedriver”

2022-04-11 22:34:19 676

原创 Not recognized as the name

亲测有效，have met same issue when I install Python, and it is resolved when I set a PATH in system, here are the steps. Navigate to “Control Panel” -> “System”Click “Advanced system settings” on the leftClick “Environment Variables”Search and click “Pat

2022-01-20 10:14:21 362

原创安装pillow成功后仍然报错亲测有效

安装pillow成功后仍然报错 cannot find module PIL 亲测有效卸载Pillow与PIL 重新安装Pillowpip uninstall Pillowpip uninstall PILpip install Pillow

2021-08-16 07:52:01 376 1

原创 2021-05-29

爬虫4—find和find_allfind 返回的对象类型是tagfind_all 返回的数据类型是resultsettag型数据中包含text，所以可以直接从find的结果中打印出textresultset型数据中不包含text，所以用find_all的结果直接打印text会报错解决方法是，从 resultset结果中进一步提取tagitem_1=find_all（“标签”）item_1_1=item_1［0］print（item_1_1.text）出现报错时可以打印出错的数据类型来寻

2021-05-29 19:53:38 51

原创 2021-05-23

爬虫3—JSON转换数据requests直接提取出的是字符串，无法进行下一步的查找处理。需要用JSON把requests的数据转换成字典格式，进行下一步查找import requestsres_名称=requests.get(“URL”)json_名称=res_名称.json()list_名称=json_名称[“字典键名称外”][“名称中”][“名称内”]#一层一层取到需要的位置为止for x in list_名称:…print(x[“字典键名称”]）...

2021-05-23 16:18:13 44

原创 2021-05-17

爬虫2—提取数据 beautifulsouppip install bs4bs = BeautifulSoup(解析文本,解析器)解析文本必须是字符串格式解析器一般用"html.parser"

2021-05-17 20:57:46 70

原创 2021-05-15

## 爬虫笔记1—保存到本地import requestsfrom kkb_tools import open_fileres =requests.get(’ ')html=res.textk= open(‘文件名’, a+)k.write(html)k.close()open_file(‘文件名’)

2021-05-15 20:43:32 70

原创 2021-04-17

Pands 笔记十–数据清洗和分析应用查看数据情况data.info()删除有缺失数据的行或列data.drop([" "],axis=1/0, inplace=True)删除含有nan的数据data.dropna(inplace=True)删除重复数据先计算重复数据有多少条print (len(data.duplicated()[data.duplicated()==True]))删除重复data.drop_duplicates(inplace=True)整理数据把数值部分拆分出

2021-04-17 13:51:52 47

原创 2021-04-04

Pandas笔记九–绘制双Y轴需要用ax先绘制单Y轴图再用twinx()添加第二条Y轴设置边框颜色及原点位置spines[].set_color.set_position

2021-04-04 10:47:09 76

原创 2021-04-01

Pandas 笔记九–画图表柱形图 plt.bar(x, height,width,color)plt.text(x,y,s,ha,va)可以为每个柱形标注高度get_x() get_width() get_height() 可以拿到高度x值等eg,for rect infects:height=rect.get_height()plt.text(text.get_x()+text.get_width()/2,height+0.3, str(height), ha=“center”)直方图

2021-04-01 20:14:15 60

原创 2021-03-28

Pandas 笔记八–简单画图matplotlib添加中文字体

2021-03-28 19:36:22 36

原创 2021-03-14

##Pandas笔记七计算并返回多个变量把分组后的标签放入一个列表然后根据此列表定位计算所需的统计数据

2021-03-14 21:05:54 53

原创 2021-03-14

pandas笔记六–多层索引创建多层索引pd.MultiIndex.from_product([index1, index2])1>2由外层到内层index=pd.MultiIndex.from_product([‘exam’,‘names’])

2021-03-14 10:53:19 74

原创 2021-03-12

pandas 笔记五–分组及统计分组后数据groupby分组查看分组后每组数据的情况分组后一次用多个方式统计，agg插入自己的函数，注意插入时不不字符串用变不用担心

2021-03-12 21:00:10 47

原创 2021-03-10

提取含有某个字段的数据contains（）bools=df[‘列名’].str.contains(‘字段名’)根据选择出的内容排序df=df[bools].sort_values(by=’ ', ascending=False)

2021-03-10 20:33:45 40

原创 2021-03-10

排序 dataframesort_valuesdf= pd.read_csv(’/. ')df.sort_values(by=‘country code’, ascending=False, inplace=True)sort_index需要在读取时先设定标签df= pd.read_excel(’/. ', index_col=‘coutry code’)df.sort_index(inplace= True, ascending=True)...

2021-03-10 19:17:44 52

原创 2021-03-08

根据某列的值进行筛选bool1= df [列名]>100bool2= df[列名]>10df2=df[bool1&bool2]

2021-03-08 21:46:26 56

原创 2021-03-08

运行script.py 的script要在cmd里运行。具体步骤先把需要运行的文件放入Python安装的同一个文件夹打开cmd输入 powershell输入 Python 需要运行的派森文件名

2021-03-08 20:21:01 53

linkedin_54361233的博客

原创 chromedriver executable needs to be in PATH”亲测有效解决

原创 Not recognized as the name

原创安装pillow成功后仍然报错亲测有效

原创 2021-05-29

原创 2021-05-23

原创 2021-05-17

原创 2021-05-15

原创 2021-04-17

原创 2021-04-04

原创 2021-04-01

原创 2021-03-28

原创 2021-03-14

原创 2021-03-14

原创 2021-03-12

原创 2021-03-10

原创 2021-03-10

原创 2021-03-08

原创 2021-03-08

空空如也

空空如也