一:python是什么?
Python是一种高级编程语言,创建它的初衷是为了简化代码编写,使开发者能够更高效地编写软件代码。Python是一门功能强大的语言,被广泛应用于网络编程、数据分析、人工智能等领域。
Python可以用来进行多种编程任务,包括但不限于:
- Web应用开发
- 爬虫开发
- 数据分析和可视化
- 人工智能和机器学习
- 游戏开发
- 自动化任务
二:如何在vscode中调试python?
在VScode中调试Python代码需要安装 Python 插件(Visual Studio Code Marketplace 中搜索 python) 。
安装好之后,选择对应的 python 解释器版本,然后打开 Python 的代码文件,文件右上方的调试按钮即可开始调试。
调试过程中可以设置断点、逐步执行等。
三:Pandas
Pandas 是 Python 语言的一个扩展程序库,用于数据分析。 常用于对excel的操作
1、groupby操作
类似关系型数据库的group分组操作
merged_sum = merged_df.groupby(['供应商', '规格型号'])['数量'].sum().reset_index()
注意点,分组操作后的结果中,只有操作的那些字段。如上语句查到的数据中只有供应商、规格型号、数量3个字段
2、merge操作
类似关系型数据库的join连接操作
# 合并发票和验收表的数量统计,并填充缺失值为 0
pd.merge(invoice_sum, merged_sum, on=['销方名称', '规格型号'], how='outer').fillna(0)
3、pandas删除索引列
output_file_name = f'D:\\x.xlsx'
column_names = ["x"]
df = pd.DataFrame(columns=column_names)
with pd.ExcelWriter(output_file_name, engine='openpyxl') as writer:
df.to_excel(writer, sheet_name='结果',index=False) // 关键在这false
4、让序列列从1开始
merged = merged.reset_index(drop=True)
merged.index += 1
四:Xpath
浏览器调试工具测试Xpath是否正确
$x("//div[@class='x']")
五:报错汇总
1、pd.ExcelFile()报错zipfile.BadZipFile: File is not a zip file
文件可能是python下载的,会导致读不出来
2、文件编辑过后才能读到数据?
readExcel()有时会遇到这种情况,需要管理员身法运行python