![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
xzhanxiang
这个作者很懒,什么都没留下…
展开
-
xlsx合并去重
写的原因是因为我们处理组的小伙伴来问我,然后看他们的操作特别的麻烦,于是写了一个xlsx的合并去重,好了不废话了,下面开始进入主题 引入pands 没有的可以直接pip install pandas import pandas as pd import os # 这个放的是文件的路径,写的时候自己也可以用代码自己指定,我这里就不写了 excel_dir = r'' os.chdir(excel_dir) li = [] for i in os.listdir(excel_dir): li.appen原创 2021-06-22 18:05:48 · 303 阅读 · 0 评论 -
当写爬虫遇到表格的时候
这里时遇到的页面的表格这一类型的都可以的,不多说下面我们引入pandas ```python 在这里插入代码片 import pandas as pd a = [] try: #防止一个文本中是一个大的table标签在内,这样去循环tr的标签,更加准确的拿到数据 for i in range(0, 20): df = pd.read_html(url, header=0, skiprows=i) for i in df: #这里是把里面的数据转化原创 2020-07-08 16:40:39 · 246 阅读 · 0 评论