python暴力破解excel_使用 Python 读写 Excel 文件（一）

最新推荐文章于 2024-08-09 10:08:26 发布

靳晓楠

最新推荐文章于 2024-08-09 10:08:26 发布

阅读量810

点赞数

本文链接：https://blog.csdn.net/weixin_32392867/article/details/114438984

版权

本文介绍了如何使用Python的openpyxl模块来读写Excel文件。通过示例展示了创建并保存Excel文件的过程，以及如何将豆瓣TOP250电影数据抓取并保存到Excel中。

摘要由CSDN通过智能技术生成

项目要求

如果说是 Office 办公软件使得 Windows 成为主流的操作系统，那么 Excel 就是使得微软硬起来的法宝！

Word 和 PowerPoint 都有不相上下的对手，但 Excel 几乎是无法被取代的，因为这玩意儿确实太逆天了，它甚至让一向自命不凡的苹果用户都纷纷拜倒。

有人说 “对职场人而言，掌握 Excel，其实是在解放自己；对企业家而言，了解 Excel，其实是在赢得先机。

没错，Excel 就是这么吊。

作为程序猿，我们也离不开 Excel。

从网页爬下来的海量数据可以用 Excel 清洗过滤，成堆的实验数据也可以用 Excel 进行分析……

当然，大家不要想歪了，咱今天的课程不是教大家 Excel 怎么玩？

而是讲如何使用 Python 来操作 Excel！

要求：使用 python 读写 Excel 文件。

开发思路

得益于前人的辛勤劳作，Python 处理 Excel 已有很多现成的 “轮子”

openpyxl 模块的使用。关于这个模块的详细用法，大家可以参考 ->openpyxl 模块中文文档

openpyxl 模块简单易用、功能广泛，单元格格式/图片/表格/公式/筛选/批注/文件保护等功能应有尽有，图表功能是其一大亮点。

思路一：安装 openpyxl 模块

打开 cmd 命令行窗口，输入pip install openpyxl命令即可 “一键安装”：

12.png (158.21 KB, 下载次数: 2)

2018-1-30 00:28 上传

注：如果当前环境下安装有多个版本的 Python，请确保 pip 命令对应的 Python 版本(参见 ->如何让多个版本的 Python 和谐共处)

打开 IDLE，执行import openpyxl语句，如果没有报错，那就说明成功安装啦：

13.png (25.51 KB, 下载次数: 3)

2018-1-30 00:28 上传

思路二：创建并保存 Excel 文件

调用 openpyxl.Workbook() 生成一个 Workbook 的实例化对象，这个就代表一个工作簿(就是一个 Excel 文件)：

[Python] 纯文本查看复制代码import openpyxl

wb = openpyxl.Workbook()

# 获取活跃的工作表

ws = wb.active

# 数据可以直接赋值给单元格

ws['A1'] = 520

# 可以整行添加

ws.append([1, 2, 3])

# Python 类型将自动转换

import datetime

ws['A3'] = datetime.datetime.now()

# 保存文件

wb.save("demo.xlsx")

上面代码依次敲完之后，我们可以在 IDLE 所在的文件夹中找到一个叫做 “demo.xlsx” 的 Excel 文件。

打开之后内容如下：

14.png (16.64 KB, 下载次数: 2)

2018-1-30 00:29 上传

思路三：将豆瓣 TOP250 电影排行榜保存为 Excel 文件

《豆瓣TOP250电影排行榜》文本文件：

这也没什么问题，但如果现在要你从这 250 部电影中按评分进行排序，那估计又是一场头脑风暴了……

虽然用 Python 可以实现，但在 Excel 上就是点几下鼠标的操作

[Python] 纯文本查看复制代码import requests[/font]

[font=宋体]import bs4[/font]

[font=宋体]import re[/font]

[font=宋体]import openpyxl[/font]

[font=宋体]def open_url(url):[/font]

[font=宋体] # 使用代{过}{滤}理[/font]

[font=宋体] # proxies = {"http": "127.0.0.1:1080", "https": "127.0.0.1:1080"}[/font]

[font=宋体] headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}[/font]

[font=宋体] # res = requests.get(url, headers=headers, proxies=proxies)[/font]

[font=宋体] res = requests.get(url, headers=headers)[/font]

[font=宋体] return res[/font]

[font=宋体]def find_movies(res):[/font]

[font=宋体] soup = bs4.BeautifulSoup(res.text, 'html.parser')[/font]

[font=宋体] # 电影名[/font]

[font=宋体] movies = [][/font]

[font=宋体] targets = soup.find_all("div", class_="hd")[/font]

[font=宋体] for each in targets:[/font]

[font=宋体] movies.append(each.a.span.text)[/font]

[font=宋体] # 评分[/font]

[font=宋体] ranks = [][/font]

[font=宋体] targets = soup.find_all("span", class_="rating_num")[/font]

[font=宋体] for each in targets:[/font]

[font=宋体] ranks.append(each.text)[/font]

[font=宋体] # 资料[/font]

[font=宋体] messages = [][/font]

[font=宋体] targets = soup.find_all("div", class_="bd")[/font]

[font=宋体] for each in targets:[/font]

[font=宋体] try:[/font]

[font=宋体] messages.append(each.p.text.split('\n')[1].strip() + each.p.text.split('\n')[2].strip())[/font]

[font=宋体] except:[/font]

[font=宋体] continue[/font]

[font=宋体] result = [][/font]

[font=宋体] length = len(movies)[/font]

[font=宋体] for i in range(length):[/font]

[font=宋体] result.append([movies[i], ranks[i], messages[i]])[/font]

[font=宋体] return result[/font]

[font=宋体]# 找出一共有多少个页面[/font]

[font=宋体]def find_depth(res):[/font]

[font=宋体] soup = bs4.BeautifulSoup(res.text, 'html.parser')[/font]

[font=宋体] depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text[/font]

[font=宋体] return int(depth)[/font]

[font=宋体]def save_to_excel(result):[/font]

[font=宋体] wb = openpyxl.Workbook()[/font]

[font=宋体] ws = wb.active[/font]

[font=宋体] ws['A1'] = "电影名称"[/font]

[font=宋体] ws['B1'] = "评分"[/font]

[font=宋体] ws['C1'] = "资料"[/font]

[font=宋体] for each in result:[/font]

[font=宋体] ws.append(each)[/font]

[font=宋体] wb.save("豆瓣TOP250电影.xlsx")[/font]

[font=宋体]def main():[/font]

[font=宋体] host = "https://movie.douban.com/top250"[/font]

[font=宋体] res = open_url(host)[/font]

[font=宋体] depth = find_depth(res)[/font]

[font=宋体] result = [][/font]

[font=宋体] for i in range(depth):[/font]

[font=宋体] url = host + '/?start=' + str(25 * i)[/font]

[font=宋体] res = open_url(url)[/font]

[font=宋体] result.extend(find_movies(res))[/font]

[font=宋体] '''[/font]

[font=宋体] with open("test.txt", "w", encoding="utf-8") as f:[/font]

[font=宋体] for each in result:[/font]

[font=宋体] f.write(each)[/font]

[font=宋体] '''[/font]

[font=宋体] save_to_excel(result)[/font]

[font=宋体] [/font]

[font=宋体]if __name__ == "__main__":[/font]

[font=宋体] main()

程序实现如下：

1111.png (255.36 KB, 下载次数: 2)

2018-1-30 00:30 上传

如果现在要你从这 250 部电影中按评分进行排序，应该如何做呢？

附件：

中央纪委python1.rar

(40.35 KB, 下载次数: 50)

2018-1-30 00:31 上传

点击文件名下载附件

下载积分: 吾爱币 -1 CB

多多评分，刷起你们手中鲜花

靳晓楠

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫