Python日常办公小程序——读取并分析aTimeLogger输出的html文件,并使用matplotlib绘制柱状图
项目要求:
日常记录时间所用的APP《aTimeLogger》,发现其目标标签只能显示最近10天数据柱状图(如下图所示),要是可以把所有记录的数据都显示出来,那何不乐哉?
发现该APP支持输出html文件(内容如下),其实完全可以使用Excel来完成数据整理和绘图,但是通过实操发现,这样的操作过程还是比较麻烦的。
那为何不使用Python来帮我自动完成数据的整理和绘图,正所谓人生苦短,我为何不用Python?
通过处理由APP输出的html文件,获取所有的数据,最终结果图如下:
1. 输入要查询的项目编号
2. 自动分析数据并作图
这样一来,如果哪一天我需要获取这样的柱状数据图, 只需要由APP导出html文件,将其重命名后放入程序所在文件夹,运行程序即可轻易搞定,何不乐哉~ 何不悠哉~
项目实现:
本程序所依赖的的模块有BeautifulSoup, matplotlib以及datetime
主体逻辑如下:
def main():
# 检索文件并以类别(学习,工作,睡眠,其他)分割
list_items = []
study, work, sleep, other = [], [], [], []
with open('TestSample.html', 'r', encoding='utf-8') as f:
html = f.read()
soup = BeautifulSoup(html, 'lxml')
for td in soup.select('td'):
if td.get_text() != '':
list_items.append(td.get_text())
# 将所有数据分割为小列表
list_item = [list_items[i:i+4] for i in range(0, len(list_items), 4)]
# 将这些小列表分配到各自类别的列表当中
for each in list_item:
if '学习' in each:
study.append(each)
if '工作' in each:
work.append(each)
if '睡眠' in each: