一个朋友
我有一个朋友,他最近找我说:在今年年初的时候,他因为疫情被困在家里。
他觉得每天的生活很枯燥,同时又在疯狂看观视频,读马列原著,脑子里有点想法,想记录一下。
于是,就开始写日志,不知不觉就写到了年底。
他说:你不是会点Python嘛,帮忙给分析分析我这一年干了些什么。
我说:正经人谁把心里话写日记里啊?他说他那个不是日记,我说他那个是日记,但看在你是我朋友的份上,记的又主要是每天的生活,我帮你试试看吧。
一份分析
目标
结果
2月
类别 | 天数 | 占比/% |
---|
2月 | 4 | 100 |
学习 | 1 | 25 |
工作 | 0 | 0 |
生活 | 3 | 75 |
新闻 | 2 | 50 |
词语 | 频数 |
---|
2020 | 43 |
特朗普 | 9 |
guancha | 8 |
美国 | 5 |
中国 | 5 |
连任 | 5 |
internation | 5 |
台湾 | 5 |
经济 | 5 |
社会 | 5 |
分析 | 4 |
政府 | 4 |
这样 | 4 |
企业债 | 4 |
发展 | 4 |
记录 | 3 |
生活 | 3 |
精英 | 3 |
需要 | 3 |
美联储 | 3 |
提高 | 3 |
疫情 | 3 |
思考 | 3 |
决定 | 3 |
经济基础 | 3 |
上层建筑 | 3 |
圣母 | 3 |
例子 | 3 |
体制 | 3 |
美股 | 3 |
3月
类别 | 天数 | 占比/% |
---|
3月 | 38 | 100 |
学习 | 10 | 26 |
工作 | 6 | 16 |
生活 | 8 | 21 |
新闻 | 27 | 71 |
词语 | 频数 |
---|
2020 | 108 |
guancha | 69 |
国家 | 32 |
internation | 32 |
新闻 | 27 |
politics | 26 |
中国 | 21 |
社会 | 20 |
思考 | 15 |
新增 | 15 |
病例 | 15 |
阶级 | 14 |
确诊 | 14 |
发展 | 13 |
劳动 | 13 |
境外 | 13 |
人民 | 12 |
我们 | 11 |
输入 | 11 |
学习 | 10 |
私有制 | 10 |
自己 | 10 |
卫健委 | 10 |
一个 | 9 |
美国 | 9 |
生产力 | 8 |
没有 | 8 |
道路 | 8 |
生活 | 8 |
美股 | 8 |
4月
类别 | 天数 | 占比/% |
---|
4月 | 9 | 100 |
学习 | 4 | 44 |
工作 | 1 | 11 |
生活 | 4 | 44 |
新闻 | 5 | 56 |
词语 | 频数 |
---|
2020 | 45 |
时间 | 41 |
商品 | 17 |
可以 | 11 |
guancha | 9 |
社会 | 7 |
价值 | 7 |
生产 | 7 |
恩格斯 | 7 |
货币 | 6 |
觉得 | 6 |
反杜林论 | 5 |
本身 | 5 |
可能 | 5 |
RE | 5 |
花钱买 | 5 |
比如 | 5 |
我们 | 5 |
花钱 | 5 |
加速 | 5 |
成为 | 5 |
历史 | 5 |
新闻 | 5 |
politics | 5 |
杜林 | 5 |
鲁滨逊 | 5 |
开学 | 4 |
生活 | 4 |
金钱 | 4 |
马克思主义 | 4 |
5月
类别 | 天数 | 占比/% |
---|
5月 | 7 | 100 |
学习 | 3 | 43 |
工作 | 0 | 0 |
生活 | 3 | 43 |
新闻 | 4 | 57 |
词语 | 频数 |
---|
2020 | 39 |
新闻 | 4 |
guancha | 4 |
politics | 4 |
毕业论文 | 3 |
生活 | 3 |
学习 | 3 |
— | 2 |
记录 | 2 |
毕业 | 2 |
全国 | 2 |
完成 | 2 |
报告 | 2 |
水文 | 2 |
title | 1 |
date | 1 |
34 | 1 |
tags | 1 |
categories | 1 |
时间 | 1 |
哪儿 | 1 |
false | 1 |
top | 1 |
gateflow | 1 |
png | 1 |
cover | 1 |
design | 1 |
jpeg | 1 |
现有 | 1 |
确诊 | 1 |
6月
类别 | 天数 | 占比/% |
---|
6月 | 10 | 100 |
学习 | 5 | 50 |
工作 | 0 | 0 |
生活 | 8 | 80 |
新闻 | 0 | 0 |
词语 | 频数 |
---|
2020 | 35 |
生活 | 8 |
毕业 | 5 |
学习 | 5 |
送走 | 3 |
老板 | 3 |
— | 2 |
记录 | 2 |
true | 2 |
答辩 | 2 |
美好 | 2 |
大学 | 2 |
晚上 | 2 |
同学 | 2 |
宿舍 | 2 |
title | 1 |
date | 1 |
35 | 1 |
tags | 1 |
categories | 1 |
时间 | 1 |
哪儿 | 1 |
false | 1 |
top | 1 |
womenbiyela | 1 |
cover | 1 |
biyecover | 1 |
webp | 1 |
aplayer | 1 |
meting | 1 |
7月
类别 | 天数 | 占比/% |
---|
7月 | 19 | 100 |
学习 | 18 | 95 |
工作 | 4 | 21 |
生活 | 3 | 16 |
新闻 | 0 | 0 |
词语 | 频数 |
---|
2020 | 35 |
学习 | 18 |
完成 | 9 |
blog | 6 |
水文 | 4 |
Python | 4 |
123 | 4 |
工作 | 4 |
生活 | 3 |
撰写 | 3 |
csdn | 3 |
43012724 | 3 |
article | 3 |
基础知识 | 3 |
安庆 | 3 |
招生 | 3 |
描述 | 3 |
ZmFuZ3poZW5naGVpdGk | 3 |
shadow | 3 |
text | 3 |
aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzAxMjcyNA | 3 |
size | 3 |
color | 3 |
FFFFFF | 3 |
70 | 3 |
— | 2 |
留校 | 2 |
记录 | 2 |
png | 2 |
初稿 | 2 |
8月
类别 | 天数 | 占比/% |
---|
8月 | 15 | 100 |
学习 | 10 | 67 |
工作 | 1 | 7 |
生活 | 4 | 27 |
新闻 | 1 | 7 |
词语 | 频数 |
---|
2020 | 37 |
学习 | 10 |
生活 | 4 |
水利 | 4 |
信息化 | 4 |
回家 | 3 |
记录 | 3 |
PPT | 3 |
完成 | 3 |
技术论坛 | 3 |
— | 2 |
时间 | 2 |
wri2020 | 2 |
修改 | 2 |
撰写 | 2 |
博客 | 2 |
blog | 2 |
csdn | 2 |
43012724 | 2 |
article | 2 |
水资源 | 2 |
保护 | 2 |
论文 | 2 |
制作 | 2 |
论坛 | 2 |
上海 | 2 |
第八届 | 2 |
中国 | 2 |
Python | 2 |
123 | 2 |
9月
类别 | 天数 | 占比/% |
---|
9月 | 18 | 100 |
学习 | 11 | 61 |
工作 | 8 | 44 |
生活 | 10 | 56 |
新闻 | 3 | 17 |
词语 | 频数 |
---|
2020 | 43 |
学习 | 11 |
生活 | 10 |
研究生 | 9 |
工作 | 8 |
上午 | 8 |
晚上 | 7 |
下午 | 7 |
水文 | 6 |
学报 | 5 |
年鉴 | 5 |
Python | 5 |
论文 | 4 |
开学 | 4 |
开学典礼 | 4 |
电瓶车 | 4 |
blog | 3 |
完成 | 3 |
新闻 | 3 |
hhu | 3 |
edu | 3 |
电动车 | 3 |
计算机 | 3 |
复习 | 3 |
失窃 | 3 |
超市 | 3 |
派出所 | 3 |
报案 | 3 |
警察 | 3 |
— | 2 |
10月
类别 | 天数 | 占比/% |
---|
10月 | 29 | 100 |
学习 | 13 | 45 |
工作 | 13 | 45 |
生活 | 11 | 38 |
新闻 | 0 | 0 |
词语 | 频数 |
---|
2020 | 43 |
工作 | 13 |
学习 | 13 |
生活 | 11 |
下午 | 11 |
水文 | 10 |
年鉴 | 10 |
晚上 | 9 |
科学 | 6 |
创新 | 5 |
研究生 | 5 |
录入 | 4 |
数据 | 4 |
上午 | 4 |
完成 | 4 |
论坛 | 4 |
短剧 | 4 |
ImageHosting1 | 3 |
main | 3 |
收到 | 3 |
数值 | 3 |
模拟 | 3 |
赛题 | 3 |
讲座 | 3 |
海报 | 3 |
剪辑 | 3 |
英语 | 3 |
— | 2 |
记录 | 2 |
日志 | 2 |
11月
类别 | 天数 | 占比/% |
---|
11月 | 26 | 100 |
学习 | 21 | 81 |
工作 | 4 | 15 |
生活 | 7 | 27 |
新闻 | 1 | 4 |
词语 | 频数 |
---|
2020 | 45 |
学习 | 21 |
科学 | 19 |
晚上 | 16 |
下午 | 15 |
比赛 | 14 |
矩阵 | 10 |
上午 | 9 |
报告 | 8 |
生活 | 7 |
模型 | 7 |
修改 | 6 |
论坛 | 5 |
数值 | 4 |
模拟 | 4 |
工作 | 4 |
创新 | 4 |
参加 | 4 |
运行 | 4 |
试卷 | 4 |
程序 | 4 |
bilibili | 4 |
计算 | 4 |
sdxy | 3 |
hhu | 3 |
edu | 3 |
研究生 | 3 |
bangumi | 3 |
play | 3 |
视频 | 3 |
12月
类别 | 天数 | 占比/% |
---|
12月 | 23 | 100 |
学习 | 18 | 78 |
工作 | 12 | 52 |
生活 | 15 | 65 |
新闻 | 1 | 4 |
词语 | 频数 |
---|
2020 | 39 |
下午 | 28 |
学习 | 24 |
晚上 | 23 |
生活 | 19 |
工作 | 13 |
决赛 | 8 |
上午 | 8 |
土壤 | 8 |
水文学 | 8 |
长江 | 6 |
项目 | 6 |
PPT | 6 |
完成 | 5 |
矩阵 | 5 |
试卷 | 4 |
中午 | 4 |
操作手册 | 4 |
矫情 | 4 |
报告 | 4 |
作业 | 4 |
科学 | 4 |
创新 | 4 |
大赛 | 4 |
数值 | 3 |
模拟 | 3 |
汇报 | 3 |
读书 | 3 |
中特社 | 3 |
bilibili | 3 |
全年
类别 | 天数 | 占比/% |
---|
全年 | 206 | 100 |
学习 | 120 | 58 |
工作 | 50 | 24 |
生活 | 80 | 39 |
新闻 | 44 | 21 |
词语 | 频数 |
---|
2020 | 512 |
学习 | 120 |
guancha | 91 |
生活 | 80 |
下午 | 66 |
晚上 | 61 |
时间 | 56 |
工作 | 50 |
新闻 | 44 |
internation | 41 |
politics | 37 |
国家 | 34 |
社会 | 33 |
水文 | 32 |
科学 | 32 |
完成 | 31 |
上午 | 31 |
中国 | 30 |
思考 | 27 |
研究生 | 25 |
年鉴 | 24 |
记录 | 23 |
— | 22 |
报告 | 21 |
可以 | 20 |
发展 | 20 |
新增 | 19 |
病例 | 19 |
开学 | 19 |
商品 | 18 |
自己 | 18 |
确诊 | 18 |
数值 | 18 |
模拟 | 18 |
决赛 | 18 |
blog | 18 |
我们 | 17 |
毕业 | 17 |
劳动 | 17 |
矩阵 | 17 |
分析
总体来看,学习占到的比例最高,生活次之,工作和新闻差不多。
一直以来都有坚持学习,疫情在家期间关注新闻较多,也会做一些思考,开学后更多关注毕业论文和离校的事情。
暑假留校的两个月里,学习占到的比例最高,Python能取得优秀正是得益于这段时间的坚持做题。小论文也是在留校期间完成投稿的。
研究生开学后,课程学习任务和老师安排的项目工作增多了,用来研究的时间减少了,也很少打游戏了。主要的工作是数字化水文年鉴和做项目报告PPT。
开学后做的研究主要是图论的学习,试图建立河道整治与网络流算法的关联,这一部分研究还需要深入下去。
这一年,参加体育锻炼的时间太少,也很少出去玩,生活十分单调,明年要有所改变。
一点感想
2020,真是个不平凡的年份。
无论是对我来说,还是对这个世界来说,这一年都会被记住。
通看了从2月份开始到现在的日志,有以下几件事让我印象深刻:
- 新冠肺炎疫情的全球大流行
- 美国大选,川普和拜登的选票数都达到了历史最高
- 一个星期的时间,搭建了自己的博客
- 第二次去上海,参加水利信息化论坛,第一次做学术报告
- 三个月的学习,Python计算机二级获得优秀
- 一个月的时间,把水文年鉴资料数字化
- 五个月的修改和等待,小论文获得录用
- 两个半月的时间,在师门的共同合作下,获得水科学数值模拟创新大赛一等奖
- 近一年的时间,坚持写日志
这一年真的过得飞快,匆匆忙忙毕业,忙碌的研究生生活。和一些朋友说再见,认识了一些新朋友。
2020,再见。
2021,你好!
新年Flag
2021年,为了各方面能有所进步,列一些希望达成的目标和想做的事,到年底看看效果。
- 雅思上7
- C++二级优秀
- 一等奖学金
- 图论研究有阶段性进展
- 掌握进化算法NSGAII
- 听一次院士报告会,物色好的PPT模板
- 看20篇研究相关英文文献,确定研究方向
- 坚持每周锻炼两次
- 学会一道家常菜
- 学会游泳
- 练习硬笔书法
- 看完3本哲学书,并做笔记
- 去南京的2个地方玩
- 去外地玩一次
- 想到了再加
系列日志
【2020】02 记录生活
【2020】03 理性思考
【2020】04 期盼开学
【2020】05 毕业论文
【2020】06 毕业
【2020】07 留校
【2020】08 回家
【2020】09 研究生
【2020】10 水文年鉴
【2020】11 数值模拟
【2020】12 决赛
代码
import jieba
import wordcloud
excludes = {"01","02","03","04","05","06","07","08","09","10","11","12","13","14","15","16","17","18","19","20","21","22","23","24","25","26","27","28","29","30","https","http","gh","mp","type","watermark","details","oss","image","process","csdnimg","htm","page","lujiabo98","github","io","www","cn","shtml","就是","com","img","net","jpg","jsdelivr","ImageHosting","toc","number","cdn","——","的","它","有","都","就","对","是","在","这个","图片","插入","了","也","这","这里","会","上","weixin","qq"}
def separate_words(no):
txt = open("2020-"+ str(no) + ".md", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
return words
def statistics(words):
counts = {}
for word in words:
if len(word) == 1:
continue
else:
rword = word
counts[rword] = counts.get(rword,0) + 1
for word in excludes:
if word in counts:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
return items
def days(no, words):
num_days = words.count("#") - 1
learn_days = words.count("学习")
work_days = words.count("工作")
life_days = words.count("生活")
news_days = words.count("新闻")
print("{:}月记录天数:{}".format(no, num_days))
print("学习天数:{},占比:{:.2%}".format(learn_days, learn_days/num_days))
print("工作天数:{},占比:{:.2%}".format(work_days, work_days/num_days))
print("生活天数:{},占比:{:.2%}".format(life_days, life_days/num_days))
print("新闻天数:{},占比:{:.2%}".format(news_days, news_days/num_days))
fo.write("|类别|天数|占比/%|\n")
fo.write("|------|------|\n")
fo.write("|{:}月|{}|100|\n".format(no, num_days))
fo.write("|学习|{}|{:.0f}|\n".format(learn_days, learn_days/num_days*100))
fo.write("|工作|{}|{:.0f}|\n".format(work_days, work_days/num_days*100))
fo.write("|生活|{}|{:.0f}|\n".format(life_days, life_days/num_days*100))
fo.write("|新闻|{}|{:.0f}|\n\n".format(news_days, news_days/num_days*100))
return num_days, learn_days, work_days, life_days, news_days
def word_frequency(num, items):
for i in range(num):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count))
fo.write("|{0:<10}|{1:>5}|\n".format(word, count))
def wc(no,words):
w = wordcloud.WordCloud(font_path = "msyh.ttc",width = 1000, height = 700, background_color = "white", stopwords = excludes)
w.generate(" ".join(words))
w.to_file("2020-" + str(no) + ".png")
def record(no):
fo = open("2020-" + str(no) + ".txt", "w")
return fo
sum_days, sum_learn_days, sum_work_days, sum_life_days, sum_news_days = 0, 0, 0, 0, 0
sum_words = []
for no in range(2, 13):
fo = record(no)
words = separate_words(no)
sum_words += words
items = statistics(words)
num_days, learn_days, work_days, life_days, news_days = days(no, words)
sum_days += num_days
sum_learn_days += learn_days
sum_work_days += work_days
sum_life_days += life_days
sum_news_days += news_days
wc(no, words)
fo.write("|词语|频数|\n")
fo.write("|------|------|\n")
word_frequency(30, items)
print("全年记录天数:{}".format(sum_days))
print("全年学习天数:{},占比:{:.2%}".format(sum_learn_days, sum_learn_days/sum_days))
print("全年工作天数:{},占比:{:.2%}".format(sum_work_days, sum_work_days/sum_days))
print("全年生活天数:{},占比:{:.2%}".format(sum_life_days, sum_life_days/sum_days))
print("全年新闻天数:{},占比:{:.2%}".format(sum_news_days, sum_news_days/sum_days))
fo = open("2020-13.txt", "w")
fo.write("|类别|天数|占比/%|\n")
fo.write("|------|------|\n")
fo.write("|全年|{}|100|\n".format(sum_days))
fo.write("|学习|{}|{:.0f}|\n".format(sum_learn_days, sum_learn_days/sum_days*100))
fo.write("|工作|{}|{:.0f}|\n".format(sum_work_days, sum_work_days/sum_days*100))
fo.write("|生活|{}|{:.0f}|\n".format(sum_life_days, sum_life_days/sum_days*100))
fo.write("|新闻|{}|{:.0f}|\n\n".format(sum_news_days, sum_news_days/sum_days*100))
items = statistics(sum_words)
fo.write("|词语|频数|\n")
fo.write("|------|------|\n")
word_frequency(40, items)
fo.close()
wc(13, sum_words)