- 博客(3)
- 收藏
- 关注
原创 科研用代码(3)通过流程分解,轻松看懂和使用pyecharts库 禁止转载
从图1可以发现为了绘制像图2一样的简单图像需要生成一个实例化对象,调用5个不同的属性,还要记住那么多不同参数,许多新手因此就望而却步了。虽然对代码进行了一定的优化,但图3的代码仍存在一定的理解难度,举例而言:set_global_opts属性中虽然只有1个参数,但存在着3层嵌套,新手容易看晕乎。为便于理解,仅处理实例化和x轴的部分(见图8),为了避免重复开发,我们将各参数的值储存在类中,每次使用时调用自己所需的类的名字,这样可以大幅降低代码的阅读难度(见图9)正则表达式匹配的结果,并返回一个列表。
2023-07-04 17:20:26
74
原创 科研用代码(2)_使用python快速找到我们想找的论文文件 禁止转载
基于此,提出一种基于tkinter库和os库的解决方案:其作用机理是先用tk库的withdraw功能来获取目标文件夹路径,然后遍历该路径下所有文件,使用endwith函数分析文件结尾,如是.pdf则打印。现实中我们写论文时,通常会先将论文分类,会将不同类型的论文储存在一个文件夹的若干各下级文件夹内。应用场景说明:有时我们会忘记自己将论文储存在哪个文件夹内,使用电脑自带的检索功能寻找通常速度较慢,会如下图所示的那样,加载许久才出现几个不相干文件。
2023-05-20 17:24:14
97
1
原创 科研用代码(1)_python提取某路径下所有论文的单句 禁止转载
基于此,提出了一种解决方式:其作用机理是先读取某路径下所有PDF内容,然后把读取的所有内容合并到一个字符串内,去除这个字符串内所有的空格与空行。然后用中文句号进行文本分割。就如上图所示,明明文章中就有“数据管理规范”这个词,但我们用pdf自带的搜索功能就是找不到,就必须要通读全文才能提取出对我们有用的信息,相当浪费时间。应用场景说明:有时因为论文的字符间距大或换行,我们无法在PDF内直接搜索到目标句子。程序执行后的结果如下,会将整篇pdf转为一个个句子,方便查阅。
2023-05-18 10:26:48
62
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人