python编程练习
文章平均质量分 67
qq_41796035
这个作者很懒,什么都没留下…
展开
-
数据可视化——plt:用python画图(一)
从零学习plt,用python画图,让数据随自己心意有意思起来!原创 2022-01-14 16:46:57 · 1727 阅读 · 0 评论 -
数据预处理(提取数据,合并csv,建立词典,引入外部词典的分词,删除csv文件特定行)
数据处理1、提取数据第一步:创建一个DataFrame第二步:提取相应列存入DataFrame2、从多文件中提取数据3、合并csv文件4、用正则表达式抠出所需内容5、生成词表6、引入外部词典的分词7、分词并标记专有名词①导入词表②分词+标记8、删除csv文件特定行1、提取数据先按列名提取出所需列,在新建文件夹放进去。例:【公开号,标题,摘要,权利要求,IPC分类号】从上述列中提取“IPC分类号”和“摘要”第一步:创建一个DataFramenew_data=pd.DataFrame()第二步:原创 2021-04-20 21:12:25 · 918 阅读 · 1 评论 -
用python读取某文件夹里所有文件的内容,然后用正则表达式匹配提取文件中需要的内容,用jieba分词后按比例划分数据集(包含读取json文件,存储、读取csv文件)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档解决的问题1、用python读取某文件夹里所有文件的内容。2、用正则表达式匹配提取文件中需要的内容。3、用jieba进行分词。4、按比例划分数据集。5、读取json文件,存储、读取csv文件。1、引入库,设置路径import osimport jsonimport reimport pandas as pdpath = './da'#path = './task's = []l =..原创 2020-12-25 17:37:29 · 1747 阅读 · 0 评论