文件处理方法
c21fbybo
这个作者很懒,什么都没留下…
展开
-
对list按照给定规则排序
记录一个排序方法,如何对一个list进行排序假设从csv文件加载进入一个df然后转换为一个n*2的list1。此时对这个list1进行排序,顺序是给定的,rule,rule的形式是一个字典,他的得到的代码是这样的for cell in rule: n=n+1 rule_dict.update({cell:n})现在就可以利用这个rule_dict对list1进行排序了。代码如下:df_data_list = list(df_data)newList = sorted(df_da原创 2020-10-23 11:17:08 · 1255 阅读 · 0 评论 -
记录一下本周的主要工作及遇到的问题
本周首先是将上一周遗留的tf-idf的工作做完,提取了高词频,并且首次输入到google中试了一试,但是出现了很多问题,难以解决,最大的问题就是google会出验证码,这样的话严重限制了每天的访问量导致工作很慢,搜索了一款MagicGoogle的项目,但是依然绕不过这个问题,但是却很好用。另外就是继续精简词汇库,层层的抽丝剥茧,把语料滤了一遍又一遍,从两千多个变成一千多个,最后剩了几百个,并且原创 2017-07-23 22:03:16 · 2211 阅读 · 0 评论 -
python 对以空行作为分割的块文件进行读取的方法
使用python读取以空行为分块形式的txt文件原创 2017-08-28 10:10:00 · 11151 阅读 · 0 评论