基于python的统计公报关键数据爬取 update

最新推荐文章于 2024-09-04 10:31:20 发布

weixin_30542079

最新推荐文章于 2024-09-04 10:31:20 发布

阅读量239

点赞数

文章标签： python 爬虫 java

原文链接：http://www.cnblogs.com/yezhaodan/p/7840989.html

版权

由于之前存在的难以辨别市本级，全市相关数据的原因，经过考虑采用把含有关键词的字段全部提取进行人工辨别的方法

在其余部分不改变的情况下，更改test部分

def test(real_Title,real_Text):
    with open(real_Title, 'r') as f:
        for li in f:
           if "地区生产总值" in li:
               print(li)
           if "一般公共财政收入" in li:
               print(li)
           if "一般公共财政支出" in li:
               print(li)
           if "公共财政预算收入" in li:
               print(li)
           
        
        
    '''

　　 print(real_Text)  
    for l in real_Text:
        if "地区生产总值" in l:
            print(l)  '''
    
   '''

尚未解决的功能性问题：

1.自动爬取网址链接的问题尚未解决

2.希望能使用java写出界面，进行直接的选择写入excel！

尚未解决的算法性问题：

1.是否有更好的基于关键词的数据搜索方法有待改进

转载于:https://www.cnblogs.com/yezhaodan/p/7840989.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30542079

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于python的统计公报关键数据爬取 update

由于之前存在的难以辨别市本级，全市相关数据的原因，经过考虑采用把含有关键词的字段全部提取进行人工辨别的方法在其余部分不改变的情况下，更改test部分def test(real_Title,real_Text): with open(real_Title, 'r') as f: for li in f: if "地区生产总值" in ...
复制链接

扫一扫