python爬取有关熊安新区的网易评论

从收到任务到完成任务大概用了两天半,期间出现好多问题,如:

1.爬到的信息格式不正确,不是字典形式;

2.爬出来的缺少信息;

3.爬出来的信息无法用中文显示;

4.爬出来的信息无法写进文件

.......

废话不多说,还是直接上代码吧.....不懂的自行百度~~~偷笑

# -*- coding:utf-8 -*-

import re
import urllib2
import json
import time
import sys
reload(sys)
sys.setdefaultencoding('utf8')

def get_dict():
    data = []
    f = open('xa35.json', 'a+')
    for k in range(0, 4):
        if k == 0:
            url1 = 'http://comment.news.163.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值