今天遇到的问题是在文本文档中有unicode编码,想把unicode编码输出为中文:
文本文档内容为:\\u5bb6\\u91cc\\uff0c\\u529e\\u516c\\u5ba4\\uff0c\\u5c55\\u67dc\\uff0c,现需要转变为中文。
#-------PYTHON获取网页内容-------------#
import sys, urllib
import json
url = "http://www.baidu.com" #网页地址
wp = urllib.urlopen(url) #打开连接
content = wp.read() #获取页面内容
fp = open("/mr_/tao_app/list_content/list_content.txt","w") #打开一个文本文件
fp.write(content) #写入数据
fp.close() #关闭文件
fr=open("/home/aaa/workspace/mr_Tao/tao_app/list_content/list_content.txt")
content=fr.readline()
js = json.loads(content)
print json.dumps(js)
print json.dumps(js, ensure_ascii=False)
fr.close()
2. 把文本中指定的内容输出(把每一行中有字符串"title"的行打印出来):
#-*- coding:utf-8 -*-
str='title'
fc=open("/tao_app/list_content/list_content1.txt")
fr=fc.readlines()
#打印出每一行的内容
#print fr
for content in fr:
lines=content.split(',')
for line in lines:
#打印出以逗号分隔的每一行
#print line
#若此行有字符串“title”则打印出
if str in line:
print line
/
#-*- coding:utf-8 -*-
'''
Created on Dec 18, 2012
@author: aaa
'''
import json
str='title'
fc=open("/mr_Ta/ta_app/list_content/list_content1.txt")
fr=fc.readlines()
#print fr
for content in fr:
lines=content.split(',')
for line in lines:
#print line
if str in line:
#print line
w_title=open("/mr_Ta/ta_app/list_content/content_title.txt","a")
w_title.write(line)
fc.close()
r_title=open("/mr_Ta/ta_app/list_content/content_title.txt")
line_title=r_title.readlines()
for i in xrange(20):
print line_title[i]
js = json.loads(line_title[0])
print json.dumps(js, ensure_ascii=False)