- 博客(6)
- 资源 (6)
- 收藏
- 关注
转载 python爬虫去除网页中的script结构
链接:http://www.cnblogs.com/rookie-c/p/5754828.html通过爬网易新闻,讲述怎么获得文本
2017-01-18 11:28:03 7255
原创 python读取不同文件的编码问题
两个文件,一个utf-8,一个gb2312 读取gb2312时,直接读取,‘r’模式就可以,没有遇到问题,读取utf-8时,报错gbk不能对某某字符进行编码改为'rb'模式,再用decode进行解码一下,就可以正常了1.stopwords = []2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb')3.fo
2017-01-17 15:14:56 460
原创 python安装wordcloud
之前为了测试一个tensorflow的python代码,安装了64位的python,和电脑上32bit的冲突了,一开始没发现,需要安装wordcloud模块的时候才发现使用pip安装,就会报错error[2],xxx找不到只能卸载64bit,重新安装32bit重新安装之后,别的模块可以安装,但是wordcloud仍然不能安装删除cache也没用,最后下载了w
2017-01-16 17:05:46 8621
原创 python获取pydoc
为了获取帮助,浏览python包的文档pydoc1. windows: 命令窗口:python -mpydoc xxx(包名,模块名字)2. linux/Mac 终端: pydoc xxx(包名,模块名字)
2017-01-08 22:26:47 696
转载 百度语音REST接口使用(python)
代码:#! /usr/bin/env python3import uuidimport base64import jsonimport urllib.requestimport sysdef get_token(): apiKey = "xxxxxxx" secretKey = "xxxxxxxxxxx"
2017-01-04 21:50:49 1172
转载 知识库构建-自动半自动
转自 http://www.kuqin.com/shuoit/20131231/337335.html实体名,语义类,属性的提取 自动化构建知识库
2017-01-03 19:46:09 851
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人