关闭

脚本:获取CSDN文章的访问量

目标 获取所有文章名,链接,阅读人数,评论数 以适合pandas读取的格式存储之 分析页面跳转首页:http://blog.csdn.net/fontthrone?viewmode=list 第二页:http://blog.csdn.net/FontThrone/article/list/2 三四页以此类推 根据第二三四页的格式尝试http://blog.csdn.net/FontThrone...
阅读(89) 评论(0)

Python中的argparse模块

简介argparse是python用于解析命令行参数和选项的标准模块,用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数. 如果你想详细的了解它的功能.建议阅读这个,或者这个 本篇文章只对其基本功能进行介绍,并对TensorFlow的examples中argarse使用进行详细的介绍功能原本的功能是命令行解析模块使用argparse的第一步就是创建一个解析器对...
阅读(127) 评论(0)

Python类库三两事 - 一次解决

Python类库安装常见问题 没有类库 下载更新缓慢 类库太多,一次下载很慢 多版本运行问题 常见问题解决方案 关于类库找不到问: 类库找不到怎么办? 答: 下载whl文件,安装.链接点这里问:whl文件怎么安装 答一: cmd命令行安装,将文件放在命令行的路径下,pip install whl文件名 即可 答二:pip install 路径+whl文件名 亦可 答三:检查 pip list...
阅读(220) 评论(2)

Anaconda多环境多版本python配置指导

Anaconda多环境多版本python配置指导: http://www.jianshu.com/p/d2e15200ee9b 原博客是翻译的官方文档,再加上自己的部分内容,官方原文地址:http://conda.pydata.org/docs/test-drive.html conda测试指南 在开始这个conda测试之前,你应该已经下载并安装好了Anaconda或者Minic...
阅读(154) 评论(0)

封装汉语自然语言处理中的常用方法(附代码:生成中文词云)

前叙该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图背景在进行汉语自然语言处理时候,经常使用的几个方法,分词,清除停用词,以及获取新词,为了方便使用我们将其封装. 这样我们就可以通过一行简单的代码获取清除停用词并和英语一样分词完毕,并以空格分割的汉语字符串,或者还可以获得其他功能.至于之所以加上这个例子,是...
阅读(2098) 评论(0)

Pandas to_json() 中文乱码

问题出现与解决Pandas进行数据处理之后,假如想将其转化为json,会出现一个bug,就是中文文字是以乱码存储的,也就是\uXXXXXX的形式,翻了翻官网文档,查了源码的参数,确认Pandas不带该功能=- =.于是又查了很多博客,结果都是解决读取json时的乱码问题.并没有写入的乱码问题解决.于是决定自己写一个.demojson的类库尝试了一下,不行编码问题.之后考虑python 原生的 jso...
阅读(25353) 评论(0)

如何快速掌握Pandas

10 Minutes to pandas 快速入门 因为pandas的官方文档已经进行了十分详细的介绍,所以本篇文章不再对其进行过多介绍,下面最展示部分的汇总以及部分pandas中部分要注意的地方. 要注意的几个地方 -画图问题:Pandas无法显示中文: 需要动态修改配置详细内容请阅读[Pandas matplotlib 绘图无法显示中文问题各种解决方案详解]...
阅读(1107) 评论(0)

Pandas matplotlib 无法显示中文

Pandas 无法显示中文问题 解决方案Pandas在绘图时,会显示中文为方块,主要原因有二: matplotlib 字体问题 seaborn 字体问题 只需要在文件开始动态设置字体配置就可以了,但是要注意,字体设置可能需要尝试多次,比如我一开始设置的win10中的’SamKi’,但是运行结果仍然是中文显示方块,后来我换成了’KaiTi’才正常显示的中文,具体原因可能只是某种字体获取失败而已.(本部...
阅读(19342) 评论(0)

Python2/3 list set性能测试

曾经有一份真挚的博文放在我的面前,我却没有珍惜,假如再给我一次机会,那么我会对博主说三个字----------mmp.如果非要说多一点,那么我会说:list明明比set快.你个垃圾臭傻逼....
阅读(8248) 评论(0)

多版本中文停用词词表 + 多版本英文停用词词表 + python词表合并程序

文章简介如果你只想获取中文停用词此表,请直接到文章结尾下载项目文件,本博文及链接会定期更新:最近更新2017/07/04第二次更新...
阅读(7531) 评论(0)

Python运行异常 Original error was: DLL load failed:

完整报错: ImportError: Importing the multiarray numpy extension module failed. Most likely you are trying to import a failed build of numpy. If you're working with a numpy git repo, try `git clean -xdf`...
阅读(1400) 评论(0)

Python 中文分词 NLPIR 快速搭建

前述本篇文章写完需要半个小时,阅读需要十分钟,读完后,你将学会在Python中使用NLPIR,以及关于使用它的一些有用的基础知识 NLPIR 是中科院的汉语分词系统,在Python中使用也比较广泛,而且曾多次夺得汉语分词比赛的冠军,并且其可以在多个语言上都实现了接口甚至在Hadoop中也可以使用,博主比较推荐NLPIRgithub地址:https://github.com/NLPIR-team/N...
阅读(1118) 评论(0)

BeautifulSoup 一行代码获取今日日期,与smtplib结合

在中有一节为通过网络获取今天是不是圣诞节,但是我今天写的时候那个网站登录奇慢,本着求人不如求己,能国内绝不国外的原则,我决定还是自己找个网站爬取日期.比如 再简单的看了看该网站的代码之后,我最终选择了获取黄色荧光笔标出的那个a标签内容 当然,你也可以获取图中的整个日历内容(蓝色圈部分),通过这种方式,你讲拥有一个完整的”在线日期库”简单的东西还是直接代码:from urllib.reques...
阅读(352) 评论(0)

Python3.x 发送邮件

Python有两个包可以发送邮件:smtplib和email# - * - coding: utf - 8 -*- # # 作者:田丰 # 邮箱:fonttian@163.com # 撰写时间:2017年4月22日 # Python版本:3.6.1 # CSDN:http://blog.csdn.net/fontthrone # import smtplib import email.mime.mu...
阅读(1463) 评论(0)
    个人资料
    • 访问:223329次
    • 积分:2536
    • 等级:
    • 排名:第14515名
    • 原创:71篇
    • 转载:17篇
    • 译文:2篇
    • 评论:20条
    博客专栏