关闭

Python类库三两事 - 一次解决

Python类库安装常见问题 没有类库 下载更新缓慢 类库太多,一次下载很慢 多版本运行问题 常见问题解决方案 关于类库找不到问: 类库找不到怎么办? 答: 下载whl文件,安装.链接点这里问:whl文件怎么安装 答一: cmd命令行安装,将文件放在命令行的路径下,pip install whl文件名 即可 答二:pip install 路径+whl文件名 亦可 答三:检查 pip list...
阅读(490) 评论(2)

Anaconda多环境多版本python配置指导

Anaconda多环境多版本python配置指导: http://www.jianshu.com/p/d2e15200ee9b 原博客是翻译的官方文档,再加上自己的部分内容,官方原文地址:http://conda.pydata.org/docs/test-drive.html conda测试指南 在开始这个conda测试之前,你应该已经下载并安装好了Anaconda或者Minic...
阅读(321) 评论(0)

NLTK 词频统计(一) 词频统计,绘图,词性标注

内容简介 代码一,笔记简略版本 代码二,词频统计与pandas集合,分词词性提取与词频统计结合 代码一import FontCN_NLPtools as fts引用的是我自己写的一个类,是对我常用的一些方法的封装,code已经上传# 解决乱码问题 import matplotlib as mpl mpl.rcParams[u'font.sans-serif'] = [u'KaiTi'] mpl.rcParams[u...
阅读(1085) 评论(0)

使用NLPIR 进行中文分词并标注词性

背景在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个任务,如果你没有NLPIR那么你可以参考这篇文章NLPIR快速搭建,或者直接下载我已经准备好的汉语自然语言处理文件包NLP源码集合代码,亦是我的笔记# - * - coding: utf - 8 -*-...
阅读(4747) 评论(0)

封装汉语自然语言处理中的常用方法(附代码:生成中文词云)

前叙该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图背景在进行汉语自然语言处理时候,经常使用的几个方法,分词,清除停用词,以及获取新词,为了方便使用我们将其封装. 这样我们就可以通过一行简单的代码获取清除停用词并和英语一样分词完毕,并以空格分割的汉语字符串,或者还可以获得其他功能.至于之所以加上这个例子,是...
阅读(2317) 评论(0)

BigData预处理(完整步骤)

BigData预处理(完整步骤) 虽然题目是完整步骤,实际上并不完整,以下是原文内容 一:为什么要预处理数据? (1)现实世界的数据是肮脏的(不完整,含噪声,不一致) (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高质量的数据;数据仓库需要对高质量的数据进行一致地集成) (3)原始数据中存在的问题: 不一致 —— 数据内含出现不一致情况 重复 不完整 —...
阅读(660) 评论(0)

关于我的CSDN博客的一些要说的话

写博客的目的 其实最早开始写博客就是为了把自己的学习笔记和错误日志保存到线上,顺便可以拿拿赚点C币,换换资源分之类的 后来慢慢感觉其实有些笔记可以写得更好一些,这样既有利于我个人的使用,或许还能帮助到其他人呢?也正是第一次有了这个想法,然后慢慢的开始筹划写博客,再然后也筹划过个人的博客网站.最后慢慢的变得对博客越来越上心. 虽然后来也曾经因为觉得自己的博客缺乏质量(在学web的时候),做了太多重复性...
阅读(621) 评论(0)

机器学习常见算法汇总

原文地址:http://www.ctocio.com/hotnews/15919.html 偶然看到的一篇文章,这篇文章写的很清晰,所以转载一下,补充自己的知识库,以下为正文 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人...
阅读(541) 评论(0)

快速提高CSDN访问量 - 附脚本初代机

快速提高CSDN访问量的方法 多写常用知识点的博客,想办法提高百度排名,注意标题不要写的太复杂 写国内比较新的技术,中短期奇效,效果很好 成系列的写技术文章,有利于增加评论,粉丝,中长期能够大幅度提高日常访问量 成系列的专栏,利于增加粉丝,亦能提高日常访问量,同上 想办法让文章推荐到首页,可在短时间内增加访问量, 大招:脚本,有一个已经写好了的脚本在最后,但是不建议 大招二,水军,还可以获得很多评论...
阅读(16086) 评论(0)

Python3 根据关键字爬取百度图片

介绍 一个可用好用的百度图片爬取脚本,唯一的不足就是这是单线程的 运行环境 Python3.6.0 写该脚本的原因:获取图片 创作过程有参考 源码# coding:utf-8 import requests import os import re # import json import itertools import urllib import sys# 百度图片URL解码 # http://...
阅读(15775) 评论(0)

Pandas to_json() 中文乱码,转化为json数组

问题出现与解决Pandas进行数据处理之后,假如想将其转化为json,会出现一个bug,就是中文文字是以乱码存储的,也就是\uXXXXXX的形式,翻了翻官网文档,查了源码的参数,(多谢网友提醒)需要设置js001 = df1.to_json(force_ascii=False),即可显示中文编码以下是原文的额外内容,DataFrame 转化为json数组于是决定自己写一个.首先用demojson的类...
阅读(25938) 评论(2)

如何快速掌握Pandas

10 Minutes to pandas 快速入门 因为pandas的官方文档已经进行了十分详细的介绍,所以本篇文章不再对其进行过多介绍,下面最展示部分的汇总以及部分pandas中部分要注意的地方. 要注意的几个地方 -画图问题:Pandas无法显示中文: 需要动态修改配置详细内容请阅读[Pandas matplotlib 绘图无法显示中文问题各种解决方案详解]...
阅读(1371) 评论(0)

Pandas matplotlib 无法显示中文

Pandas 无法显示中文问题 解决方案Pandas在绘图时,会显示中文为方块,主要原因有二: matplotlib 字体问题 seaborn 字体问题 只需要在文件开始动态设置字体配置就可以了,但是要注意,字体设置可能需要尝试多次,比如我一开始设置的win10中的’SamKi’,但是运行结果仍然是中文显示方块,后来我换成了’KaiTi’才正常显示的中文,具体原因可能只是某种字体获取失败而已.(本部...
阅读(19740) 评论(0)

Python2/3 list set性能测试

曾经有一份真挚的博文放在我的面前,我却没有珍惜,假如再给我一次机会,那么我会对博主说三个字----------mmp.如果非要说多一点,那么我会说:list明明比set快.你个垃圾臭傻逼....
阅读(8414) 评论(0)

汉语自然语言处理工具包下载

Python Windows10 汉语自然语言处理基本组件: 20170703...
阅读(1180) 评论(0)

多版本中文停用词词表 + 多版本英文停用词词表 + python词表合并程序

文章简介如果你只想获取中文停用词此表,请直接到文章结尾下载项目文件,本博文及链接会定期更新:最近更新2017/07/04第二次更新...
阅读(8067) 评论(0)

利用 TensorFlow 实现上下文的 Chat-bots

在我们的日常聊天中,情景才是最重要的。我们将使用 TensorFlow 构建一个聊天机器人框架,并且添加一些上下文处理机制来使得机器人更加智能。 “Whole World in your Hand” — Betty Newman-Maguire (http://www.bettynewmanmaguire.ie/) 你是否想过一个问题,为什么那么多的聊天机器人会缺乏会话情景...
阅读(1495) 评论(0)

基于贝叶斯的垃圾邮件过滤器 JAVA

package cn.zhf.test; import java.io.*; import java.util.*; public class SpamMailDetection { public static final String BASE_PATH = "C:\\Users\\zhf\\Desktop\\mai...
阅读(1315) 评论(0)

Python运行异常 Original error was: DLL load failed:

完整报错: ImportError: Importing the multiarray numpy extension module failed. Most likely you are trying to import a failed build of numpy. If you're working with a numpy git repo, try `git clean -xdf`...
阅读(2227) 评论(0)

数据标准化的方法与意义

含义数据标准化和归一化存在区别 数据归一化是数据标准化的一种典型做法,即将数据统一映射到[0,1]区间上. 数据的标准化是指将数据按照比例缩放,使之落入一个特定的区间.意义 求解需要 比如在SVM中处理分类问题是又是需要进行数据的归一化处理,不然会对准确率产生很大的影响,具体点说,比如避免出现因为数值过大导致c,g取值超过寻优范围除此之外,最明显的是在神经网络中的影响,主要有四个层面有利于初始...
阅读(1555) 评论(0)
115条 共6页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:252981次
    • 积分:3064
    • 等级:
    • 排名:第11855名
    • 原创:93篇
    • 转载:20篇
    • 译文:2篇
    • 评论:35条
    博客专栏
    最新评论