关闭

Python NLPIR(中科院汉语分词系统)的使用 十五分钟快速入门与完全掌握

前叙博主写这篇文章使用了八十分钟,阅读需要十五分钟,读完之后你将会学会在Python中使用NLPIR2016.如果你花费更多的时间练习后半部分的例子,你将能够在一天内学会在Python中使用NLPIR2016的全部所需知识 如果你想要获取更详细的API翻译,你需要进一步学习ctypes,附赠一篇关于API翻译,虽然是java语言的,但是NLPIR的接口翻译都是一样的 http://blog.cs...
阅读(4747) 评论(0)

源码:我的关于NLP的博客(持续更新中...)

决定上传我平时写的部分源码,不过暂时只打算上传有关NLP的部分,之后随着博客的不断更新,我也会不断更新这篇博客,你可以将这片博客放在你的收藏夹里,这样方便你的浏览 1.关于NLPIR的部分 20160606,第一次上传 测试pynlpir 在Python中使用NLPIR2016(快速上手与完全掌握) 百度云链接:http://pan.baidu.com/s/1eStdgRK 2...
阅读(1152) 评论(0)

中科院分词系统(NLPIR)JAVA简易教程

这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限、水平较低,文档中肯定存在有很多不足之处,还请见谅。 下载地址:http://ictclas.nlpir.org/downloads,下载最新的NLPIR/ICTCLAS分词系统下载包 授权文件下载地址:https://github.com/NLPIR-team/NLPIR/tree...
阅读(1184) 评论(0)

Python 中文分词 NLPIR 快速搭建

前述本篇文章写完需要半个小时,阅读需要十分钟,读完后,你将学会在Python中使用NLPIR,以及关于使用它的一些有用的基础知识 NLPIR 是中科院的汉语分词系统,在Python中使用也比较广泛,而且曾多次夺得汉语分词比赛的冠军,并且其可以在多个语言上都实现了接口甚至在Hadoop中也可以使用,博主比较推荐NLPIRgithub地址:https://github.com/NLPIR-team/N...
阅读(1118) 评论(0)

Python + worldcloud + jieba 十分钟学会用任意中文文本生成词云

前述本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文文本生成词云 Python词云 worldcloud 十五分钟入门与进阶 Python中文分词 jieba 十五分钟入门与进阶代码组成简介 代码部分来源于其他人的博客,但是因为bug或者运行效率的原因,...
阅读(3091) 评论(1)

Python中文分词 jieba 十五分钟入门与进阶

整体介绍jieba 基于Python的中文分词工具,安装使用非常方便,直接pip即可,2/3都可以,功能强悍,博主十分推荐 github:https://github.com/fxsjy/jieba 开源中国地址:http://www.oschina.net/p/jieba/?fromerr=LRXZzk9z 写这篇文章花费两个小时小时,阅读需要十五分钟,读完本篇文章后您将能上手jieba下篇...
阅读(2451) 评论(0)

Python词云 wordcloud 十五分钟入门与进阶

整体简介基于Python的词云生成类库,很好用,而且功能强大.博主个人比较推荐 github:https://github.com/amueller/word_cloud 官方地址:https://amueller.github.io/word_cloud/ 写这篇文章花费一个半小时,阅读需要十五分钟,读完本篇文章后您将能上手wordcloud中文词云与其他要点,我将会在下一篇文章中介绍快速生...
阅读(25215) 评论(2)

docker 的mysql镜像使用手册 官网原文 日期2017-05-25

原文地址 Supported tags and respective Dockerfile links 8.0.1, 8.0, 8 (8.0/Dockerfile)5.7.18, 5.7, 5, latest (5.7/Dockerfile)5.6.36, 5.6 (5.6/Dockerfile)5.5.56, 5.5 (5.5/Dockerfile) Quick refer...
阅读(1306) 评论(0)

pynlpir.LicenseError: Your license appears to have expired. Try running "pynlpir update".

本篇讲的是Python环境,但是其他环境原理相同 但是如果你使用的java环境,或许 JAVA环境 解决NLPIR的License过期问题 可以更好地帮助你执行代码import pynlpir pynlpir.open()str = '欢迎科研人员、技术工程师、企事业单位与个人参与NLPIR平台的建设工作。' print(pynlpir.segment(str))后,出现pynlpir.Licen...
阅读(1552) 评论(0)

朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)

关键字: 拉普拉斯修正(Laplacian correction) 懒惰学习(lazy leanring) 对数似然(log-likelihood) 拉普拉斯修正(Laplacian correction)朴素贝叶斯分类器的训练: 基于训练集D 来估计类先验概率P(y) 基于训练集D 为每个属性估计条件概率P(x|y) 因此当在某个训练集中,样本的一条特征值 EV 出现概率为 0 时,则会使计算的先...
阅读(1317) 评论(0)

OpenCV的k - means聚类 -对图片进行颜色量化

OpenCV的k - means聚类 目标 学习使用cv2.kmeans()数据聚类函数OpenCV 理解参数 输入参数 样品:它应该的np.float32数据类型,每个特性应该被放在一个单独的列。 nclusters(K):数量的集群需要结束 标准 : 这是迭代终止准则。 当这个标准是满足,算法迭代停止。 实际上,它应该是...
阅读(1143) 评论(0)

OpenCV官方文档 理解k - means聚类

理解k - means聚类 目标 在这一章中,我们将了解k - means聚类的概念,它是如何工作等。 理论 我们将这个处理是常用的一个例子。 t恤尺寸问题 考虑一个公司要发布一个新模型的t恤。 显然他们将不得不制造模型满足人们各种尺寸的大小不同。 所以公司的数据甚至€™身高和体重,并把它们放到图,如下: 公司无法为所有的尺寸制作衣服。 相反,他们把人分为...
阅读(1139) 评论(0)

盘点selenium phantomJS使用的坑

转载自简书 说到python爬虫,刚开始主要用urllib库,虽然接口比较繁琐,但也能实现基本功能。等见识了requests库的威力后,便放弃urllib库,并且也不打算回去了。但对一些动态加载的网站,经常要先分析请求,再用requests模拟,比较麻烦。直到遇到了selenium库,才发现爬动态网页也可以这么简单,果断入坑! selenium是python的一个第三方自动化测试库,虽然是...
阅读(1189) 评论(0)

朴素贝叶斯法分类器的Python3 实现

本篇文章是我在读了李航的后手写的算法实现之一 原理请参考统计学习方法第四章朴素贝叶斯法-李航代码, NaiveBayesMethod 的内部计算方式现在为数值计算, 符号计算的代码已经注释,如果需要请手动修改 朴素贝叶斯法分类器 当lam=1 时,类分类方式为为贝叶斯估计 实现了拉普拉斯平滑,以此避免出现要计算的概率为0的情况,以免计算错误的累积 具体原理请...
阅读(1284) 评论(0)

统计学习方法第四章朴素贝叶斯法-李航

第4章 朴素贝叶斯法 朴素贝叶斯 (naive Bayes) 法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出Y。 4.1 朴素贝叶斯法的学习与分类 基本方法 朴素贝叶斯法通过训练数据集学习X和Y的联合概率分布 P(X,Y)。...
阅读(1216) 评论(0)

Docker windows 安装MySql和Tomcat

mysql Tomcat安装语句与解析 利用Docker Hub 查询镜像使用信息 mysql的Docker Hub官方版网页 MySql Tomcat安装语句与解析 docker run -p:53306:3306 --name some-mysql -e MYSQL_ROOT_PASSWORD = 123 -d mysql:5.6.3// -p 端口映射 本机端口:容器端口 // --na...
阅读(2162) 评论(0)

Python2 Python3 爬取赶集网租房信息,带源码分析

*之前偶然看了某个腾讯公开课的视频,写的爬取赶集网的租房信息,这几天突然想起来,于是自己分析了一下赶集网的信息,然后自己写了一遍,写完又用用Python3重写了一遍.之中也遇见了少许的坑.记一下.算是一个总结.* python2 爬取赶集网租房信息与网站分析 分析目标网站url 寻找目标标签 获取,并写入csv文件 #-*- coding: utf-8 -*- from bs4 import Bea...
阅读(1442) 评论(0)

BeautifulSoup 一行代码获取今日日期,与smtplib结合

在中有一节为通过网络获取今天是不是圣诞节,但是我今天写的时候那个网站登录奇慢,本着求人不如求己,能国内绝不国外的原则,我决定还是自己找个网站爬取日期.比如 再简单的看了看该网站的代码之后,我最终选择了获取黄色荧光笔标出的那个a标签内容 当然,你也可以获取图中的整个日历内容(蓝色圈部分),通过这种方式,你讲拥有一个完整的”在线日期库”简单的东西还是直接代码:from urllib.reques...
阅读(352) 评论(0)

Python3.x 发送邮件

Python有两个包可以发送邮件:smtplib和email# - * - coding: utf - 8 -*- # # 作者:田丰 # 邮箱:fonttian@163.com # 撰写时间:2017年4月22日 # Python版本:3.6.1 # CSDN:http://blog.csdn.net/fontthrone # import smtplib import email.mime.mu...
阅读(1463) 评论(0)

Python3 pymysql连接mysql数据库 windows

pymsql是一个不错的连接mysql的Python类库 我比较喜欢把知识点注释在我的code里,直接上代码吧,不需要要多解释说明.import pymysql# unix_socket='/tmp/mysql.sock' 在ubantu下 # conn = pymysql.connect(host='127.0.0.1',unix_socket='/tmp/mysql.sock',user='r...
阅读(1291) 评论(0)
90条 共5页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:223330次
    • 积分:2536
    • 等级:
    • 排名:第14515名
    • 原创:71篇
    • 转载:17篇
    • 译文:2篇
    • 评论:20条
    博客专栏