- 博客(10)
- 资源 (20)
- 问答 (1)
- 收藏
- 关注
原创 字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码
字符字节与编码字符是人们常用的一些记号,比如”1”, “汉”, “お”,”℃”等等,包括各种语系的语言和一些符号都可以被称为字符。 字节是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)。 编码是大家对计算机如何使用字节来表示一个字符的约定,可分为ASCII编码,ANSI编码(本地化编码),UNICODE编码(国际化编码)三种。1.ASCI...
2017-09-27 18:17:46 4913
转载 关于curl网站运维与开发的那些事
curl网站开发指南常见参数:-A/--user-agent <string> 设置用户代理发送给服务器-b/--cookie <name=string/file> cookie字符串或文件读取位置-c/--cookie-jar <file> 操作结束后把cookie写入到这个文件中-C/--continue-at <off
2017-09-27 16:56:27 877
原创 NLP之tfidf与textrank算法细节对比基于结巴分词
-NLP之tfidf与textrank算法细节对比 注:结巴默认在site-packages目录 关于结巴分词的添加停用词以及增加词相关操作可参考之前的博客,这里重点说下结巴关键词提取的两个算法1.tfidf算法 官方文档如下:extract_tags(sentence, topK=20, withWeight=False, allowPOS=(), withFlag=False) meth
2017-09-26 17:24:47 4766
原创 textrank算法原理与提取关键词、自动提取摘要PYTHON
首先介绍原理与概念TextRank 算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的 PageRank算法(其原理在本文在下面), 通过把文本分割成若干组成单元(单词、句子)并建立图模型, 利用投票机制对文本中的重要成分进行排序, 仅利用单篇文档本身的信息即可实现关键词提取、文摘。和 LDA、HMM 等模型不同, TextRank不需要事先对多篇文档进行学习训练, 因其简洁有效而得
2017-09-19 17:42:46 20112
原创 汉语树状图:暂时保存网址与任务调度(apscheduler)
http://www.hankcs.com/nlp/corpus/chinese-treebank.html#h2-8
2017-09-19 17:38:53 745
原创 MySql Host is blocked because of many connection errors; unblock with 'mysqladmin flush-hosts' 解决方法
利用:from sqlalchemy import create_engine 链接数据库的过程中报错(数据量大时) sqlalchemy.exc.OperationalError: (mysql.connector.errors.OperationalError) 2055尝试如下 :MySql Host is blocked because of many connection error
2017-09-17 18:08:46 8214
原创 地理信息地图标记KML与KMZ的区别
地理信息地图标记KML与KMZ的区别KML (keyhole markup language)是以XML语言为基础开发的一种文件格式,用来描述和存储地理信息数据(点、线、面、图片等),是纯粹的xml文本格式,可用记事本打开编辑,所以kml文件很小。KML跟XML文件最大的不同就是KML描述的是地理信息数据。最早开发KML的是keyhole公司,2004年Goole收购keyhole并用KML开发G
2017-09-14 13:49:43 20554
原创 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http:/
Python在下载包的过程中遇到error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools提供两个解决方案:解决方案一:环境状态:w
2017-09-11 12:16:53 21368 2
原创 linux下基本操作记录mongodb
linux 下怎样寻找mongodb安装的位置 find / -name mongodb #通用方法,同时返回的比较多的信息,不管有没有权限的locate mongodb #不推荐whereis mongodb #推荐:直接返回路径1。通过whereis monggodb 找到mongodb的安装目录,并进入目录 2。在目录下执行:mongod –dbpath=/usr/lo
2017-09-04 15:18:42 822
Scalable Modified Kneser-Ney Language Model Estimation语言模型PPT
2018-11-19
mabaXterm ssh linux连接工具,一个非常好用的工具
2018-08-03
数学建模模板(建模论文竞赛标准版)
2018-01-13
window_mongodb执行过程个人笔记——不建议下载.txt
2017-10-17
pagerank算法英文文档
2017-09-20
基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge
2017-09-19
TextRank算法的参考资料论文
2017-09-19
高德地图API POI分类编码表
2017-09-19
python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh
2017-06-07
cw2vec相关资料,cw2vec论文与Word Vectors
2010-01-11
一个网站之前可以访问,没有做任何处理,现在报错500,麻烦帮忙看下,不知如何解决
2017-10-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人