自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (20)
  • 问答 (1)
  • 收藏
  • 关注

原创 字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码

字符字节与编码字符是人们常用的一些记号,比如”1”, “汉”, “お”,”℃”等等,包括各种语系的语言和一些符号都可以被称为字符。 字节是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)。 编码是大家对计算机如何使用字节来表示一个字符的约定,可分为ASCII编码,ANSI编码(本地化编码),UNICODE编码(国际化编码)三种。1.ASCI...

2017-09-27 18:17:46 4913

转载 关于curl网站运维与开发的那些事

curl网站开发指南常见参数:-A/--user-agent <string> 设置用户代理发送给服务器-b/--cookie <name=string/file> cookie字符串或文件读取位置-c/--cookie-jar <file> 操作结束后把cookie写入到这个文件中-C/--continue-at <off

2017-09-27 16:56:27 877

原创 NLP之tfidf与textrank算法细节对比基于结巴分词

-NLP之tfidf与textrank算法细节对比 注:结巴默认在site-packages目录 关于结巴分词的添加停用词以及增加词相关操作可参考之前的博客,这里重点说下结巴关键词提取的两个算法1.tfidf算法 官方文档如下:extract_tags(sentence, topK=20, withWeight=False, allowPOS=(), withFlag=False) meth

2017-09-26 17:24:47 4766

原创 textrank算法原理与提取关键词、自动提取摘要PYTHON

首先介绍原理与概念TextRank 算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的 PageRank算法(其原理在本文在下面), 通过把文本分割成若干组成单元(单词、句子)并建立图模型, 利用投票机制对文本中的重要成分进行排序, 仅利用单篇文档本身的信息即可实现关键词提取、文摘。和 LDA、HMM 等模型不同, TextRank不需要事先对多篇文档进行学习训练, 因其简洁有效而得

2017-09-19 17:42:46 20112

原创 汉语树状图:暂时保存网址与任务调度(apscheduler)

http://www.hankcs.com/nlp/corpus/chinese-treebank.html#h2-8

2017-09-19 17:38:53 745

原创 常用行或者列的对应解释与名称与ASCII码整理

常用行或者列的对应解释与名称与ASCII码整理

2017-09-19 11:29:41 1342

原创 MySql Host is blocked because of many connection errors; unblock with 'mysqladmin flush-hosts' 解决方法

利用:from sqlalchemy import create_engine 链接数据库的过程中报错(数据量大时) sqlalchemy.exc.OperationalError: (mysql.connector.errors.OperationalError) 2055尝试如下 :MySql Host is blocked because of many connection error

2017-09-17 18:08:46 8214

原创 地理信息地图标记KML与KMZ的区别

地理信息地图标记KML与KMZ的区别KML (keyhole markup language)是以XML语言为基础开发的一种文件格式,用来描述和存储地理信息数据(点、线、面、图片等),是纯粹的xml文本格式,可用记事本打开编辑,所以kml文件很小。KML跟XML文件最大的不同就是KML描述的是地理信息数据。最早开发KML的是keyhole公司,2004年Goole收购keyhole并用KML开发G

2017-09-14 13:49:43 20554

原创 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http:/

Python在下载包的过程中遇到error: Microsoft Visual C++ 14.0 is required. Get it with &quot;Microsoft Visual C++ Build Tools&quot;: http://landinghub.visualstudio.com/visual-cpp-build-tools提供两个解决方案:解决方案一:环境状态:w

2017-09-11 12:16:53 21368 2

原创 linux下基本操作记录mongodb

linux 下怎样寻找mongodb安装的位置 find / -name mongodb #通用方法,同时返回的比较多的信息,不管有没有权限的locate mongodb #不推荐whereis mongodb #推荐:直接返回路径1。通过whereis monggodb 找到mongodb的安装目录,并进入目录 2。在目录下执行:mongod –dbpath=/usr/lo

2017-09-04 15:18:42 822

Scalable Modified Kneser-Ney Language Model Estimation语言模型PPT

统计语言模型工具有比较多的选择,目前使用比较好的有srilm及kenlm,其中kenlm比srilm晚出来,训练速度也更快,而且支持单机大数据的训练。现在介绍一下kenlm的使用方法。

2018-11-19

mabaXterm ssh linux连接工具,一个非常好用的工具

一款豪华、全功能的终端软件MobaXterm。它不仅可以像PuTTY一样通过SSH连接Raspberry Pi等开源硬件,并且还能: 直接的便携版 内建多标签和多终端分屏 内建SFTP文件传输 内建X server,可远程运行X窗口程序 直接支持VNC/RDP/Xdmcp等远程桌面 默认的UTF-8编码 更加友好的串口连接设置 操作更明确,更少的“神秘技巧”

2018-08-03

基于矩阵分解的个性化推荐系统——论文

基于矩阵分解的个性化推荐系统——论文,比较不错的论文

2018-05-15

数学建模模板(建模论文竞赛标准版)

数学建模模板(建模论文竞赛标准版),1. 应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。  2. 数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。  3. 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。

2018-01-13

写好数学建模竞赛答卷注意事项(参赛宝典)

写好数学建模竞赛答卷注意事项(参赛宝典)

2018-01-13

go1.9rc2.windows-amd64.msi,文件为2017年最新GO

官方提供的最新Go语言安装包, 2017年go1.9rc2.windows-amd64.msi

2017-11-17

window_mongodb执行过程个人笔记——不建议下载.txt

window_mongodb执行过程个人笔记——不建议下载.txt Mongodb,分布式文档存储数据库,由C++语言编写,旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个高性能,开源,无模式的文档型数据库,是当前NoSql数据库中比较热门的一种。它在许多场景下可用于替代传统的关系型数据库或键/值存储方式。Mongo使用C++开发。

2017-10-17

pagerank算法英文文档

PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由[1] 根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。Google的创始人拉里·佩奇和谢尔盖·布林于1998年在斯坦福大学发明了这项技术。 PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单的说,一个高等级的页面可以使其他低等级页面的等级提升。

2017-09-20

基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge

基于最小领域知识的主题建模 ,一种基于融合知识的主题模型的微博话题发现方法,涉及自然语言处理领域 传统的主题挖掘技术基于概率统计的混合模型,对文本信息进行建模,使得模型能够自动挖掘出文本中潜在的语义信息,使用户能够快速的了解文本中所涉及的内容。通过主题模型,不仅能够获得文本集合中主要涉及的信息,而且能够获得每篇文档中的内容信息。常见的主题模型有概率潜在语义分析(ProbabilisticLatentSemanticAnalysis,PLSA)模型[1]和潜在狄利克雷分配(LatentDirichletAllocation,LDA)模型[2]。但该类技术仅考虑文本集合中的文本信息,其他有用的信息,如文本的类别信息等,无法被利用起来。

2017-09-19

TextRank算法的参考资料论文

 TextRank 算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的 PageRank算法, 通过把文本分割成若干组成单元(单词、句子)并建立图模型, 利用投票机制对文本中的重要成分进行排序, 仅利用单篇文档本身的信息即可实现关键词提取、文摘。和 LDA、HMM 等模型不同, TextRank不需要事先对多篇文档进行学习训练, 因其简洁有效而得到广泛应用。

2017-09-19

高德地图API POI分类编码表

高德地图 API POI 分类编码表,地理编码/逆地理编码 API 是通过 HTTP/HTTPS 协议访问远程服务的接口,提供结构化地址与经纬度之间的相互转化的能力。 结构化地址的定义: 首先,地址肯定是一串字符,内含国家、省份、城市、区县、城镇、乡村、街道、门牌号码、屋邨、大厦等建筑物名称。按照由大区域名称到小区域名称组合在一起的字符。一个有效的地址应该是独一无二的。注意:针对大陆、港、澳地区的地理编码转换时可以将国家信息选择性的忽略,但省、市、城镇等级别的地址构成是不能忽略的。

2017-09-19

python 3.6 scipy包

python 3.6 scipy包 scipy-0.19.0-cp36-cp36m-win_amd64.whl

2017-06-07

python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh

python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh

2017-06-07

python snownlp-0.12.3.tar.gz

python snownlp-0.12.3.tar.gz

2017-06-07

python xlwt3-0.1.2.tar.gz 包

python xlwt3-0.1.2.tar.gz 包

2017-06-07

R语言之RODBC包

RODBC包

2017-01-20

randomForest包

randomForest包

2017-01-20

R-Rwordseg_0.0-1包

R-Rwordseg_0.0-1包

2017-01-20

cw2vec相关资料,cw2vec论文与Word Vectors

cw2vec相关资料,全国知识图谱与语义计算大会(CCKS2018)8月14日至17日在天津举行,凭借出色的专业能力,阿里健康团队在中文电子病历命名实体识别评测任务中夺冠。 cw2vec: (Learning Chinese Word Embeddings with Stroke n-gram Information) AAAI 2018高分录用的一篇中文词向量论文

2010-01-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除