自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

jhoojhooablido

加油,冲压

  • 博客(3)
  • 资源 (10)
  • 收藏
  • 关注

转载 机器学习中距离和相似性度量方法

在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则:d(x,x) = 0 // 到自己的距离为...

2018-12-27 09:38:35 458

转载 python处理时间格式转换,将xxxx年xx月xx日转化为xxxx-xx-xx格式

publish_Time = "2018年10月10日"array = time.strptime(publish_Time, u"%Y年%m月%d日")try: publishTime = time.strftime("%Y-%m-%d", array)except Exception, e: print eprint publishTime

2018-12-19 13:45:31 3416

转载 python BeautifulSoup乱码问题

用爬虫爬取天气数据,需要先获得原网站上城市中文名称与汉语拼音的对应关系。在编写如下代码进行处理的时候,出现中文乱码。查了很多blog发现方法并不好使。除了这位大神。。。。。这位出现问题就去阅读文档的大神。。。。https://www.jianshu.com/p/69401b84419e查阅requests和bs4的官方文档,发现了这样两段描述:When you make a requ...

2018-12-18 16:56:14 1223 1

amazing picture.zip

一张不太好描述的图片,用来赚点积分。你懂的。算法-:流.-租.:__.1...选取k个类‘I·心.—。。首)次“随机选:取“(C二了番赣焉登*E%%z芯...。5..满.是终止条件后终止迭.代..·。。不.5自重新分配.。·。,最人.迭·代数.。·。。_.所.有―炎中·心·移功小于·朱一一值

2020-09-17

CentOS-6.5-x86_64xunlei种子文件.zip

百度网盘下载贼慢,centos 6 64位迅雷种子了解一下   1.可以把CentOS理解为Red Hat AS系列!它完全就是对Red Hat AS进行改进后发布的!各种操作、使用和RED HAT没有区别!   2.CentOS完全免费,不存在RED HAT AS4需要序列号的问题。   3.CentOS独有的yum命令支持在线升级,可以即时更新系统,不像RED HAT那样需要花钱购买支持服务!   4.CentOS修正了许多RHEL的BUG!   5.CentOS版本说明:CentOS3.1 等同于 RED HAT AS3 Update1 CentOS3.4 等同于 RED HAT AS3 Update4 CentOS4.0 等同于 RED HAT AS4。

2020-06-02

中文褒贬义词词典.txt

词的褒贬色彩意义,指的是不依赖语言环境而因定下来的附属义。它是社会公认的、约定俗成的,即具有客观性;离开特定的语境便失去其原有的感情色彩、态度色彩意义的词,不属于情感词语。本词典便是依据这个标准来确定收词范围的,因此那些出于临时修辞需要的所谓“贬词褒用”的用例,自然都应该排除在外。(针对帖子,没有上下文作为判据,会漏选很多有用的领域性具有情感色彩的词)

2019-12-03

商品评论情感语料库.txt

中文情感分析语料库,包含 酒店、服装、水果、平板、洗发水 等 5 个领域的评价数据,每个领域各包含 5000 条正面和负面评价,数据抓取于 携程网 和 京东 ,仅供科研学习之用,欢迎下载使用!

2019-12-03

中文情感词汇本体.txt

中文情感词汇本体库是大连理工大学信息检索研究室在林鸿飞教授的指导下经过全体教研室成员的努力整理和标注的一个中文本体资源。该资源从不同角度描述一个中文词汇或者短语,包括词语词性种类、情感类别、情感强度及极性等信息。 中文情感词汇本体的情感分类体系是在国外比较有影响的Ekman的6大类情感分类体系的基础上构建的。在Ekman的基础上,词汇本体加入情感类别“好”对褒义情感进行了更细致的划分。最终词汇本体中的情感共分为7大类21小类。 构造该资源的宗旨是在情感计算领域,为中文文本情感分析和倾向性分析提供一个便捷可靠的辅助手段。中文情感词汇本体可以用于解决多类别情感分类的问题,同时也可以用于解决一般的倾向性分析的问题。 本体格式介绍 情感词汇本体中,一般的格式为。 表1 情感词汇本体格式举例 词语 词性种类 词义数 词义序号 情感分类 强度 极性 辅助情感分类 强度 极性 无所畏惧 idiom 1 1 PH 7 1 手头紧 idiom 1 1 NE 7 0 周到 adj 1 1 PH 5 1 言过其实 idiom 1 1 NN 5 2

2019-12-03

中文微博情感分析测评数据.txt

说明:数据来自腾讯微博 1。评测数据全集包括 20 个话题,每个话题采集大约1000条微博,共约20000条微博。数据采用xml格式,已经预先切分好句子。每条句子的所有标注信息都包含在元素的属性中。其中opinionated表示是否观点句,polarity表示句子情感倾向。

2019-12-03

伯克利计算机思维训练课程SICP高清版

伯克利计算机学科必学课程,从零开始培养计算机思维和软件工程思想.非常实用,非常棒的文档

2019-03-21

berlelely 计算机SICP16完整文档

如此优秀的一本书,大多数读者上止于第三章,后面的内容就很少再去读了,实在是可惜。设计实现一门编程语言应该是任何一个有技术追求的程序员的梦想,而第四、五章就是教你如何实现一门新的编程语言的解释器。如何扩展扩充修改原有的scheme解释器,如何让你的新语言具备OO功能,如何实现逻辑式编程语言,如何实现具备惰性求值的解释器等等。甚至你可以实现自己的GC, 顺便说一句,GC的引入还得要归功于lisp这门古老的编程语言。当然,最后的两章的内容比真正的“编译技术”要简单一些,毕竟这不是一本介绍编译技术的书籍。作者引入的所有例子都是为了更好的让读者理解程序设计的本质是什么,如何更好的控制系统的客观复杂性。这是一本教你造汽车的书籍,而不是教你开车的书籍。

2019-03-19

ORACLE 快速导出工具sqluldr2

ORACLE 快速导出工具sqluldr2,同时支持linux,Windows,32位,64位环境。解压后再命令行直接调用。

2018-08-20

一个视频文件描述假设检验

该视频文件清楚明白地讲述了假设检验的相关内容。一看即懂!

2018-08-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除