- 博客(3)
- 收藏
- 关注
转载 k-means聚类算法的详解和实现
一、相异度计算 在正式讨论聚类前,我们要先弄清楚一个问题:如何定量计算两个可比较元素间的相异度。用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度在数学上进行定量定义。 设 ,其中X,Y是两个元素项,各自具有n个可度量特征属性,那么X和Y的相异度定义为: ,其中R为
2017-08-29 10:51:06 6269 1
原创 简单教程-word2vec处理英文语料
word2vec是google的开源文本处理工具,可以将词处理成向量变成神经网络的输入。word2vec官网其中提供了一个text8英文语料供我们学习。下载地址:http://mattmahoney.net/dc/text8.zip 网上有很多教我们处理维基百科里面的数据然后变成我们的学习语料的,感兴趣的可以去试试。 该text8语料编码格式UTF-8,所有的数据存储为一行,没有标点符号。我们也
2017-08-09 15:16:52 9503 2
原创 python批量修改文件名
我有一个目录下有很多文件,但是文件的命名比较混乱,一个一个改有比较麻烦,所以我就写了一个python脚本来做批量更改。# coding: utf-8'''import osnum = 0for file in os.listdir('raw_data/'): #os.listdir('.')遍历文件夹内的每个文件名,并返回一个包含文件名的list if file[0:9] !=
2017-08-01 14:41:20 1911 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人