- 博客(3)
- 资源 (10)
- 收藏
- 关注
转载 机器学习中距离和相似性度量方法
在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则:d(x,x) = 0 // 到自己的距离为...
2018-12-27 09:38:35 458
转载 python处理时间格式转换,将xxxx年xx月xx日转化为xxxx-xx-xx格式
publish_Time = "2018年10月10日"array = time.strptime(publish_Time, u"%Y年%m月%d日")try: publishTime = time.strftime("%Y-%m-%d", array)except Exception, e: print eprint publishTime
2018-12-19 13:45:31 3416
转载 python BeautifulSoup乱码问题
用爬虫爬取天气数据,需要先获得原网站上城市中文名称与汉语拼音的对应关系。在编写如下代码进行处理的时候,出现中文乱码。查了很多blog发现方法并不好使。除了这位大神。。。。。这位出现问题就去阅读文档的大神。。。。https://www.jianshu.com/p/69401b84419e查阅requests和bs4的官方文档,发现了这样两段描述:When you make a requ...
2018-12-18 16:56:14 1223 1
amazing picture.zip
2020-09-17
CentOS-6.5-x86_64xunlei种子文件.zip
2020-06-02
中文褒贬义词词典.txt
2019-12-03
商品评论情感语料库.txt
2019-12-03
中文情感词汇本体.txt
2019-12-03
中文微博情感分析测评数据.txt
2019-12-03
berlelely 计算机SICP16完整文档
2019-03-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人