自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

_HAIL_的博客

Contented with little,yet wishing for more.

  • 博客(13)
  • 收藏
  • 关注

转载 几种相似度计算代码

from math import sqrt"""余弦相似度"""def sim_distance_cos(p1,p2): c = set(p1.keys())&set(p2.keys()) if not c: return 0 ss = sum([p1.get(sk)*p2.get(sk) for sk in c]) sq1 = sq...

2019-05-14 07:51:46 4316

转载 Python 中pandas读取文件Initializing from file failed

转自:https://blog.csdn.net/qq1483661204/article/details/78524714pandas读取文件报如下的错误:--------------------------------------------------------------------------OSError Trace...

2018-06-06 15:13:31 404

转载 相似度算法

转自:http://blog.sina.com.cn/s/blog_62b83291010127bf.html在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很多,最近查阅了相关的资料,这里整理罗列下。  为了方便下面的解释...

2018-05-05 22:29:30 1169 1

转载 推荐系统之协同过滤概述

转载学习,谢谢博主分享!http://www.vanjor.org/blog/2011/05/rs-collaborative-filtering/协同过滤(Collaborative Filtering)是现今推荐系统中应用最为成熟的一个推荐算法系类,它利用兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的资讯,个人透过合作的机制给予资讯相当程度的回应(如评分)并记录下来以达到过滤的目的进而...

2018-05-03 09:39:03 693

原创 【大数据杀熟】----知乎----词频分析

【大数据杀熟】一词近来相当火热,大哥邀我和他一起利用假期做了这个项目,我负责知乎上有关【大数据杀熟】全量信息的抓取,以及绘制词云,记录一下我遇到的问题以及一些学习心得。 我们的推文,欢迎关注【带吧网络】公众号哟~~关于爬虫 简单点,爬虫的方式简单点 知乎登录的问题。 我在抓取知乎上的信息时发现必须保持登录状态才可以获得信息,但是模拟登录知乎重写代码有点麻烦,大哥...

2018-04-09 16:30:23 2872 1

原创 我家的喵咪

我昨天晚上做了一个梦,梦见我回家了,我家猫看见我声音叫的特别大声,我感觉她要哭了,一直抬头看着我叫,像是兴奋但又像是有些悲伤又带着对我的愤怒。好像在大声质问我,你这些天都去哪里了!!离开家之前我有些担心她,因为她除了吃猫粮什么都不吃,而在家里面,奶奶总是觉得她碗里有东西就是不饿,其实她是不愿意吃其他东西而已。给她藏了几包猫粮,我想,买都买了,不喂就过期了,奶奶肯定会因为舍不得扔掉而好好喂猫的。我家...

2018-03-27 18:36:14 207

原创 git 新建分支修复bug学习笔记

个人的几个疑问:为什么不直接切换分支修改bug,然后合并?Super Girl@DESKTOP-NOEE1D4 MINGW64 ~/learngit/gitskills (featurel)$ git add bug.txtSuper Girl@DESKTOP-NOEE1D4 MINGW64 ~/learngit/gitskills (featurel)$ git chec...

2018-03-14 15:42:11 1385

原创 python拓扑排序

发现自己并没有真的理解拓扑排序,再次学习了下拓扑排序要满足如下两个条件每个顶点出现且只出现一次。若A在序列中排在B的前面,则在图中不存在从B到A的路径。拓扑排序算法任何无回路的顶点活动网(AOV网)N都可以做出拓扑序列:从N中选出一个入度为0的顶点作为序列的下一顶点。从N网中删除所选顶点及其所有的出边。反复执行上面两个步骤,知道已经选出了图中的所有顶...

2018-03-12 19:30:32 585

原创 Python 创建线程本地数据

import threading# 假定这是你的银行存款:local_balance = threading.local()local_balance.num = 0def change_it(n): # 先存后取,结果为0: local_balance.num = 0 local_balance.num = local_balance.num + n ...

2018-02-26 21:49:21 299

原创 Python 多线程join()小笔记

        启动一个进程后会默认产生一个主线程,设置多线程时,会创建很多的子线程,这里有一个很关键的参数设置,守护进程Daemon,默认情况下,setDaemon(False),这种情况主线程结束后就退出了,如果子线程还没有结束可以继续执行,而当我们开启守护进程时(即setDaemon(True))主线程一结束,无论子线程有没有执行完都统统被杀死,如下:默认情况下:import time, t...

2018-02-25 22:34:51 457

原创 shutil.copyfile: PermissionError: [Errno 13] Permission denied

shutil.copyfile(src, dst, *, follow_symlinks=True)Copy the contents (no metadata) of the file named src to a file nameddst and return dst. src and dst are path names given as strings.dst must be the ...

2018-02-22 11:27:10 10086 2

原创 从win7到win10的那些事~

为啥要换成win10?我之前可一直都是win7粉,在知乎上搜了一波win10的体验之后,感觉相对于win7而言更好看更快,再加之现在win10对大部分软件都兼容了,所以就转粉了,听说**win10 LTSB长期服务版**这款深受用户好评,所以就装的这款,关于激活系统的问题一开始别人推荐我去**淘宝买key**,我看了下也就十几块钱,后来下了**KMS**激活office 2016的时候,他顺便就帮

2018-02-07 16:07:36 3700 1

原创 Python整站式爬虫并存储数据库练习

数据库操作 ----- 正则表达式 ----- 将爬取到的数据存储到数据库

2017-10-23 13:33:18 568 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除