自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SkywalkZH的博客

初入江湖,请多多指教

  • 博客(4)
  • 收藏
  • 关注

原创 Python学习笔记(四)——基于SVD的协同过滤(推荐算法)

奇异值分解(Singular value decomposition)是一种矩阵分解技术,也是一种提取信息的方法。将一个比较复杂的矩阵用更小更简单的3个子矩阵的相乘来表示,这3个小矩阵描述了大矩阵重要的特性,可以起到降维简化数据,去除数据噪声的作用。一、SVD定义:1.回顾特征值和特征分解:①特征值如果一个向量v是 NxN 方阵A的特征向量,那么可以用下式表示:其中λ...

2019-03-30 14:45:53 3846 2

原创 Python学习笔记(三)——基于用户的协同过滤(推荐算法)

一、基本原理用户A,和用户C都喜欢物品A,和物品C,表明他们兴趣相同,则可向用户A推荐物品D那么如何表示两个用户兴趣相同呢?有如下用户对物品的评分矩阵 item1 item2 item3 item4 item5 Bob 5 3 0 5 5 Alice 5 0 0 4 5 C...

2019-03-25 21:17:49 8784 3

原创 Python学习笔记(二)——pandas

一、Pandas数据结构Pandas的数据结构为Dataframe和series。Dataframe 类似于 numpy 中的二维数组,可以通用numpy数组的函数和方法。series类似于numpy中的一维数组,一位数组的函数和方法都通用,且可通过索引标签的方式获取数据,还具索引的自动对齐功能。1.Dataframe创建:①通过二维数组创建arr2 = np.array(np....

2019-03-25 00:00:44 244

原创 Python学习笔记(一)——浏览器自动化测试工具Selenium

看了网友用Python通过影评来分析电影是好片还是烂片,自己也有了个想法想去分析下百度贴吧的帖子是精品帖子还是水帖子。目前正在熟悉工具的使用。会用到的库:Selenium, pandas(数据模型),jieba(分词器),snownlp(情感分析),worldcloud(生成词云) 1.pycharm安装 Selenium,pandas与numpy库,均使用pip来自动安装pip ...

2018-10-13 19:51:33 838

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除