Xcy的博客

技术小白~

pycharm 创建文件时自动添加文件头注释

python文件头有重复的,例如 #!/usr/bin/env python # -*- coding: utf-8 -*- 在利用pycharm新建文件的时候,可以设置在生成py文件的时候添加: File -> Editor -> File an...

2018-05-28 11:25:28

阅读数 239

评论数 0

Git使用——开端

马上就要入职了,在此把要用到的技术梳理一番,也当做是自己入职前的功课了吧~ 安装git之后,首先配置用户名和邮件地址 git config --global user.name name git config --global user.email email 查看当前提交的用户名和邮件...

2018-05-27 17:15:21

阅读数 84

评论数 0

愿世界没有技术面全是Hr面

本人技术渣,渣到什么程度呢,没写过项目,天天看paper(动漫),平常接触最多语言是Matlab。 目前的Offer情况: 华为Hr面定比普通高一级(Hr说给你高一级不是因为你的技术,是因为你的人物模型), 招商银行FinTech管培,微众银行提前批(给的是校招Offer,和优招大佬不能比),美团...

2017-09-25 11:02:35

阅读数 2537

评论数 5

E: Unable to lock the administration directory (/var/lib/dpkg/), is another process using it?

sudo rm /var/lib/dpkg/lock sudo dpkg --configure -a

2017-09-18 09:43:06

阅读数 377

评论数 0

pandas 安装

pip install -i https://pypi.douban.com/simple pandas

2017-09-18 09:41:15

阅读数 416

评论数 0

推荐算法——基于上下文的推荐

将时间信息和地点信息建模到推荐算法中,从而让推荐系统能够准确的预测用户在某个特定时刻以及特定地点的兴趣。本文中主要考虑时间因素: 在给定时间信息后,推荐系统从一个静态系统变成了一个时变的系统,用户的行为数据也变成了一个时间序列。此时用户的数据集变为(u,i,t)(u,i,t):用户u在时刻t对物...

2017-07-29 10:09:03

阅读数 2966

评论数 0

推荐系统——标签推荐系统:UGC的标签应用

UGC: user generated content, 用户生成的内容。 Delicious 允许用户给互联网的每个网页打标签,从而通过标签重新组织整个互联网。CiteULike 是一个著名的论文书签网站,允许研究人员提交或者收藏自己感兴趣并且给论文打标签,帮助用户更好的发现与自己领域相关的优秀...

2017-07-23 11:15:12

阅读数 3255

评论数 0

推荐算法——冷启动问题

冷启动问题: 用户冷启动:如何给新用户做个性化的推荐物品冷启动:如何将新物品推荐给可能感兴趣的用户系统冷启动:如何在新开发的网站上(无历史用户无历史物品)设计个性化推荐系统解决方案汇总: 提供非个性化的推荐:首先推荐热门排行榜,收集到一定的信息之后再切换为个性化推荐粗粒度个性化:根据用户注册时提供...

2017-07-23 10:19:20

阅读数 3005

评论数 0

推荐算法——基于图模型

基于图模型(graph-based model) 将用户行为数据表示成图的形式。 如上,用户A对物品a,b,d有行为。 表示成二分图之后,给用户u推荐物品可以转化为度量用户顶点vuv_{u}和与vuv_{u}没有边直连的物品节点在图上的相关性,相关性越高的物品在推荐列表中权重越高。 顶点的相...

2017-07-22 19:29:00

阅读数 3978

评论数 0

推荐算法——隐语义模型

LFM(latent factor model) 通过隐含特征联系用户兴趣和物品。 计算用户u对物品i的兴趣: preference(u,i)=rui=pTuqi=∑f=1Fpu,kqi,kpreference(u,i) = {r_{ui}} = p_u^T{q_i} = \sum\limi...

2017-07-22 18:46:32

阅读数 3679

评论数 1

UserCF和ItemCF 比较

UserCF 原理: 给用户推荐和他有共同爱好的用户喜欢的物品,更加社会化,反映了用户所在小型兴趣群体中物品的热门程度; ItemCF 原理: 给用户推荐和他之前喜欢的物品相类似的物品,更加个性化,反应了用户自己的兴趣的传承。 方法 UserCF ItemCF 性能 用户较少的...

2017-07-20 15:21:26

阅读数 595

评论数 0

推荐算法——基于物品的协同过滤算法

基于用户的协同过滤算法在用户增长的时候,相似度计算的计算会越来越困难。基于物品的算法给用户推荐他们之前喜欢的物品相似的物品。 算法步骤 计算物品之间的相似度 根据物品的相似度和用户的历史行为给用户生成推荐列表 相似度公式如下: wij=|N(i)∩N(j)||N(i)||N(j)|−−−−−...

2017-07-20 15:08:10

阅读数 2664

评论数 0

推荐算法——基于用户的协同过滤算法

步骤 (1) 找到和目标用户兴趣相似的用户集合。(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。 如何计算相似度? 给定用户u和用户v,令N(u)表示用户u曾经有过正反馈的物品集合,令N(v)为用户v曾经有过正反馈的物品集合。余弦相似度计算如下: wuv=|N(u...

2017-07-18 17:16:44

阅读数 6724

评论数 1

推荐系统——前言

用户数据的获取 一般是日志Log , 网页的浏览以及反馈。用户行为的分析 用户的行为符合:“长尾分布”。 推荐算法 基于用户的协同过滤算法基于物品的协同过滤算法 数据集 GroupLens提供的MovieLens数据集。实验 离线的实验设计一般如下: 将用户行为数据均匀分为M份,...

2017-07-18 14:58:59

阅读数 395

评论数 0

TensorFlow 学习 - MNIST 之CNN分类

在 TensorFlow 学习 - MNIST 之 SoftMax Regression 实现(完整代码,拷贝可运行) 中详细讲解了利用TensorFlow 对MNIST数据集分类的过程,精度在91%左右。这一篇利用卷积神经网络改善模型。同样的,本文先附上完整可运行的代码,再分段介绍。

2017-06-02 16:43:05

阅读数 289

评论数 0

卷积神经网络 - 卷积池化

卷积神经网络 卷积神经网络(CNN)由输入层,卷积层,激活函数,池化层,全连接层组成。 Input - Conv - Relu - Pool - Fc 卷积层:用于特征的提取 输入图像是32 * 32 * 3(R,G,B),用一个5 * 5 * 3 的filter【注...

2017-06-02 16:08:27

阅读数 820

评论数 1

TensorFlow 学习 - MNIST 之 SoftMax Regression 实现(完整代码,拷贝可运行)

数据集以及模型介绍MNIST 数据集: Google实验室的Corinna Cortes和纽约大学柯朗研究所的Yann LeCun建的手写数字数据库,训练库有60,000张手写数字图像,测试库有10,000张。每一个MNIST数据单元有两部分组成:一张包含手写数字的图片和一个对应的标签。我们把这些...

2017-06-02 11:56:34

阅读数 685

评论数 0

TensorFlow 学习 - 变量

变量是存储和更新参数的。变量会被放入内存中。 变量的创建和初始化: 函数Variable(),初始值可以是随机值也可以是常量,初始值需要制定shape,通常shape是固定的,但是也可以通过一些高级方法调整。创建变量之后需要定义一个初始化的操作,而且在使用任何变量之前需要运行初始化的操作。 例...

2017-05-31 23:23:13

阅读数 176

评论数 0

TensorFlow 学习 - 简介

什么是TensorFlow : 采用数据流图,计算数值。 Tensor(张量,即数组) Flow(流)   TensorFlow 运行过程就是张量从图的一端流动到另外一端的计算过程。 什么是数据流图: 用节点和线的有向图描述数学计算,节点表示数学操作或者数据的输入起点重点。线表示节点...

2017-05-31 23:08:34

阅读数 205

评论数 0

论文解读: Topic Modeling of Short Texts: A Pseudo-Document View

16年北航的一篇论文 : Topic Modeling of Short Texts: A Pseudo-Document View 看大这篇论文想到了上次面腾讯的时候小哥哥问我短文档要怎么聚类或者分类。当时一脸懵逼。 short texts : 短文本,一般指的是文档的平...

2017-05-08 15:58:05

阅读数 927

评论数 0

提示
确定要删除当前文章?
取消 删除