自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 使用Python计算物品的流行度和用户所评物品的平均流行度

使用Python计算物品的流行度和用户所评物品的平均流行度计算物品的流行度import numpy as npimport pandas as pdfrom pandas import DataFrame def cal_ItemDegree(): wf = open("filename", 'w') data=pd.read_csv("ml1m",sep='::',index

2016-06-29 03:10:47 3767 1

原创 Pearson相关系数公式的四种形式及Python代码实现

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。第一种形式(也就是定义的形式):第二种形式:第三种形式:第四种形式:(其中,E为数学期望或均值,N为数据的数目,E{ [X-E(X)] [Y-E(Y)]}称为随机变量X与Y的协方差,记为Cov(X,Y))根据第四种形式的公式,使用python实现计算两列数据的pearson相关系数的代码:from math import sqrtd

2016-06-22 22:18:50 20988

原创 项亮《推荐系统实践》读书笔记3-利用用户标签数据进行推荐

利用用户标签数据进行推荐推荐系统联系用户和物品的三种方式: (1) 利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品,也就是ICF算法; (2) 利用与用户兴趣相似的其他用户,给用户推荐那些和他们兴趣爱好相似的其他用户喜欢的物品; (3) 通过一些特征联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品。这些特征可以是物品的属性集合,也可以表现为隐语义向量。标签是一种重要的特征

2016-05-11 23:02:22 1327

原创 项亮《推荐系统实践》读书笔记2-推荐系统冷启动问题

推荐系统冷启动问题如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。冷启动问题主要分为三类: (1) 用户冷启动:如何给新用户做个性化推荐的问题,新用户刚使用网站的时候,系统并没有他的行为数据; (2) 物品冷启动:解决如何将新的物品推荐给可能对它感兴趣的用户; (3) 系统冷启动:如何在新开发网站设计个性化推荐系统,此时网站上用

2016-05-11 22:58:17 7763

原创 项亮《推荐系统实践》读书笔记1-推荐系统评价指标

推荐系统评价指标1.评分预测 预测准确度: 均方根误差(RMSE): 平均绝对误差(MAE): 关于这两个指标的优缺点,Netflix认为RMSE加大了对预测不准的用户物品评分的惩罚(平方项的惩罚),因为对系统的评测更加苛刻。研究表明,如果评分系统是基于整数建立的(即用户给的评分都是整数),那么对预测结果取整会降低MAE的误差。2.Top N推荐:给用户一个个性化的推荐列表,预测准确

2016-05-11 22:41:17 10632

转载 Win10家庭版无法删除文件提示“你需要来自system的权限”的解决方案

虽然win10系统的功能非常强大,但是用户在使用过程中仍会遇到一些麻烦。比如,有些windows10用户在删除文件时,就会遇到错误提示“你需要来自SYSTEM的权限才可以对此文件夹进行更改”。

2016-05-05 22:46:50 26147 1

原创 Mysql使用注意问题

Mysql使用注意问题duplicate entry for primary key:因为重复向数据库导入已经存在的数据,删除重复的值即可;mysql 5.5版本中文不能导入的问题:将my.ini中client和server中的字符集改成GBK,如果使用可视化工具(比如navicate)时也要注意选择GBK字符集;auto_increment:自动插值的列不必在写插入语句的时候出现; eg:

2016-05-02 22:23:45 614

原创 《利用Python进行数据分析》第二章pivot_table报错问题

学习《利用Python进行数据分析》第二章的时候,处理1880-2010年间全美婴儿姓名数据,有句代码总是报错:total_births=names.pivot_table('births',rows='year',cols='sex',aggfunc=sum)报错信息如下:Traceback (most recent call last): File "<ipython-input-75-8b

2015-08-17 14:37:46 12646 3

转载 MySQL常见命令和操作一览

mysqldexe 和 mysqlexe 的区别mysqldexe 常见命令mysqlexe常见命令一连接MYSQL二修改密码三增加新用户四常见操作五备份数据库mysqld.exe 和 mysql.exe 的区别:mysqld.exe 是MySQL后台程序(即MySQL服务器)。要想使用客户端程序,该程序必须运行,因为客户端通过连接服务器来访问数据库。mysql.exe 是MySQL自

2015-08-13 15:14:46 702

原创 Win7设置MySQL自启动的方法

右键“计算机(我的电脑)”–>右键“管理”,到计算机管理界面,查看是否有MySQL服务。如果没有,将其加入,方法如下: 输入“cmd“查找”cmd.exe“文件,右键,以管理员身份运行,进入MySQL的安装目录下,比如我的是E:\wamp\bin\mysql\mysql5.5.8\bin,输入命令:mysqld --install MySQL --defaults-file="xxx"“xxx”为

2015-08-13 14:19:59 2567

原创 highcharts如何在一个图表中使多条曲线在不同刻度下显示

问题:不同的曲线显示在同一种Y轴刻度下,因数据范围的差别,显示的曲线对数据的刻画明显程度便差别很大,一些数据范围小的曲线几乎成为一条直线,不能很清晰地反映出数据的变化趋势。如图所示:查了很多资料,也看了highcharts的API,依然没有头绪,在甫文兄的帮助下完美地解决了这个问题。解决方法:在yAxis下设置数组,yAxis: [{ title: {

2015-07-30 16:16:38 6399

原创 使用highcharts插件时图表无法显示且jQuery报错:Uncaught ReferenceError: $ is not defined

在使用基于jQuery的第三方插件highcharts的的时候,因为js文件的引用不当可能会导致图表无法正常显示且jQuery有如下报错的问题:Uncaught ReferenceError: $ is not defined (anonymous function)原因及解决方法:1.可能是jQuery库文件的路径不对;检查文件路径是否正确,一般就能解决该错误。2.如果库文件的路径是正确的,那么

2015-07-30 13:23:30 6133

原创 使用git客户端第一次git clone github.com代码的方法

使用git客户端第一次git clone github.com代码的方法使用git-clone命令从github上同步github上的代码库时,如果使用SSH链接,而你的SSH key没有添加到github帐号设置中,系统会报下面的错误: Permission denied (publickey). fatal: Could not read from remote repositor

2015-07-28 17:04:25 13249

原创 使用JPA连接MySQL数据库

使用JPA连接MySQL数据库步骤:(1)下载JPA所需要的库函数; (2)创建实体java文件; (3)创建Persistence.xml,此文件将配置数据库并制定实体类; (4)使用JPA添加CRUD操作: (5)根据测试结果修改代码,再测试,直到被测试的代码完全正确。Questions:1.What is persistent class?持久化类:在应用程序中,用来实现业务问题实体的

2015-04-18 22:50:36 5972

原创 使用JUnit框架进行单元测试

使用JUnit框架进行单元测试步骤:(1)对minilab1的每个java代码文件新建一个JUnit Test Case; (2)JUnit Test Case尽可能覆盖每个java文件的每个类; (3)单个文件测试:对所写的每个Junit Test Case执行“Run as –JUnit Test”; (4)构建自动测试: 使用Eclipse Marketplace安装Infinitest

2015-04-18 22:44:04 1717

原创 基于REST的Webservice

基于REST的Webservice步骤:(1)配置mysql和tomcat工作环境; (2)设置 Jersey 的环境; 首先,为 Eclipse 上的 Tomcat创建服务器运行时。这是用于 RESTful Web 应用程序的 Web 容器。然后创建一个名为 “Jersey” 应用程序。 (3)建立动态Web工程,然后创建配置文件web.xml; (4)开发实现post和get功能的RES

2015-04-18 22:37:28 1489

数据挖掘中十大经典算法

数据挖掘中十大经典算法,让你对数据挖掘算法有个大致了解!

2014-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除