- 博客(25)
- 资源 (1)
- 收藏
- 关注
原创 Python CF入门实验
原文在这里自己写Python 写的非常好,很受启发下一步是做出预测。你已经创建了相似性矩阵:user_similarity和item_similarity,因此,你可以通过为基于用户的CF应用下面的公式做出预测:你可以将用户k和a之间的相似性看成权重,它乘以相似用户a (校正的平均评分用户)的评分。你需要规范化该值,使打分位于1到5之间,最后,对你尝试预测的用户的平均评分求和。这里的想法是,某些用
2016-12-20 12:15:34 2190
原创 python beautifulsoup 爬虫学习
爬取IMDB上的电影关键词keyword 源HTML文档,参看文档源码# -*- coding: utf-8 -*-import urllib2from bs4 import BeautifulSoupimport unicodedatapage=urllib2.urlopen("http://www.imdb.com/title/tt1619029/keywords?ref_=tt_s
2016-12-01 21:03:44 519
原创 欢迎使用CSDN-markdown编辑器
J2EE学习笔记1、三层架构-表示层2、三层架构-事务层3、三层架构-集成层设计模式强调内容 集成层主要有两种设计模式: -数据访问对象 -服务激发器3.1数据访问对象由于数据存储类型和供应商不同,持久性存储的访问差别较大,会产生引入组件及数据源实现之间的静谧耦合。组件中这类依赖性很麻烦。使用数据访问对象(DAO)来抽象和封装所有对数据源的访问。 使用了抽象工厂的设计模式会话BEAN欢迎使用
2016-12-01 20:20:50 657
原创 数据库面试笔记
数据库基本运算:投影运算、选择运算、排序运算连接方式:内连接 inner jion外连接有三种方式:左连接,右连接和全连接。2.1 左连接:根据左表的记录,在被连接的右表中找出符合条件的记录与之匹配找不到与左表匹配的,用null表示自连接:当表中的某一个字段与这个表中另外字段的相关时,我们可能用到自连接。1、数据库设计范式:一二三范式,BCNF范式数据库
2016-10-04 22:43:28 457
转载 社交网络的好友推荐
我们平时光计算用户的关系亲密度,比如两者的SNS互动次数、媒介场景关系度、地理位置相关度,这些缺陷都很依赖用户之间的活跃程度。后来又有人提出了好友的好友、圈子、共同兴趣、共同话题等方面角度进行研究。实际场景中我们也是会结合 “社交”+“兴趣”两点平衡,找到一个比较融合的权衡,推荐用户感兴趣的content。1、计算共同好友比例缺点也是显而易见的, 如果用户好友人数不够多, 那么无论是为
2016-08-11 17:56:02 2890
转载 一个完整推荐系统的设计实现-以百度关键词搜索推荐为例
一个完整推荐系统的设计实现-以百度关键词搜索推荐为例标签: 互联网 大数据 推荐系统 搜索引擎 数据挖掘 | 发表时间:2014-09-17 12:39 | 作者:semo2524分享到:出处:http://semocean.com在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门关键词的问题。 在回答这个问题的时候, 想到了近几年在
2016-06-15 08:41:37 1813
原创 关联规则-web数据挖掘学习2
关联规则ASSOCIATION RULE文本中应用:单词间的并发关系 特点:不考虑序列顺序,而序列挖掘考虑顺序基本概念:一个关联规则是一个如下形式的蕴含关系:x->y,且无交集 支持计数衡量关联规则强度的指标:支持度:如果支持度太小,表明该规则很可能只是偶然发生,覆盖的食物很少无价值。置信度:可预测度,如果置信度太低,表示很难可靠的做出该规则推断。目标找出所
2016-05-06 15:40:14 1288
原创 web数据挖掘学习1
万维网特征:数据大,主题广泛内容丰富。各种类型的数据(结构化表格,半结构化网页,无结构化文本,多媒体)网络信息异构权威网页噪音:一张网页上的有用信息和噪声2、各界评论万维网的动态性数据挖掘:分类(监督学习)聚类(无监督学习)关联规则挖掘、序列模式挖掘步骤:预处理:噪音、数据的不完整性,方法:采样和选择特定属性来降低数据量降维挖掘:后续:将发现的模式进行评
2016-05-05 21:39:42 635
原创 算法1:1020. Big Integer
题目链接http://soj.sysu.edu.cn/1020点击打开链接解释:超出位数的大数的存储已知要求条件:1) 1 2) gcd(bi,bj) = 1 (1 大整数X:非负且小于M (其中M = b1*b2*...*bn)x表示为(x mod b1,x mod b2,x mod b。。。。,)输入:多个Test测试组 T(使用循环)
2016-03-04 17:17:27 591 1
原创 教你如何判断无损连接和函数依赖
教你如何判断无损连接和函数依赖无损分解和保持依赖的判断大部分是对一个关系模式分解成两个模式的考察,分解为三个以上模式时无损分解和保持依赖的判断比较复杂,考的可能性不大,因此我们只对“一个关系模式分解成两个模式”这种类型的题的相关判断做一个总结。以下的论述都基于这样一个前提:R是具有函数依赖集F的关系模式,(R1,R2)是R的一个分解。首先我们给出一个看似无关却非常重要的概念
2013-06-30 23:38:44 6249 2
转载 android界面布局3
Android对用五大布局对象,它们分别是FrameLayout(框架布局),LinearLayout (线性布局),AbsoluteLayout(绝对布局),RelativeLayout(相对布局),TableLayout(表格布局). FrameLayout: FrameLayout是最简单的一个布局对象。它被定制为你屏幕上的一个空白备用区域,之后你可以在其中填充一个单一对象
2013-04-15 21:29:12 712
转载 android界面布局2
现在Android非常疯狂,所以网上关于Android学习的资料如雨后春笋般冒起来,像这些基础的东西更是多如牛毛,我会把用过的东西碰到的困难和怎么解决的记录下来,一来可以供自己复习万一以后又碰到类似的问题就可以直接拿来看下。二来可以给初学者一点小小的帮助在android中我们常用的布局方式有这么几种:LinearLayout (线性布局),RelativeLayout (相对布局),Tab
2013-04-15 21:26:53 664
转载 android界面布局1
布局: 在 android 中我们常用的布局方式有这么几种:1.LinearLayout ( 线性布局 ) :(里面只可以有一个控件,并且不能设计这个控件的位置,控件会放到左上角) 线性布局分为水平线性和垂直线性二者的属性分别为: android:orientation= "horiz
2013-04-15 21:25:06 786
原创 排序算法比较
实验报告 专业___软件工程____ 班级___5__ 学号__1230120111__181___ 姓名 陈叶彤 实验日期: 2013 年1 月5 日 报告退发 (订正、重做) 课程 数据结构 实验名称 排序 一、 实
2013-02-02 21:07:24 502
原创 图的遍历
实验八图的遍历操作一、 实验目的1.掌握图的基本存储方法; 2.熟练掌握图的两种搜索路径的遍历方法。二、 实验内容。1.假设图中存在以下结点:a b c d e f g,以邻接矩阵存储,请设计程序深度优先遍历该图 2.假设图中存在以下结点:a b c d e f g,以邻接表存储,请设计程序广度优先遍历该图
2013-02-02 21:05:52 976
原创 实验七 二叉树操作(二)
实验七 二叉树操作(二)一、 实验目的1. 掌握二叉树的创建2. 掌握二叉树的遍历3. 掌握二叉树的应用二、 实验内容。1.前序地创建二叉树ABC##DE#G##F###,实现复制构造函数、、返回树的高、返回结点数、层序遍历二叉树。2.设计测试步骤,测试以上每个函数。3.提高部分:遍历硬盘中某个文件夹。三、 实验环境1.pc机
2013-02-02 21:01:12 747
原创 实验四 查找
实验四查找一、 实验目的1.掌握顺序查找、二分法查找的算法。2.能运用线性表的查找方法解决实际问题。二、 实验内容。1.实现一个在无序线性表中查找元素x的算法2.给出在一个递增有序表A中采用二分查找算法查找值为x的元素的算法。3. 创建一棵二叉搜索树,给出查找元素x的算法4. 自行设计测试步骤,并在实验步骤里详细说明要测试操作的边界情况。5.
2013-02-02 20:59:37 1005
原创 实验二 单链表的实现
实验二 单链表的实现一、 实验目的1. 掌握线性表的链接存储结构;2. 验证单链表及其基本操作的实现;3. 进一步掌握数据结构及算法的程序实现的基本方法。二、 实验内容。1.根据课件关于单链表的定义,实现带头结点的单链表;2.用头插法(或尾插法)建立带头结点的单链表;3.实现基本线性表的就地逆置reverse()方法,也就是将基本线性表中的数据元素交换位
2013-02-02 20:57:56 1015
原创 实验一 顺序表实现
实验一顺序表实现实验名称:顺序表实现实验目的:1、掌握线性表的顺序存储结构的含义与实现方法2、掌握顺序表的上的插入和删除操作3、掌握顺序表的简单应用实验内容:1、根据课件关于顺序表的定义,实现顺序表2、利用所实现的顺序表存储学生表格,要求能在命令行界面输入和输出表格的记录3、测试数据A、 用数据创建表格 001 张三 2005 70
2013-02-02 20:56:12 1187
原创 查找
#include#include#include #include #include#include"Binarytree.h"using namespace std;#define CLOCK_PER_SEC 100; templatestruct BinTreeNode{ T data; BinTreeNode *leftChild, *righ
2013-02-02 20:50:43 490
原创 排序算法比较
1.稳定性比较 插入排序、冒泡排序、二叉树排序、二路归并排序及其他线形排序是稳定的 选择排序、希尔排序、快速排序、堆排序是不稳定的2.时间复杂性比较 插入排序、冒泡排序、选择排序的时间复杂性为O(n2) 其它非线形排序的时间复杂性为O(nlog2n) 线形排序的时间复杂性为O(n);3.辅助空间的比较 线形排序、二路归并排序的辅助空间
2013-01-05 18:28:49 483
转载 栈实现迷宫的较完善 程序
#include#includeusing namespace std; #define TRUE 1#define FALSE 0#define OK 1#define ERROR 0#define OVERFLOW -2typedef int Status; #define INIT_SIZE 100 //存储空间初始分
2012-12-06 18:43:42 637
转载 c++实现的简易的迷宫算法
运行环境为MS VC6.0,如果在VS上编译,请将头文件改为#includeusing namespace std;****************************以下为原代码**********************************很简单的代码#includeint const max=100;int const m=6;int const
2012-12-06 18:22:02 1008
转载 队列,栈,堆栈,数组的比较
1. 队列可以看成是有2个口的集合一个口叫队头一个叫队尾,只能在对头进行删除操作,在队尾做插入。根据这样的操作。队列特点是先进先出 2.堆栈可以看成是有1个口的集合,这个口叫栈顶。插入和删除操作只能在栈顶操作。根据这样的操作。堆栈的特点是是后进先出. 3.链表是一种存储方式,它可以在非连续的内存空间里面存储一个集合的元素。4.和它对应的是数组,数组要在连续的空间里存储集合的元素
2012-10-15 22:33:28 945
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人