自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

飘过的春风

小白的进阶

  • 博客(642)
  • 资源 (19)
  • 收藏
  • 关注

原创 Word2vec简介,入门

word2vec构建的过程: https://www.cnblogs.com/Newsteinwell/p/6034747.htmlhttps://blog.csdn.net/zhaoxinfan/article/details/11069485Word2vec,是用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输...

2018-07-15 17:32:07 14487

原创 论文阅读:基于用户上网数据的电影个性化推荐系统研究

基于用户上网数据的电影个性化推荐系统研究赵鹏程,黄韬**(北京邮电大学信工程学院,北京 100876) 摘要:本文讲述了如何构建出完整电影知识图谱的方法,同时提出了一套发掘电影系列的实现算法。基础数据为用户的上网请求,在不需要用户参与的情况下获得用户的电影兴趣行为,从中提取出与电影相关的上网数据,然后根据电影知识图谱将用户上网行为一一映射为用户兴趣行为,达到提取用户兴趣的目的。基于...

2018-07-15 15:13:58 18915 3

原创 论文阅读:知识图谱技术综述

知识图谱技术综述徐增林1,盛泳潘1,贺丽荣1,王雅芳2 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配, 搜索将根据用户查询的情境与意图进行推理,实现概念检索。与此同时,用户的搜索结果将具有层次化、结构化等重要特征。例如,用户搜索的关键词为梵高,引擎就会以知识卡片的形式给出梵高的...

2018-07-13 09:09:30 2077

原创 论文阅读:知识图谱的推荐系统综述

知识图谱的推荐系统综述常亮,张伟涛,古天龙,孙文平,宾辰忠(桂林电子科技大学广西可信软件重点实验室, 广西 桂林 541004) 摘要:搜索引擎和推荐系统是解决信息过载的代表技术。传统的搜索引擎在本质上来讲是帮助用户过滤和筛选信息,这种方式满足了大多数 人的需求,但没有提供个性化的服务。相对于传统搜索引擎来说,推荐系统可以兼顾个性化需求和解决信息过载问题。推荐系统是信息过滤系统的一个 子集,目的在...

2018-07-06 15:31:21 10158

转载 Boost Graph Library 快速入门

Boost Graph Library快速入门 图领域的数据结构和算法在某些方面比容器更为复杂,图算法在图中移动有着众多的路线,而STL使用的抽象迭代器接口不能有效的支持这些。作为替换,我们为图提供了一个的抽象的结构,其与容器迭代器的目的类似(尽管迭代器扮演着更大的角色)。图1 描述了STL 和BGL 之间的对比。 图1: The...

2018-06-28 08:27:41 13284 1

原创 牛牛打响指--大数做除法

链接:https://www.nowcoder.com/questionTerminal/442cbe24e08447729543510c2eb47082来源:牛客网牛牛在地上捡到了一个手套,他带上手套发现眼前出现了很多个小人,当他打一下响指,这些小人的数量就会发生以下变化:如果小人原本的数量是偶数那么数量就会变成一半,如果小人原本的数量是奇数那么数量就会加一。现在牛牛想考考你,他要打多少次响...

2018-06-15 15:32:58 781

原创 二叉树的性质

二叉树:树中每个节点至多有两个子节点二叉搜索树:对于树中任何节点,如果其左子节点不为空,那么该节点的value值永远 >= 其左子节点;如果其右子节点不为空,那么该节点的value值永远 <= 其右子节点(左子节点<value<右子节点)满二叉树:树中除了叶子节点,每个节点都有两个子节点完全二叉树:在满足满二叉树的性质后,最后一层的叶子节点均需在最左边完美二叉树:满足完全二...

2018-06-13 21:28:59 1668 1

转载 Pandas的merge和groupby用法

1.merge用来连接两个DataFrame对象,参数on选择基于哪个列进行连接,how选择内连接,左连接还是全连接的方式。merge操作类似于SQL中的join操作。[python] view plain copyimport pandas as pd  df1 = pd.DataFrame({'key':['b','b','a','c','a','b'],'data1':range(6)}) ...

2018-05-24 16:24:48 2310

转载 word2vec的原理

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”word2vec是什么word2vec(word to vector)是一个将单词转换成向量形式的工具。word2vec有什么用word2vec适合用作序列数据的分类,聚类和相似度计算。有用作app下载推荐系统中...

2018-05-18 12:54:17 14683 1

转载 58同城推荐系统架构设计与实现-top100summit

博客原文:https://mp.weixin.qq.com/s/Skf0aAi7pZPsoKCXm9Up_A2014年11月21日,58同城将在top100summit峰会的“架构设计专场”分享“58同城推荐系统架构设计与实现”,本文是对分享主题的一个“简要”的介绍。主题58同城推荐系统架构设计与实现一、推荐系统架构介绍推荐系统是一个微庞大的工程、算法与业务综合的系统,其主要分为三大子系统:1)线...

2018-05-17 10:10:58 1184

转载 python函数 range()和arange()

range(start, end, step),返回一个list对象,起始值为start,终止值为end,但不含终止值,步长为step。只能创建int型list。arange(start, end, step),与range()类似,但是返回一个array对象。需要引入import numpy as np,并且arange可以使用float型数据。>>> import numpy...

2018-05-15 20:50:35 16820 1

转载 Sql语句中IN和exists的区别及应用

我们在程序中一般在做SQL优化的时候讲究使用EXISTS带替代IN的做法,理由是EXISTS执行效率要比IN高。之前我一直挺懵懂的一件事情是如何使用EXISTS来替换IN呢,二者表示的意义又是什么呢?今天就我个人理解记录一下。IN表示范围,指某一字段在某一范围之内,这个范围一般使用子查询来获取,由此可知IN子查询返回的结果应该就是这个范围集。EXISTS表示存在,指至少存在一处,这个条件由EXIS...

2018-05-13 16:40:06 1262

转载 推荐引擎系统架构

本文从互联网收集并整理了推荐系统的架构,其中包括一些大公司的推荐系统框架(数据流存储、计算、模型应用),可以参考这些资料,取长补短,最后根据自己的业务需求,技术选型来设计相应的框架。后续持续更新并收集。。。界面UI那一块包含3块东西: 1) 通过一定方式展示推荐物品(物品标题、缩略图、简介等); 2) 给的推荐理由; 3) 数据反馈改进个性化推荐;关于...

2018-05-10 08:54:15 9229 1

转载 利用社交网络数据进行推荐

美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐结果的因素,90%的用户详细朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。6.1    获取社交网络数据的途径主要方式:电子邮件(联系人);用户在系统的注册信息(居住地和工作地);用户的位置信息(网页的IP和手机的GPS);论...

2018-05-09 23:33:48 2563

转载 利用上下文信息推荐

上下文包括用户访问推荐系统的时间、地点、心情等。一、时间上下文信息1.  时间效应简介用户兴趣是变化的。因为用户自身原因发生的变化。如小时候、长大了;工作时间增加等。若要准确用户现在的兴趣,应更关注用户最近的行为。这样只针对渐变的用户兴趣,对突变的用户兴趣很难起作用物品有生命周期。如电影,受上映时间影响,受新闻事件影响。需考虑物品在该时刻是否已过时。季节效应。反映时间本身对用户兴趣的影响。节日本身...

2018-05-09 23:26:34 1568 3

转载 《推荐系统》基于标签的用户推荐系统

1:联系用户兴趣和物品的方式2:标签系统的典型代表3:用户如何打标签4:基于标签的推荐系统5:算法的改进6:标签推荐源代码查看地址:github查看一:联系用户兴趣和物品的方式 推荐系统的目的是联系用户的兴趣和物品,这种联系方式需要依赖不同的媒介。目前流行的推荐系统基本上是通过三种方式联系用户兴趣和物品。 ...

2018-05-09 21:40:39 16253 2

转载 推荐系统冷启动问题(用户冷启动、物品冷启动、系统冷启动)

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”推荐系统的UserCF算法和ItemCF算法都是以拥有大量用户行为数据为先决条件,并以此对物品或者用户进行自动聚类。但是对于一个刚刚开始运行推荐系统的应用的网站来说,如何在没有大量用户行为数据的情况下设计个性化推荐系统并且让...

2018-05-09 20:00:49 10737

转载 推荐系统之基于图的推荐:基于随机游走的PersonalRank算法

原文目录:https://blog.csdn.net/sinat_33741547/article/category/6442592一 基本概念基于图的模型是推荐系统中相当重要的一种方法,以下内容的基本思想是将用户行为数据表示为一系列的二元组,每一个二元组(u,i)代表用户u对物品i产生过行为,这样便可以将这个数据集表示为一个二分图。假设我们有以下的数据集,只考虑用户喜不喜欢该物品而不...

2018-05-09 12:29:26 4169

原创 准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F值(F-Measure)、AUC、ROC的理解

一、准确率、精确率、召回率和 F 值 是选出目标的重要评价指标。不妨看看这些指标的定义先:(1)若一个实例是正类,但是被预测成为正类,即为真正类(True Postive TP)(2)若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)(3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)(4)若一个实例是正类,但...

2018-05-09 10:38:37 108335 16

转载 随机森林算法学习(RandomForest)--bagging和boost讲解

博客原文:https://blog.csdn.net/qq547276542/article/details/78304454另一篇博客: https://blog.csdn.net/mao_xiao_feng/article/details/52728164随机森林算法学习最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm,逻辑回归...

2018-05-08 00:11:30 3576

转载 GBDT:梯度提升决策树--问答解释

博客原文:https://www.jianshu.com/p/005a4e6ac775博客中比较精彩的地方  【问】xgboost/gbdt在调参时为什么树的深度很少就能达到很高的精度?  用xgboost/gbdt在在调参的时候把树的最大深度调成6就有很高的精度了。但是用DecisionTree/RandomForest的时候需要把树的深度调到15或更高。用RandomForest所需要的树的深...

2018-05-07 23:42:48 443

转载 GBDT(MART) 迭代决策树入门教程

原文博客地址:https://blog.csdn.net/suranxu007/article/details/49910323GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。回归决策树。它在被提出之初...

2018-05-07 23:15:18 655

转载 Regression Tree 回归树

原文博客:https://blog.csdn.net/weixin_40604987/article/details/79296427

2018-05-07 21:30:31 1293

原创 python通过JPype调用java

1、安装JPype pip install jpype12、java代码如下:文件位置:com/JpypeDemo.javapackage com;public class JpypeDemo { private String str = ""; public JpypeDemo() { this.str = "JpypeDemo Init"...

2018-05-07 15:42:55 518

转载 关于LSA/LSI的博文

利用Python gensim基于中文语料建立LSA隐性语义模型https://blog.csdn.net/lo_cima/article/details/51852519分布式潜在语义分析案例(Distributed Latent Semantic Analysis)https://blog.csdn.net/questionfish/article/details/46779501潜在语义分析...

2018-05-05 17:22:21 441

转载 中文语料库有哪些

中文自然语言处理开放平台由中国科学院计算技术研究所·数字化室&软件室创立一个研究自然语言处理的一个平台,里面包含有大量的训练测试语料。语料库:http://www.nlp.org.cn/docs/doclist.php?cat_id=9&type=15文本语料库:http://www.nlp.org.cn/docs/doclist.php?cat_id=16&amp...

2018-05-04 11:21:43 19335 4

转载 奇异值分解(SVD)和主成分分析(PCA)(讲解很清楚明了)

奇异值分解(SVD)原文链接:http://www.cnblogs.com/pinard/p/6251584.html主成分分析(PCA)原文链接:http://www.cnblogs.com/pinard/p/6239403.html

2018-05-03 16:52:48 5185

转载 nlp--使用TF-IDF进行文档分类(文档相识度分析)

  1、TF-IDF与余弦相似性的应用(一):自动提取关键词  2、TF-IDF与余弦相似性的应用(二):找出相似文章  3、如何计算两个文档的相似度(一)  4、gensim做主题模型  5、当然还可以看看吴军博士的《数学之美》第十一章 如何确定网页和查询的相关性。    其中第4篇文章(gensim做主题模型)使用了python的gensim工具包做了关于使用TF-IDF、LDA和LSI的文档...

2018-05-03 15:02:31 856

转载 nlp---TF-IDF原理及使用

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方...

2018-05-03 14:28:23 14900 2

原创 推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。” 目前推荐系统研宄的主要趋势是从单一的、独立的推荐系统算法逐渐向组合多种推荐算法形成混合式的综合推荐算法方向发展,越来越多的结合用户标签数据、社交网络数据、上下文信息、地理位置信息。群体推荐也成为一个目前非常热门的...

2018-05-02 20:35:24 37696 6

转载 Gensim入门教程

原文:https://www.cnblogs.com/iloveai/p/gensim_tutorial.htmlWhat is Gensim?Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任...

2018-05-01 20:21:03 2227

转载 Python中文分词 jieba 十五分钟入门与进阶

原文:https://blog.csdn.net/fontthrone/article/details/72782499整体介绍jieba 基于Python的中文分词工具,安装使用非常方便,直接pip即可,2/3都可以,功能强悍,博主十分推荐 github:https://github.com/fxsjy/jieba 开源中国地址:http://www.oschina.net/p/jieba/?f...

2018-05-01 20:00:14 360

转载 nlp---Nltk 常用方法

引言在nltk的介绍文章中,前面几篇主要介绍了nltk自带的数据(书籍和语料),感觉系统学习意义不大,用到哪里看到那里就行(笑),所以这里会从一些常用功能开始,适当略过对于数据本体的介绍。文本处理词频提取把切分好的词表进行词频排序(按照出现次数排序),123all_words = nltk.FreqDist(w.lower() for w in nltk.word_tokenize("I'm fo...

2018-05-01 19:31:20 2731

转载 Java子类与父类之间的对象转换(说明继承)

      在使用Java的多态机制时,常常使用的一个特性便是子类和父类之间的对象转换。从子类向父类的转换称为向上转换(upcasting),通过向上转换,我们能够在编写程序时采用通用程序设计的思想,在需要使用子类对象的时候,通过把变量定义为父类型,我们可以通过一个变量,使用该父类型的所有子类型实例;从父类型向子类型的转换称为向下转换(downcasting),通过向下转换,我们能在必要的时候,将...

2018-04-24 22:57:12 31136 12

转载 C++传值,传引用,传地址的区别

    按值传递时,因为a和b是S1和S2的两个副本,所以改变的是a和b的值,S1和S2的值并未发生交换,按引用传递时,a和b就是S1和S2,只是名称不同而已,所以交换a和b的值的时候也就交换了S1和S2的值。对于按指针传递的时候,a和b是S1和S2的地址,交换时就是交换*a和*b所指的值,所以交换也是成功的。#include <iostream>using namespace st...

2018-04-17 16:46:14 1005

转载 归并排序的实现

 归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。首先考虑下如何将将二个有序数列合并。这个非常简单,只要从比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。[cpp] view plain copy//将有序数组a[]和b[]合并...

2018-04-17 16:00:15 277 1

转载 二叉搜索树的定义、查找、插入和删除

二叉搜索树的定义二叉搜索树,也称有序二叉树,排序二叉树,是指一棵空树或者具有下列性质的二叉树:1. 若任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值;2. 若任意节点的右子树不空,则右子树上所有结点的值均大于它的根结点的值;3. 任意节点的左、右子树也分别为二叉查找树。4. 没有键值相等的节点。二叉搜索树的删除:具体实现过程解析:二叉搜索树的结构实现:[cpp] view pla...

2018-04-13 21:13:17 2640

转载 deque用法详解

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”deque函数: deque容器为一个给定类型的元素进行线性处理,像向量一样,它能够快速地随机访问任一个元素,并且能够高效地插入和删除容器的尾部元素。但它又与vector不同,deque支持高效插入和删除容器的...

2018-04-13 09:15:38 134557 17

原创 牛客网-牛牛找工作

链接:https://www.nowcoder.com/questionTerminal/46e837a4ea9144f5ad2021658cb54c4d时间限制:2秒空间限制:65536K为了找到自己满意的工作,牛牛收集了每种工作的难度和报酬。牛牛选工作的标准是在难度不超过自身能力值的情况下,牛牛选择报酬最高的工作。在牛牛选定了自己的工作后,牛牛的小伙伴们来找牛牛帮忙选工作,牛牛依然使用自...

2018-04-09 22:59:52 946 1

转载 C++中set 集合用法

set的特性是,所有元素都会根据元素的键值自动排序,set的元素不像map那样可以同时拥有实值(value)和键值(key),set元素的键值就是实值,实值就是键值。set不允许两个元素有相同的键值。set的各成员函数列表如下:1. begin()--返回指向第一个元素的迭代器2. clear()--清除所有元素3. count()--返回某个值元素的个数//值为1或者04. empty()--如...

2018-04-08 09:38:00 1636

Higgs Boson竞赛训练数据

Higgs Boson竞赛训练数据 。竞赛官网:https://www.kaggle.com/c/higgs-boson/

2018-03-03

蘑菇数据集

xgboost、蘑菇数据集、xgboost、蘑菇数据集、xgboost、蘑菇数据集、

2018-03-02

Mushroom Classification--xgboost训练数据

xgboost训练数据,Mushroom Classification。Mushroom Classification--xgboost训练数据

2018-03-02

大话众筹及案例PPT 学习

众筹商业模式及众筹案例介绍

2016-12-15

众筹网概况

众筹商业模式介绍 和众筹网的盈利模式、经营成本等概述

2016-12-15

Linux就是这个范儿

Linux就是这个范儿,适合linux学习

2015-11-26

杭电acm课件

杭电acm入门联系,很详细!适合刚入门,不熟悉输入输出格式的同学联系!

2015-08-20

菠萝科学奖男生追女生的数学模型

2013菠萝科学奖之数学奖:男生追女生的数学模型.pdf )

2014-03-18

dreamwear数据库网站开发

dreamwear数据库网站开发

2014-03-18

数据库操作

数据库操作 mysql ppt

2013-09-11

JAVA编程题全集

最新JAVA编程题全集 (50题及答案).

2013-09-11

硬件基础 钱晓捷

硬件基础 钱晓捷 ppt

2013-09-11

钱晓捷-32位汇编

钱晓捷- 32位汇编 ppt

2013-09-11

经典算法大全

经典 算法 大全

2013-09-11

java网页 html

java 网页 html

2013-09-11

C标准函数库文件.pdf

C标准函数库.pdf 快速查阅 c函数。

2013-09-11

acm题库C++与C

acm习题精粹,相信大家通过学习一定会有所提高。

2013-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除