关闭
当前搜索:

Kibana搜索数据

您可以通过在查询栏中输入搜索条件来搜索与当前索引模式匹配的索引。您可以执行简单的文本搜索,使用 Lucene 查询语法,或使用完整的基于 JSON 的 Elasticsearch Query DSL。 当您提交搜索请求时,柱状图,文档表和字段列表会更新以反映搜索结果。命中的总数(匹配文档)显示在工具栏中。文件表显示前五百次点击。默认情况下,匹配按时间倒序排列,最新的文档将首先显示。您可以...
阅读(85) 评论(0)

每个数据科学专家都应该知道的六个概率分布

介绍 假设你是一所大学的老师。在对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据录入人员,并告诉他创建一个包含所有学生成绩的电子表格。但这个人却只存储了成绩,而没有包含对应的学生。 他又犯了另一个错误,在匆忙中跳过了几项,但我们却不知道丢了谁的成绩。我们来看看如何来解决这个问题吧。 一种方法是将成绩可视化,看看是否可以在数据中找到某种趋势。...
阅读(205) 评论(0)

推荐系统

推荐系统的本质是什么? 比如说我们看到手机淘宝首页,往下一拉,就能看到各种各样推荐的商品;比如说百度,它会给我们推荐广告,在某种程度上他的工作方式也很像推荐系统;再比如说今日头条,今日头条从数十万的新闻中选出会被我们看到的数十个新闻,这也是推荐系统。 尽管我们在生活中会已经见过非常多的推荐系统,但是在用机器学习搭建推荐系统之前,我们还是应当先思考一下,推荐系统要解决的到底是...
阅读(313) 评论(0)

混合型数据聚类(R)

利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这些文字并没有过多地介绍如何处理混合型数据(如同时包含连续型变量、名义型变量和顺序型变量的数据)。本文将利用 Gower 距离、PAM(partitioning around medoids)算法和轮廓系数来介绍如何对混合型数据做聚类分析。 ----------------------...
阅读(101) 评论(0)

spaarkr 的使用

日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能: 实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端筛选并聚合Spark数据集,接着在R中实现分析与可视化利用Spark的MLlib机器学习库在R中实现分布式机器学习算法可以创建一个扩展,用于调用Spark API。并为Spark的所有包集提供了一个接口未来在RStudio IDE中集成支持Spa...
阅读(86) 评论(0)

用R Markdown 生成数据分析报告

为了创建 R Markdown报告,打开text文件,并将它保存为.Rmd 文件。File > New File > Text File 确保保存成 .Rmd文件, RStudio IDE能够很大程度上帮助你完成整个任务.,你可以保存通过File > Save。修改扩展名。 R Markdown 报告由一下3部分组成: text文本 knitr 处理 R c...
阅读(986) 评论(0)

产品经理需要了解的算法——热度算法和个性化推荐

1. 算法的发展阶段 个性化推荐不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化推荐也无法开展。 所以在产品发展的初期,推荐内容一般采用更加聚合的“热度算法”,顾名思义就是把热点的内容优先推荐给用户。虽然无法做到基于兴趣和习惯为每一个用户做到精准化的推荐,但能覆盖到大...
阅读(887) 评论(0)

利用分类模型学习特征权重

在有的时候,我们需要学习出特征在分类器中所占的比重,例如判断某个人是否具有贷款资格,特征收入应该比年龄要更重要一些,那么具体重要多少,我们可以通过训练数据学习出来。 第一个办法可以借鉴决策树中特征选择的思想,以贷款为例,特征向量={年龄,收入,有房子,婚否}。通过计算每个特征Ai在训练数据集下的信息增益:  gi(D,Ai)=H(D)−H(D|Ai),i=1,2,3,4  ...
阅读(82) 评论(0)

python函数scatter使用

最近开始学习Python编程,遇到scatter函数,感觉里面的参数不知道什么意思于是查资料,最后总结如下: 1、scatter函数原型 2、其中散点的形状参数marker如下: 3、其中颜色参数c如下: 4、基本的使用方法如下: [python] view plain copy #导入必要的模块  import numpy as np  im...
阅读(220) 评论(0)

numpy方法总结

NumPy基本方法 一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等 读取数组元素:如a[0],a[0,0] 数组变形:如b=a.reshape(2,3,4)将得到原数组变为2*3*4的三维数组后的数组;或是a.shape=(2,3,4)或a.resize(2,3,4)直接改变数组a的形状 数组组合:水平组合hst...
阅读(139) 评论(0)

python匹配问题

print('%s' % 42) #输出字符串类型 print('%d' % 42) #十进制整数 print('%d%%' % 100) #文本值本身 actor = 'richard gere' cat = 'chester' weight = 28 print("my wife's favorite actor is %s" % actor) #字符串类的%s意味着需要插入一...
阅读(70) 评论(0)

python第六章习题

#第六章习题 #练习1:创建一个名为Thing的空类并将它打印出来,接着,创建一个属于该类的对象example,同样将它打印出来 class Thing(): pass print(Thing()) class Thing(): example = Thing() #Thing()创建了一个Thing()类的对象,并赋值给example这个名字。由于T...
阅读(161) 评论(0)

python类和对象

#第六章对象和类 #使用class定义类 class person(): def __init__(self,name): self.name = name hunter = person('elmer fuud') print('the mighty hunter:',hunter.name) #在person内部,可以直接通过self.name访问name特性,而...
阅读(103) 评论(0)

同一台电脑安装python2和python3

Python 是一门很不错的语言,语言简单易学,又不失脚本语言的灵活性,还有海量的第三方库,覆盖的很全面。但也有不少“硬伤”,比如 Python 2.x 和 Python 3.x 版本之间的不兼容等等。 注:我的电脑是win10+64位 安装多版本python 1、安装python需要到官网下载安装包,官网  安装的过程不需要多说,记得两个版本的py分别安装在不同文...
阅读(1048) 评论(0)

python盒子:模块,包和程序

# -*- coding: utf-8 -*- #使用Counter()计数 from collections import Counter breakfast = ['spam','spam','egg','spam'] breakfast_counter = Counter(breakfast) print(breakfast_counter) #函数most_commom()以降序返回所有...
阅读(258) 评论(0)
55条 共4页1 2 3 4 下一页 尾页
    个人资料
    • 访问:22175次
    • 积分:458
    • 等级:
    • 排名:千里之外
    • 原创:18篇
    • 转载:37篇
    • 译文:0篇
    • 评论:3条
    最新评论