当前搜索:

R语言绘图函数

1. par()函数的参数详解函数par()可以用来设置或者获取图形参数,par()本身(括号中不写任何参数)返回当前的图形参数设置(一个list);若要设置图形参数,则可用par(tag = value)的形式,其中tag的详细说明参见下面的列,value就是参数值,例如:par(mar = c...
阅读(13) 评论(0)

MySQL常用语法

1、查看当前含有哪些数据库mysql> SHOW DATABASES;2、进入某个数据库use databasename;3、列出数据库中的所有表show tables;4、查看当前数据库中表的内容           select * from 表名5、退出数据库 m...
阅读(7) 评论(0)

R连接Mysql(windows)

1、下载(mysql-connector-odbc-5.3.4-winx64.msi) 1.1下载地址:http://dev.mysql.com/downloads/connector/odbc 1.2、安装mysql-connector-odbc-5.3.4-winx64.msi(安装按照默认就...
阅读(5) 评论(0)

Kibana搜索数据

您可以通过在查询栏中输入搜索条件来搜索与当前索引模式匹配的索引。您可以执行简单的文本搜索,使用 Lucene 查询语法,或使用完整的基于 JSON 的 Elasticsearch Query DSL。 当您提交搜索请求时,柱状图,文档表和字段列表会更新以反映搜索结果。命中的总数(匹配文档...
阅读(263) 评论(0)

每个数据科学专家都应该知道的六个概率分布

介绍 假设你是一所大学的老师。在对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据录入人员,并告诉他创建一个包含所有学生成绩的电子表格。但这个人却只存储了成绩,而没有包含对应的学生。 他又犯了另一个错误,在匆忙中跳过了几项,但我们却不知道丢了谁的成...
阅读(291) 评论(0)

推荐系统

推荐系统的本质是什么? 比如说我们看到手机淘宝首页,往下一拉,就能看到各种各样推荐的商品;比如说百度,它会给我们推荐广告,在某种程度上他的工作方式也很像推荐系统;再比如说今日头条,今日头条从数十万的新闻中选出会被我们看到的数十个新闻,这也是推荐系统。 尽管我们在生活中会已经...
阅读(448) 评论(0)

混合型数据聚类(R)

利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这些文字并没有过多地介绍如何处理混合型数据(如同时包含连续型变量、名义型变量和顺序型变量的数据)。本文将利用 Gower 距离、PAM(partitioning around medoi...
阅读(164) 评论(0)

spaarkr 的使用

日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能: 实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端筛选并聚合Spark数据集,接着在R中实现分析与可视化利用Spark的MLlib机器学习库在R中实现分布式机器学习算法可以创建一个扩展,用于调用...
阅读(157) 评论(0)

用R Markdown 生成数据分析报告

为了创建 R Markdown报告,打开text文件,并将它保存为.Rmd 文件。File > New File > Text File 确保保存成 .Rmd文件, RStudio IDE能够很大程度上帮助你完成整个任务.,你可以保存通过File > Save。修改...
阅读(1497) 评论(0)

产品经理需要了解的算法——热度算法和个性化推荐

1. 算法的发展阶段 个性化推荐不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化推荐也无法开展。 所以在产品发展的初期,推荐内容一般采用更加聚合的“热度算法”,顾名思...
阅读(1200) 评论(0)

利用分类模型学习特征权重

在有的时候,我们需要学习出特征在分类器中所占的比重,例如判断某个人是否具有贷款资格,特征收入应该比年龄要更重要一些,那么具体重要多少,我们可以通过训练数据学习出来。 第一个办法可以借鉴决策树中特征选择的思想,以贷款为例,特征向量={年龄,收入,有房子,婚否}。通过计算每个特征Ai在训练数据集...
阅读(124) 评论(0)

python函数scatter使用

最近开始学习Python编程,遇到scatter函数,感觉里面的参数不知道什么意思于是查资料,最后总结如下: 1、scatter函数原型 2、其中散点的形状参数marker如下: 3、其中颜色参数c如下: 4、基本的使用方法如下: [python] view ...
阅读(277) 评论(0)

numpy方法总结

NumPy基本方法 一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等 读取数组元素:如a[0],a[0,0] 数组变形:如b=a.reshape(2,3,4)将得到原数组变为2*3*4的三维数组后的数组;或是a.sh...
阅读(172) 评论(0)

python匹配问题

print('%s' % 42) #输出字符串类型 print('%d' % 42) #十进制整数 print('%d%%' % 100) #文本值本身 actor = 'richard gere' cat = 'chester' weight = 28 print("my w...
阅读(123) 评论(0)

python第六章习题

#第六章习题 #练习1:创建一个名为Thing的空类并将它打印出来,接着,创建一个属于该类的对象example,同样将它打印出来 class Thing(): pass print(Thing()) class Thing(): example = Thing() ...
阅读(237) 评论(0)

python类和对象

#第六章对象和类 #使用class定义类 class person(): def __init__(self,name): self.name = name hunter = person('elmer fuud') print('the mighty hunter:',...
阅读(165) 评论(0)

同一台电脑安装python2和python3

Python 是一门很不错的语言,语言简单易学,又不失脚本语言的灵活性,还有海量的第三方库,覆盖的很全面。但也有不少“硬伤”,比如 Python 2.x 和 Python 3.x 版本之间的不兼容等等。 注:我的电脑是win10+64位 安装多版本python 1、安装pyt...
阅读(1390) 评论(0)

python盒子:模块,包和程序

# -*- coding: utf-8 -*- #使用Counter()计数 from collections import Counter breakfast = ['spam','spam','egg','spam'] breakfast_counter = Counter(breakfast...
阅读(335) 评论(0)

Python中的range()与array()函数

我们在Python中存在一个非常好用的range()与array()函数,下面作用法简要介绍。 一、range()函数   >>> range(1,10)   ——>不包括10     [1, 2, 3, 4, 5, 6, 7, 8, 9]   >&...
阅读(268) 评论(1)

python之setdefault()和defaultdict()处理缺失值的键

# -*- coding: utf-8 -*- #使用setdefault()和defaultdict()处理缺失的键 periodict_table = {'Hydrogen':1,'Helium':2} #创建一个字典 print(periodict_table) #如果键不在字典中,新...
阅读(1549) 评论(0)
    个人资料
    持之以恒
    等级:
    访问量: 3万+
    积分: 577
    排名: 9万+
    最新评论