- 博客(133)
- 收藏
- 关注
原创 excel 常用操作
字符串处理函数(left, right, mid, find)leftrightmidfind条件函数(sumifs, countifs)字符串处理函数(left, right, mid, find)leftrig...
2018-06-29 11:05:05 322
原创 使用R语言中的tidyverse进行分组处理
使用tidyverse包可以方便地进行分组处理。> data name id grade1 a 1 602 a 2 NA3 b 3 604 c 4 805 c 5 606 c 6 60** 可以对不同class进行分组,并作相应地统计。**library(tidyverse)...
2018-11-06 23:53:03 5668
原创 R 语言中的地图包
R语言 baidumap和REmap包使用学习(一)——baidumap包: https://blog.csdn.net/lotterychampion/article/details/51404364Leaflet 主要是用R语言的语法封装了JS版的Leaflet,可以在R语言的plot窗口,利用html5技术显示各种地图,还可以绘制自己的要素图形。https://blog.csdn.net/...
2018-10-17 23:56:47 4290
原创 在ubuntu上部署R以及shiny server
Ubuntu16.04 安装R与RStudioinstall ubuntu安装Rstudio server
2018-10-16 23:42:40 3373
原创 python交互式web应用dash/plotly
dash入门笔记官方文档安装dash layout主要由dash_html_components和 dash_core_components组成。前者是纯html组件,如div; 后者是高级的组件,如 graph。一个div中包含子元素,这些子元素放在一个列表中。children参数放在第一位,可以省略。样式:和css中样式有些区别:这里的style是以字典形式出现的html中的...
2018-09-20 23:51:18 6007 1
原创 git 命令
git 命令git add将本地工作区的修改提交到缓存区。git commit将缓存区的内容提交到head。(远程仓库不变)git push将修改同步到远程仓库。git checkout – filename如果在工作区中修改了文件,但还没有add到缓存区,可以使用这个命令来撤销在本地工作区的修改。但是如果执行了add,就无法撤销了。而且,“–”符号......
2018-09-16 16:03:57 204
原创 R语言字符串处理函数
R笔记——基础主要把学习工作中遇到的一些基础知识记下来,方便查看。tryCatch()result <- tryCatch({}, warning = function(w){}, error = function(e){ paste0('错误: ', e) #这里的e就是字符串}, finnally = {})tryCatch()本身是一个函数,...
2018-09-16 16:03:00 3566
原创 R和sql实现传播(spread)
如果要观察的?![这里写图片描述](http://r4ds.had.co.nz/images/tidy-8.png)) 数据 名称科目等级 1爱丽丝数学78 2爱丽丝语文88 3伯特数学79 4伯特语文80...
2018-09-07 10:37:39 650
原创 pandas问题
好久没用pandas,下面这个语句怎么是这样的结果,难道是我记错了? 定义一个data,再对data进行筛选。data = pd.DataFrame({"a":[4,5,6],"b":[2,8,10]})下面语句为什么是这个结果?data[data["a"]>4 & (data['b']<10)]a b 0 4 2 1 5 8 2 6 ...
2018-07-14 17:22:14 257
原创 ubuntu的配置pip/python
修改pip镜像ubuntu中将python3设置为默认环境修改pip镜像由于默认的镜像网站下载太慢,可以换成国内的。 方案一:修改配置文件 1)检查pip.conf文件是否存在 cd ~ mkdir .pip ls ~/.pip 2)直接编辑pip.conf sudo vi ~/.pip/pip.co...
2018-07-14 00:44:22 488
原创 R中的三个点...
ff <- function(a, b, c, d){a+b+c+d}fff<- function(a, ...){result<-ff(a, ...); print(result)}fff(1,2,3,4)#10这里,函数fff()中的参数…和函数ff()中的…表示相同的参数,这里是指b,c,d三个参数,要注意参数的数量和位置需要相对应。当参数较多时,可以这样使用。...
2018-06-25 14:27:30 3194
原创 R语言中的异常处理和eval函数
异常处理tryCatch()eval()可以把字符串转化成表达式来执行。 eval和parse结合使用,参数 text 等于要转化的字符串。s&amp;amp;amp;amp;amp;lt;- &amp;amp;amp;amp;quot;print('hello world')&amp;amp;amp;amp;quot;eval(parse(text = s))...
2018-06-06 18:46:13 11937
原创 R语言基础
apply : 用于遍历数组中的行或列,并且使用指定函数来对其元素进行处理。 lapply : 遍历列表向量内的每个元素,并且使用指定函数来对其元素进行处理。返回列表向量。 sapply : 与lapply基本相同,只是对返回结果进行了简化,返回的是普通的向量。 mapply: 支持传入两个以上的列表。 tapply: 接入参数INDEX,对数据分组进行运算,就...
2018-05-30 14:35:47 1516
原创 数据透视表pivot_table,和crosstab()
很少使用数据透视表,在pandas中一般用groupby来处理问题,其实有些情况下使用pivot_table()来处理问题会更加方便。 先看看pandas的官方的文档:pandas.pivot_table 另外,这篇文章讲得更详细。...
2018-05-21 16:42:37 1477
原创 sql中的窗口函数、用户变量和存储过程
窗口函数,也可以被称为OLAP函数或分析函数。mysql之前并不支持窗口函数,但也可以用其他方法实现,但mysql8.0是有窗口函数的,可以看看这篇文档。
2018-05-20 23:35:51 1404
原创 如何使用sklearn对决策树进行可视化
在sklearn的官网上已经对决策树的实现进行了详细介绍,这里主要讲一下可视化的过程。安装和配置GraphViz首先去下载软件,我的版本是graphviz-2.38.msi。然后就是配置环境变量,把\bin文件夹放到path中就行了。最后在终端命令行中输入:dot -version,检测一下有没有设置成功。决策树可视化需要安装一些python库,如graphviz等。 ...
2018-05-18 13:14:17 5441
原创 mysql的full join的实现以及join中的on条件的使用
在mysql里是不支持full join的。但是可以通过以下方式来实现: 左连接+ union+右连接 另外: union 操作符选取不同的值,会自动去重。如果允许重复的值,请使用 union all。...
2018-05-11 16:11:04 5151
原创 awk,了解一下!
虽然工作中用不上linux,但自己也学过一段时间的linux,竟然没听说过awk。这里放一些教程。 awk,了解一下! 这个教程写得挺好,可以点一下: 参考文章...
2018-05-08 18:09:06 180
转载 mysql的优化
一、前提 这里的原则只是针对MySQL数据库,其他的数据库某些是殊途同归,某些还是存在差异。我总结的也是MySQL普遍的规则,对于某些特殊情况得特殊对待。在构造SQL语句的时候要养成良好的习惯。二、原则总结 原则1、仅列出需要查询的字段,这对速度不会明显的影响,主要是考虑节省应用程序服务器的内存。原来语句:select * from admin优化为: select admin_i...
2018-05-08 10:15:18 164
原创 sorted的巧妙用法
如果要对一个整数序列中奇数和偶数单独排序,如下所示:a = [2, 3, 5, 4, 22, 45, 99, 16]#结果:[3, 5, 45, 99, 2, 4, 16, 22]b = sorted(a, key=lambda x: (x+100000) if x%2==0 else x)print(b)这里的key就是排序条件, 我们可以给lambda函数赋予不同的映射,如当元素...
2018-05-07 23:31:50 1600
原创 Hbase入门
大数据框架比较多,之前学了一些hive,由于它存在响应慢,不支持事务等缺点,所以我还得了解一下hbase。先看看别人总结的东西HBase详细概述 HBase 深入浅出...
2018-05-03 14:57:40 187
原创 hive基础
(使用hive 2.3版本)hive的资料Hive 教程(官方Tutorial) Hive HiveQL基础知识及常用语句总结 Hive2.0函数大全(中文版) 过往记忆的博客表格的操作创建表格创建“课程”表格,用逗号分隔。create table course(Cno int,Cname string) row format delimited fie...
2018-04-28 18:20:56 246
原创 在hdfs中安装hive2.3时遇到的问题
hive2版本需要初始化hadoop@master:/etc/mysql$ schematool -dbType mysql -initSchema会提示以下结果:SLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/home/hadoop/apache-hi...
2018-04-27 18:13:42 850
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人