《beginning with Python》 ‘’’ …. ‘’’ 多行字符串外套,也可以用双引号Print(‘’’This is a very long string. It continues here.And it’s not over yet. “Hello,world!”Still here.’’’)运算时候换行用 \1+2+\4+5Print \(‘Hello,world’)转义字符...
r 语言里拟合函数的参数估计 # 自定义函数f = function(x,a,b,c,d){ (a*x^2+b*x+c)*sinpi(x-1.5)+d}# dt是实现导入的数据,有2列,x和ym.2 <- nls(y ~ f(x,a,b,c,d), data = dt, start = list(a = 0, b = 0,c=0,d=0), trace = T)# 展示abcd的参数拟合结果summ...
使用oracle与python进行中文分词 把看病时的主诉文本进行分割,获得词性。从oracle读入文本,在python中分割后完成再写会oracle。最开始使用自带的开源包,比较了3种中文分词包,thulac,snowlp,jieba,根据目测,发现还是jieba好一些。将全量的数据分词完毕后,发现依然存在分割错误的问题。采纳了建议尝试使用百度、腾讯、阿里巴巴开放的接口。调通了一个百度的,代码如下。发现使用百度的包,会...
函数聚类分享讲座记录 FDA的历史(FDA 函数数据分析? Deville(1974) 在经济学应用中从因素分析中衍生出FDA方法 Besse(1979) 从PCA和CA中衍生出FDA方法 Saporta(1981)在做MCA多重相应分析和LR线性回归时做了FDA 20年无文章发表 Bosq(2000):linear process in function spaces Ramsay and Silverm...
转:想要入坑机器学习?这是MIT在读博士的AI心得 从科研社区中汲取营养找论文AI 领域的论文可以在 arXiv 上找到和发布。现在的论文数量非常令人振奋。社区中的许多人降低了从噪声中分辨出信号的难度。Andrej Karpathy 开发了 arXiv sanity preserver,帮助分类、搜索和过滤特征。Miles Brundage 每晚都在推特上发布自己整理的 arXiv 论文列表。很多推特用户常常分享有趣的参考文章,我推荐大家在推特上关...
将社团发现运用在术式组合分类上,失败了 library(igraph)g1<-read.csv("i50.csv",header = TRUE,sep="\t")g2 = graph.data.frame(d = g1,directed = F)# g1<-data.frame(g1$ssbm,g1$uid)# x<-par(bg="white") V(g2) #查看顶点E(g2) #查看边plot(g...
转:R igraph社团发现算法测试(全) 存下来,实践下。R相关的介绍:http://igraph.wikidot.com/community-detection-in-r原文地址:http://blog.sina.com.cn/s/blog_153999aac0102vzk5.htmligraph是复杂网络分析的一个强有力的工具,纯C语言写的开源工具库,也提供了关于R和python的一些接口。里面也包含了许多模块,其中社团发现的算法就包...
格式化盘并挂载 购买服务器后,需要先格式化盘,再mount,方可使用全部的盘。mkfs.ext4 /dev/sdbmount /dev/sdb /home---------上传和下载文件可以用 sudo apt-get install lrsz然后输入命令 lr ,sz 上传下载文件,有弹出框可选。...
第一个d3.js的应用 太开心了,我居然调通了一个d3.js的demo,简直是打开了html的大门!就是按照 http://bl.ocks.org/robschmuecker/7880033 模仿的,替换里面的json数据确实只需要3个文件,index. .... 待续...
由slidify引发的关于内部交流的方式 突然需要做一个内部的交流报告,不知怎么的突然想到了slidify,然后又把之前第一次做的记录翻开来重新弄了一遍,废了好大的劲,效果也平平。再次回顾记录如下:环境准备如下:1.下载R,Rstudio,miktex,Rtools 双击安装2.打开Rstudio,开始安装devtools可以使用install.packages("devtools")如果速度很慢,那么就去Rstudio的Tools-&g...
数据分析知识网梳理 很久之前在微信上看到的对人工智能不同层次的数理,收获是这份知识单考虑了数据分析的哲学========================================人工智能的深渊来自:微信号“全球人工智能”不同层对人工智能的理解水平第一层:小白水平 奇点、机器人、机器人三定律、图灵测试、消灭工作、毁灭人类、西部世界、意识、阿尔法狗 第二层:看懂正经科技媒体水平 机器学习、神经网络、深度学习、数据挖...
读取dbf文件 用R读取library(foreign)dt<-read.dbf("201601XXB.dbf")重新写出来的时候,发现有些行错列,此时用write.xlsx会更加准确,比write.table,wirte.csv用Python读取from dbfread import DBFtable = DBF('people.dbf')读取dbf目前用R报错率更低--- 导数据中遇到的问题:1)在c...
Python的Django真滴烦,占个坑先 照着书上的代码,抄了几段。最后有个bug怎么都改不好,暂时先写到这……# 安装 Djangowget https://www.djangoproject.com/m/releases/2.0/Django-2.0.1.tar.gztar zxvf Django-2.0.1.tar.gzcd Django-2.0.1/python -m pip insta
三种DRGs的实现 被领导要求着看了些drgs的东西,找了2个分组方法和单位自己的进行比较。第一个是最早的drgs分组方法,来自yale大学的,流程如下用R实现:library(rpart)library(rpart.plot)library(rattle)library(RColorBrewer)setwd("D://test//data//")filename<-c('a'
用sqlplus导出oracle数据 当初装oracle数据库的时候比较混乱,账号密码没记清,最后导致odbc建不起来,没法让oracle直接和R连接起来。所以只能先导出oracle里的数据到本地,再读进R.导出时候用了sqlplus sql plus 登陆 sys as sysdba -- 一定要加上 as sysdba 不然总是报错spool d:\a.csvselect ksmc || ',' ||
【学习笔记】特征工程(1) 构建特征(转换) 原始数据的变量本身就是一个特征,有时会对其中部分变量进行一些转换,这样做可能会提高模型的稳定性和准确率。常见的特征构建(转换)方式有:标准化x'=(x-μ)/σ,即原始数值减去均值除以标差,对原始变量进行了对中和归一,去掉幅度的影响归一化x'=(x-MinValue)/(MaxValue-MinValue),实现将原始变
md5`加密2:udf简单实现 首先编写udf的java文件除了导入hadoop里面的jar包之外(hadoop/share/hadoop/ : common 以及common里的lib ,mapreduce 以及mapredure 里面的lib; yarn 以及yarn里面的lib)还需要导入hive里面的lib所有jar包接下来是java主体部分,是把之前java上实现的拿来改一些地方:packa
我装hive的记录 需要事先安装好hadoop,mysql进入mysql以后设置一下:createdatabase hive;createuser 'hive'@'%' identified by '密码';grantall on *.* to hive@'%' identified by '密码';flushprivileges;接下来只剩下修改hive的配置,主要修改h