关闭

[置顶] 向量误差修正(VECM)模型案例分析

> #向量误差修正模型案例分析 > ############################ > #1.生成数据 > set.seed(12345) > u1 u2 u3 y1<-cumsum(u1) #生成随机游...
阅读(2286) 评论(0)

[置顶] GARCH模型案例分析

# (1) read data library(quantmod)                                           # 加载包 getSymbols('^HSI', from='1989-12-01', to='2013-11-30')      # 从Yahoo网站下载恒生指数日价格数据 dim(HSI)...
阅读(1964) 评论(0)

[置顶] 网络数据抓取及其R实现(以链家楼盘为例)

\quad本次数据抓取的链家新房楼盘,由于对网络抓取数据还不熟悉,所以现在只抓取了北京地区的楼盘。我在学习过程中主要参考资料为《基于R语言的自动数据收集》,这本书确实不错,在前八章讲解的基础知识,以本书的配套网站资源为讲解基础,但是在按照书中抓取数据时有些地方和书本讲的不太一样,我认为主要是网络结构的变化引起的,大部分还是可行的。现在我看到了第九章,再往后都是一些网络数据抓取项目实例,所以后面的东西...
阅读(1041) 评论(1)

pyspark.linalg模块学习

class pyspark.ml.linalg.Vector方法toArray(): 把vector转换为numpy.ndarrayclass pyspark.ml.linalg.DenseVector(ar)v = Vectors.dense([1.0, 2.0]) u = Vectors.dense([3.0, 4.0]) #可以进行加减乘除 v + u #DenseVector([4.0,...
阅读(90) 评论(0)

使用pyspark进行机器学习(回归问题)

DecisionTreeRegressorclass pyspark.ml.regression.DecisionTreeRegressor(self, featuresCol="features", labelCol="label", predictionCol="prediction", maxDepth=5, maxBins=32, minInstancesPerNode=1, minInfo...
阅读(139) 评论(0)

使用pyspark进行机器学习(聚类问题)

BisectingKMeansclass pyspark.ml.clustering.BisectingKMeans(self, featuresCol="features", predictionCol="prediction", maxIter=20, seed=None, k=4, minDivisibleClusterSize=1.0)参数解释maxIter: 最大迭代次数 K:聚类簇数 m...
阅读(142) 评论(0)

使用pyspark进行机器学习(分类问题)

LogisticRegressionclass pyspark.ml.classification.LogisticRegression(self, featuresCol="features", labelCol="label", predictionCol="prediction", maxIter=100, regParam=0.0, elasticNetParam=0.0, tol=1e-6...
阅读(344) 评论(0)

python实现各种排序算法

python排序算法 # -*-encoding: utf-8 -*- # param: a a list which to be sort class MultiSort(object): # 交换函数 def exch(self, a, i, j): temp = a[i] a[i] = a[j] a[j] = temp...
阅读(90) 评论(0)

SVM与Logistic回归的关系

合页损失函数[z]+={z,z>00,z≤0[z]_{+} = \{^{z, z >0}_{0, z\le 0}SVM的目标函数对于线性SVM,我们知道它的原始最优化问题为: minw,b,ξ1/2||w||2+CΣNi=1ξis.t.yi(w⋅xi+b)≥1−ξi,i=1,2,...,Nξi≥0,i=1,2,...,Nmin_{w,b,\xi} 1/2||w||^2 +C \Sigma_{i=1...
阅读(71) 评论(0)

Spark Streaming总结

初始化StreamingContext创建SparkContext后要做的事情: 1. 通过创建DStreams定义输出源 2. 通过应用transform算子定义流计算,输出操作到Dstream 3. 用streamingContext.start()开始接受数据并进行处理 4. 用streamingContext.awaitTermination()等待处...
阅读(84) 评论(0)

Java异常的限制

class BaseballException extends Exception{} class Foul extends BaseballException{} class Strike extends BaseballException{} abstract class Inning{ public Inning() throws BaseballException{} public ...
阅读(80) 评论(0)

java的内部类

在使用内部类时,如果想从外部类除了静态方法之外的任意位置创建内部类对象,那么必须具体指明这个对象的类型:OuterClassName.InnerClassName。 内部类可以访问外部类的方法和字段。 要想直接创建内部类对象,必须使用外部类的对象来创建内部类对象。interface Dest{ String readLine();//自动转换为public } interface Cont{...
阅读(92) 评论(0)

对象浅复制和深复制的几个问题

一、“==”与“is”==运算符是比较的两个对象的值,而is比较的是对象的标识。例如:a = [1,2,3] b = a c=list(a) a == b == c ##返回True id(a) == id(b) ##返回True id(a) == id(c) ##返回False这里a指向对象[1,2,3],而b是对象[1,2,3]的别名,也就是说,a和b都指向[1,2,3]这个对象,所以他们的值...
阅读(79) 评论(0)

matplotlib作图添加表格

import matplotlib.pyplot as plt import numpy as npplt.figure() ax = plt.gca() y = np.random.randn(9)col_labels = ['col1','col2','col3'] row_labels = ['row1','row2','row3'] table_vals = [[11,12,13],[21,...
阅读(762) 评论(0)

matplotlib作图布局

plt.figure(0) axes1 = plt.subplot2grid((3,3), (0,0), colspan=3)#(0,0)开始,占3列 axes2 = plt.subplot2grid((3,3), (1,0), colspan=2)#(1,0)开始,占2列 axes3 = plt.subplot2grid((3,3), (1,2)) axes4 = plt.subplot2grid...
阅读(151) 评论(0)

matplotlib时间坐标设置

import matplotlib.pyplot as plt import numpy as np import matplotlib as mpl import datetime as dtfig = plt.figure() ax2 = fig.add_subplot(212) date2_1 = dt.datetime(2008,9,23) date2_2 = dt.datetime(200...
阅读(266) 评论(0)

centos6.5安装hadoop2

准备Linux环境点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.1.90 (这儿需要对应自己的地址)子网掩码:255.255.255.0 -> apply -> ok 回到windows –> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMn...
阅读(190) 评论(0)

centos6.5安装spark2

centos安装好JAVA JDK,hadoop2.7,scala后,可以直接安装spark2了。安装spark还是比较简单的。首先是下载好spark(需要和Scala版本对应),解压到一个目录中,然后在环境变量中添加spark的路径。另外,在spark路径下的conf文件下的spark-env.sh.template修改为spark-env.sh,并对其内容增加环境变量:export JRE_HO...
阅读(219) 评论(0)
92条 共7页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:58771次
    • 积分:1174
    • 等级:
    • 排名:千里之外
    • 原创:77篇
    • 转载:2篇
    • 译文:9篇
    • 评论:15条
    博客专栏
    最新评论