世靖的码场

AC for AK

排序:
默认
按更新时间
按访问量

Ubuntu 虚拟机重新分配磁盘空间 爬坑指南

光在外面分配了硬盘空间给虚拟机是不行的,还要进去操作一下,这里下个图形界面的工具,方便操作。sudo apt-get install gparted启动的时候报错,说a start job is running for dev-disk。。。。然后要等一分半,在里面运行程序的时候,也一言不合就给我...

2018-04-04 10:19:41

阅读数:224

评论数:0

XGBoost 论文翻译+个人注释

最近研究机器学习理论,学习了一下陈天奇博士的论文,做了一点简单的翻译和批注,在这里记录一下。本文将按照论文的顺序来介绍xgb,其中穿插我自己的理解和我对于论文原文的中文翻译,以及一些公式的截图。原文翻译将使用红色来标注,其余的皆为我自己理解的内容,涉及参数调整的我会加粗。=============...

2018-03-20 00:49:23

阅读数:563

评论数:0

Hadoop MapReduce 学习笔记

本文的部分图片、文字来自于HKU COMP7305 Cluster and Cloud Computing,Professor: C.L.Wanghadoop官方文档:http://hadoop.apache.org/docs/r2.7.5/拓扑结构和硬件配置先讲一下Hadoop之前的底层的结构,...

2018-03-10 21:56:31

阅读数:133

评论数:0

西瓜书 习题11.1 编程实现Relief算法 特征选择、正则化总结

Relief算法的数据以及代码:https://github.com/qdbszsj/Relief 西瓜书第十一章,主要讲了一下特征选择的方法,通常来说,有很多冗余特征,如果能把这些特征从我们的数据集中筛选出去,那么可以极大地提高我们的程序运行效率,当然有的时候我们还需要人为保留或者创造一些冗余...

2018-01-25 14:34:57

阅读数:231

评论数:0

西瓜书 习题10.1 KNN

代码和数据:https://github.com/qdbszsj/KNN 这里编程实现了一下KNN,K-Nearest Neighbor。 KNN的好处是可以“懒惰学习”,只要存好数据,来一个测一个,调整一下K就好,或者是把每个维度的权值调整一下,意思就是在距离上做点文章。 然后这一章里的P...

2018-01-24 20:57:57

阅读数:173

评论数:0

西瓜书 习题9.4 K-means

第九章讲了很多聚类方法,以及聚类的好坏的度量方式,Kmeans比较容易实现,比较常用的一种方法。 通常来讲,我们希望聚类的结果,类内相似度高,类间差异度大。 数据以及代码: https://github.com/qdbszsj/Kmeans import numpy as np ...

2018-01-24 16:52:16

阅读数:165

评论数:0

西瓜书 第八章习题 集成学习总结(Adaboost、GradientBoost、Bagging、RandomForest)

数据及代码在git上:https://github.com/qdbszsj/Ensemble-learning 这里用sklearn实现的代码,4种常用的集成学习的方法,手写有点麻烦,这里重点不是代码,是学习总结。 集成学习(ensemble-learning)通过将多个学习器进行结合,常常可...

2018-01-23 15:02:02

阅读数:207

评论数:0

西瓜书 习题7.3 朴素贝叶斯分类器+拉普拉斯修正

Naive Bayes Classifier with Laplacian correction 数据和代码在我的git上,原创代码: https://github.com/qdbszsj/NBC 朴素贝叶斯分类器,用的贝叶斯定理(这不是废话),举个例子,说白了就是:绿瓜是好瓜的概率...

2018-01-22 16:44:05

阅读数:154

评论数:0

西瓜书 习题6.2 用线性核、高斯核训练SVM

SVM手动实现底层代码有些麻烦,这里借助sklearn实现了一下,数据以及代码地址: https://github.com/qdbszsj/SVM import pandas as pd import numpy as np dataset = pd.read_csv('/home/park...

2018-01-22 00:10:40

阅读数:149

评论数:0

西瓜书5.5 编程实现BP神经网络——标准BP算法、累积BP算法

这里照着书上的公式,实现了一下标准BP算法,和累积BP算法,BP是error Back Propagation的意思,误差逆传播。BP网络通常是指用BP算法训练的多层前馈神经网络。代码是照着书本公式自己写的,没有参考网上的其他版本。 数据和代码地址:https://github.com/qdbs...

2018-01-19 22:09:29

阅读数:526

评论数:0

西瓜书 习题4.4 编程实现基尼指数决策树

数据及代码地址:https://github.com/qdbszsj/decisionTreeGini这里的代码在信息熵决策树的基础上稍加修改就可以,之前是根据熵增的最大值来确定用哪个属性划分,现在是根据基尼指数(表现数据集D的纯度)的最小值来建树。这里网上的很多人说建出来的树长得和书上的不一样!...

2018-01-18 15:51:13

阅读数:284

评论数:2

西瓜书 习题4.3 编程实现信息熵决策树、绘制决策树、解决matplotlib中文乱码问题

就照着西瓜书P74的伪代码,把这段代码翻译成python就好了,这里决策树的实现没有参考其他人的代码,是我纯原创的。项目github地址:https://github.com/qdbszsj/Decision-Tree-based-on-information-entropy这里要先说一下我的数据...

2018-01-17 10:38:34

阅读数:355

评论数:0

西瓜书 习题3.5 编程实现LDA

参照西瓜书的课后习题3.5的要求,参考了一些资料,简单地实现了一下LDA。 数据还是西瓜数据3.0a 代码和数据,都挂在了我的git上:https://github.com/qdbszsj/LDA 首先第一部分还是画一个散点图,这个跟上一个习题是一样的,此处不详细表述了。 然后是先用skl...

2018-01-15 23:49:33

阅读数:289

评论数:0

西瓜书 习题3.3 编程实现对数几率回归,梯度下降法

最近入坑上道了,跟着周志华老师的《机器学习》,先搞个课后题练练手。 我电脑是Win10的,硬件配置不输Mac Pro,但是之前跑Kaggle上的泰坦尼克,装python的各种package装的我心累,于是这次我直接用VMware开了个Ubuntu在电脑里,给分配了4G的内存,平时就用Ubuntu...

2018-01-08 14:57:28

阅读数:307

评论数:0

hiho 1642 三角形面积和 [Offer收割]编程练习赛37 Problem B

题目2 : 三角形面积和 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 如下图所示,在X轴上方一共有N个等腰直角三角形。这些三角形的斜边与X轴重合,斜边的对顶点坐标是(Xi, Yi)。 (...

2017-11-26 14:47:25

阅读数:273

评论数:0

hiho 1641 热门号码 [Offer收割]编程练习赛37 Problem A

题目1 : 热门号码 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 1 2 3 ABC DEF 4 5 6 GHI JKL MNO 7 ...

2017-11-26 14:42:32

阅读数:168

评论数:0

hiho 1638 小Hi的天平 [Offer收割]编程练习赛36 Problem B 并查集+图dfs乱搞

题目2 : 小Hi的天平 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi给小Ho邮寄了一个天平。收到天平后,小Ho想知道天平在运输过程中是否损坏,为此它准备了A类物品和B类物品共n个(可能只有A类物品,也可能只有B类物品),但无法确定一个物品...

2017-11-19 15:17:47

阅读数:230

评论数:0

在安卓虚拟机上安装apk

1. Run the AVD 2. Install the apk file : Press Windows+R and type in cmd to open the terminal . Find your Android SDK platform-tools file place an...

2017-11-13 15:46:03

阅读数:306

评论数:0

hiho 1626 缩写命名 [Offer收割]编程练习赛35 Problem D 二分图匹配

#1626 : 缩写命名 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 很多计算机科学工作者都喜欢给自己发明的系统或者方法起个拉风的名字。他们一般会用若干个单词描述这个系统,并且从这些单词中各取出一个字母组合在一起作...

2017-11-12 16:53:44

阅读数:164

评论数:0

hiho 1625 重复字符串匹配 [Offer收割]编程练习赛35 Problem C KMP模板题

题目3 : 重复字符串匹配 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 给定两个字符串A和B,请你求出字符串A最少重复几次才能使得B是A的子串。   例如A="hiho",B="ho...

2017-11-12 14:58:46

阅读数:247

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭