自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 leetcode--Best Time to Buy and Sell Stock

题目大概意思是说,给一个整形数组,每个数表示股票的成交价,然后由你决定哪一天买进,哪一天卖出使得利益最大。注意一下,要先买进,同一天是可以买进卖出的,只是利益为零。 动态规划基本题,将大问题转换为一个个阶段的小问题。用buy指示在哪一天买,sell指示哪一天卖,每完成一次买卖,用profit存下获益值,每个阶段都会产生一个profit,并比较阶段内最适合的买进值,存为下一阶段的buy值。 逻辑比

2016-03-23 14:33:40 473 1

原创 ubuntu下pip安装xgboost

系统:ubuntu 1404pip install xgboost报错Downloading/unpacking xgboost Could not find a version that satisfies the requirement xgboost (from versions: 0.4a12, 0.4a13, 0.4a14, 0.4a15, 0.4a18, 0.4a19, 0.4a2

2016-03-15 15:41:47 6310

原创 leetcode--Multiply Strings

做这题的时候脑子有点迷糊,代码写的有点拖沓。题目不复杂,反正就是将string转成数组之后利用大数相乘的思想吧,注意一下最后返回的string里面字符的顺序问题就行了。public class Solution { public String multiply(String num1, String num2) { int len_1 = num1.length();

2016-01-25 20:45:23 403

原创 Kaggle Titanic Competition-第四部分

接下来继续第四部分,即特征工程中的派生变量。派生变量,顾名思义,指的就是通过一个或多个已存在的变量而产生出的新的变量。前面,我们已经探讨过如何通过最简单的数据转换来产生有价值的派生变量,现在我们来看看通过更复杂的数据变换得到的一些有意思的派生变量。特征工程里一项重要的内容就是充分运用观察力和创造力来发现新的特征以适应训练模型。这个过程可以说是数据科学里最应该花时间和精力的一部分了,而最基本的数据变换

2016-01-12 13:23:32 827

原创 Kaggle Titanic Competition-第三部分

接着看第三部分–数据转换。文章翻自http://www.ultravioletanalytics.com/2014/10/30/kaggle-titanic-competition-part-i-intro/。由于本人能力有限,编写有不当之处,还请大家多多指正,大家共同学习!!在前面两部分,我们已经知道如何读入数据以及处理缺失值,接下来就要将变量数值转换成能适应所选取的模型的格式化特征。Random

2016-01-05 22:14:57 854

原创 Kaggle Titanic Competition-第二部分

好的,接着上一部分,继续第二部分–缺失值处理。几乎对每一个复杂数据集,都存在缺失或是错误的数据,这就像人类的死亡,还有上税。一些预测模型本身就能够处理缺失的数据(如神经网络),然而其他模型则需要单独处理缺失值。scikit-learn库中的 RandomForestClassifier模型内部并不能处理缺失值,所以在训练模型之前我们需要一些不同的方法来为缺失值分配具体数据。以下是几种处理缺失值的方法

2015-12-29 20:04:21 731

原创 Kaggle Titanic Competition-第一部分

作为一个kaggle的入门级玩家,首要的事情当然是读代码,熟悉库,模仿老玩家了。 首先要做的事情就是熟练掌握完成一项竞赛是怎样一个流程,以kaggle-titanic为例,进行初步学习。 文章翻自http://www.ultravioletanalytics.com/2014/10/30/kaggle-titanic-competition-part-i-intro/。由于本人能力有限,编写有不

2015-12-28 22:01:52 1177

原创 讨论组12.20讲述内容笔记

介绍java.util.BitSet BitSet 类创建一个特殊类型的数组保存位值。该BitSet中数组的大小可以根据需要增加。1.构造函数private long[] words;private final static int ADDRESS_BITS_PER_WORD = 6;public BitSet(int nbits) { // nbits can't be ne

2015-12-21 09:45:44 582

原创 《乌合之众--大众心理研究》

刚开始看这本书,感觉有不少妙语,摘抄几段吧,接下来如果还有类似的或者更好的段落我会继续更新:在群体心理中,原本是突出的才智被削弱了,导致了群体中的每一个人的个性也被削弱了。表现出差别的异质化被同质化吞没了,最终是无意识品质决定了群体的智慧。群体只有很普通的品质。群体只有很普通的智慧。群体也只有最基本的智能。群体同时也只具有最低甚至更低层次的智力。群体只能从事最低级的劳动,而涉及到普遍利益的

2015-12-08 14:49:47 1272

原创 小试MapReduce

这几天拿到了某城市的交通数据,开始着手处理,目的是从路口监测点的数据记录中挖掘出每辆车的行车轨迹,数据经过处理之后,每条记录的格式大概是这样的:车牌,监测时间,速度,路口ID。 最先直接写的java程序主体代码如下:public class traceOV { public static void main(String[] args) throws FileNotFoundExcepti

2015-12-02 09:35:20 476

原创 leetcode--merge two sorted lists(java)

/** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */public class Solution { public ListNode merge

2015-11-27 16:46:14 357

原创 遗传算法染色体变长编码的实现

在基于遗传算法的路径规划问题中,先尝试了定长染色体编码,即用0/1来表示路口是否被选中,但是这样就忽视了顺序问题,假如有1->4->5->9->12以及1->5->4->7->9->12这样两条路径那么程序就很难区分染色体了,于是我决定使用变长染色体编码,直接用路口编号来表示染色体基因,以下程序为遗传个体结构以及其初始化。#define Cmax 300#define Cmin 0#d

2015-11-26 16:36:41 7051 1

原创 leetcode--two sum

public class Solution { public int[] twoSum(int[] nums, int target) { HashMap<Integer, Integer> hm = new HashMap<Integer, Integer>(); for(int i = 0; i < nums.length; i++){

2015-11-26 15:53:20 342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除