- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 DP
(一)简介:动态规划与分治法的区别,分治法一般是可以将问题分为没有重叠的子问题,而动态规划则是一般是子问题是重叠的,大的问题可以分为小的子问题再求解,其与递归的区别是,这些子问题的求解只要求解一次就可以,我们会把它保存下来,下次用到直接取值即可,一般实现这样的做法就是把问题从小问题开始求解到大问题,从下往上求解,需要用到的子问题的解保存下来。 我们求解动态规划一般先找子结构,边界,跟状态转移方程。
2017-12-17 14:18:08 242
原创 模型评估和选择
评估方法。 1),留出法。 将数据集D划分为两个互斥的子集,一个作为测试集,一个作为验证集。为保证准确性,可以随机,可以分层采样。 一般是2/3-4/5用作训练,其余用作测试。 2), 交叉验证法。 平均划分为K个大小相似得互斥子集,尽量数据分布与原数据集保持一致(可以用分层),每次用一个作为验证集,其他作为训练集,训练K次。最后结果取均值。 留一法: 有m个样本点,m=k. 优点:
2017-12-12 21:27:27 532
原创 Divide and Conquer
(一)Kth Largest Element in an Array:当寻找第K大的数时,我们可以用quickselect 方法。 1)The basic idea is to use Quick Select algorithm to partition the array with pivot:Put numbers < pivot to pivot's leftPut numbers >
2017-12-11 00:05:00 415
原创 seaborn画饼图
(一)饼图:1)用到的方法:matplotlib.pyplot.pie() 2)参数解析:pie(x, explode=None, labels=None, colors=('b', 'g', 'r', 'c', 'm', 'y', 'k', 'w'), autopct=None, pctdistance=0.6, shadow=False, labeldist
2017-12-10 16:29:50 31113 1
原创 sorted
(一):sortedweiggle sort: 1)先把数组排序。 2)从中间分开;把小的那部分数组上的数放在偶数位数组上;把大那部分的数放在奇那部分的数组上;都是从后往前遍历。public void wiggleSort(int[] nums) { int l = nums.length; quicksort(nums, 0, nums.length - 1
2017-12-09 10:09:21 199
原创 数据处理笔记(一)
一 处理缺失值的几种方法:1. 提交的kaggle代码转换成所要求的形式。my_submission = pd.DataFrame({‘Id’:test.Id,’SalePrice’:predicted_prices}) my_submission.to_csv(‘submission.csv’,index = False)1. 缺失值处理的几种方法 1. 直接把有缺失值的那一列去掉
2017-12-05 10:29:53 344
原创 win64+python2.7(64位)+anaconda下安装xgboost
(一)背景:这两天刚好想装xgboost从昨天早上就开始弄,搞了一天多终于装上了,实在不容易,经历了很多的错误,查看了无数的博客,想写个博客记录下来。(二)实验环境:先说明版本一定要注意! (1)我的是在pycharm中用的anaconda,要把anaconda中python的编译器放在环境变量”Path”中。 (2)下载git,后面所有的命令行都在git下运行。 (3)下载Ming64(
2017-12-02 20:47:41 358
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人