自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

deta的专栏

开始记笔记

  • 博客(19)
  • 收藏
  • 关注

原创 cs224n 第二课:词向量表示 word2vec

1、计算机中怎样表达每个词的含义了?在英文中,一般用WordNet等分类资源来处理词义,啥意思了?就像我们查中华字典一样,查熊猫的解释是:有胎盘的、活的、哺乳类动物, 通过这样一种 is-a 的关系来处理词义,自己可以装上nltk包跑下课程上的代码: from nltk.corpus import wordnet as wn panda = wn.synset('panda.n.01')...

2018-07-26 20:30:28 491

原创 cs224n 第一课:自然语言处理与深度学习

作者:deta 时间:2018/07/23 以下是斯坦福公开课cs224n 自然语言处理与深度学习的第一节课的笔记。主要是用作个人备忘用,能力有限,其中存在的问题欢迎大家包容和指正。学习材料可以去课程主页下载,慕课网上也有免费的中英字幕视屏,感谢为我们这种英语渣渣们提供这么好的资源。好了,开始上车了! 1、什么是自然语言处理:自然语言处理是一门涉及到计算机科学、人工智...

2018-07-23 20:46:11 924

原创 算法问题整理

svm 问题参考:原理: svm是一种二分类模型,基本模型是在特征空间中寻找==间隔最大化==的分离超平面的线性分类器[x] 线性可分时[x] 近似线性可分时[x] 线性不可分时    利用间隔最大化求得最优分离超平面,解是唯一的,此时分隔超平面所产生的分类结果也是鲁棒性最好的,对未知实例的泛化能力也是最强的 为什么要将求解SVM 的原始问题转换为对偶问...

2018-07-14 14:38:49 161

原创 Hive问题总结

Hive表关联查询,如何解决数据倾斜的问题倾斜原因: map 输出数据按key Hash的分配到reduce中,由于key分布不均匀、业务数据本身的特性等原因造成reduce 上的数据量差异太大 - 1)key分布不均匀 - 2)业务数据本身的特性 - 3)建表时考虑不周 - 4)某些SQL语句本身就有数据倾斜解决方案: [x] 参数调节hive.map.a...

2018-07-14 14:34:57 912

原创 树模型总结

参考 https://blog.csdn.net/hit0803107/article/details/69260498简介  基于树的学习算法模型的精确率高,容易解释。与线性模型不同,基于树的模型能够很好的表达非线性关系什么是决策树?它是如何工作的?  决策树是一种监督学习算法,输入和输出变量可以是离散值或连续值。在决策树中,我...

2018-07-14 14:32:53 3612

原创 建模方法流程

确定建模的目标:是分类问题还是回归问题或是无监督学习问题对数据进行分析数据挖掘之特征工程特征:数据中抽取出来的对结果预测有用的信息 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法中发挥更好作用的过程特征工程的意义更好的特征意味着更好的结果 模型的特征决定模型效果的下限更好的特征意味着只需要更简单的模型 数据采集哪些数...

2018-07-14 14:29:36 377

原创 其他

专栏需要原创文章数量。。

2018-07-14 14:27:32 166

原创 上半年总结

     一转眼18年过去一半了,自己工作也已经两年了。回顾自己工作的两年时间,自己在很多方面发现都缺少总结,花了很多时间在一些无意义的事情上。下半年开始重新再出发,在工作技术方面多去总结和思考,下半年需要做的东西技能知识系统的学完cs224n课程搭建自己的一个聊天机器人 生活习惯学会时间管理多读其他方面的书籍 坚持锻炼身体&n...

2018-07-14 14:25:31 1619 1

原创 数据结构扩张

扩张红黑树构造出两种数据结构动态顺序统计:支持一般动态集合上顺序统计操作的数据结构,通过这种结构我们可以快速的找到一个集合中的第i小的数,或者一个指定元素在集合中的全序中的位置。 修改红黑树使得可以在O(lgn)时间内确定任何的顺序统计量,集合在集合线性序中的位置成为元素的**秩**。在红黑树的节点中添加了一个新的属性x.size,包含了以x为根的(包含x)的子树的内节点数,即这棵子树的大

2015-03-31 14:42:09 318

原创 红黑树

1. 满足下面红黑性质的二叉搜索树1、每个节点或是红的或是黑色2、根节点是黑色3、每个叶结点是黑色4、如果一个叶结点是红色,那么它的两个子节点都是黑色的5、对每个节点,从该节点到其后代叶结点的简单路径上,均包含相同数目的黑色节点。 2. 一棵有n个内部节点的红黑树的高度至多为2lg(n+1) 3. 在对红黑树进行update的时候,必须通过**旋转**改变某些节点的颜色以及指针结构以维持

2015-03-30 14:18:20 243

原创 二叉搜索树

查找关键字k: 输入一个指向树根的指针和关键字kTREE-SEARCH(x,k)if x==NIL or k==x.key return xif k<x.key return TREE-SEARCH(x.left,k)else return TREE-SEARCH(x.right,k)迭代版本ITERACTIVE-TREE-SEARCH(x,k)while x!=NIL

2015-03-27 11:26:48 230

原创 哈希表

1、直接寻址表全域U很大的时候,容易导致内存不足;实际存储的关键字集合K相对U来说可能很小使得分配给T的大部分空间都被浪费掉。2、哈希表两个关键字可能同时映射到一个槽中1)通过链接法解决冲突CHAINED-HASH-INSERT(T,x)insert x at the head of list T[h(x.key)]CHAINED-HASH-SEARCH(T,k)search for

2015-03-26 12:45:39 309

原创 顺序统计

查找最小值MINIMUM(A) 1. min=A(1) 2. for i=2 to A.length 3. if min>A[i] 4. min=A[i] 5. return min 选择排序代码 #include<iostream> using namespace std; void sort(int [],int); int main(){ int a[],i;

2015-03-22 11:28:58 275

原创 线性时间排序

在最坏情况下任何比较排序算法都需要做Ω(nlgn)次比较计数排序:假设输入的数据都属于一个小区间内的整数Counting-sort(A,B,k) 1. let c[0..k] be a new array 2. for i=0 to k 3. c[i]=0 4. for j=1 to A.length 5. c[A(j)]=c[A(j)]+1 //c[i]为数组A中等于i

2015-03-20 10:13:06 236

原创 快速排序

算法的关键部分是PARTITION过程,实现了对数组A[p..r]的原址排序PARTITION(A,p,r)x=A(r)i=p-1for j=p to r-1 if A[j]<x i=i+1 echange A[i] with A[j]echange A[i+1] with A[r]return i+1性能分析最坏情况是划分的两个子数组分别包括n

2015-03-16 10:59:07 245

原创 分治策略

最大子数组问题 FIND-MAX-CROSSING-SUBARRAY(A,low,mid,high) //查找跨越中点的最大子数组left-sum=-∞sum=0for i=mid downto low sum=sum+A[i] if sum>left-sum //依次向左求和,并与左边所求得最大值比较 left-sum=sum max

2015-03-14 11:28:21 238

原创 插入排序和归并排序

IINSERTION-SORT1 for j =2 to n2 A[j]=key //把键值插到已经排好的A[1.j-1] i=j-13 while i>0 and A[i] >key4 A[i+1]=A[i] // 把比键值大的元素向右边移动一格5 i=i-1 A[i+1]=

2015-03-10 16:36:59 281

原创 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-03-10 14:59:21 259

转载 alt_disk_copy 命令

使用 alt_disk_copy 克隆 rootvgalt_disk_copy 是一个内置的 AIX® 实用程序,可以用它克隆正在运行的 rootvg。alt_disk_copy 通常用于会影响正在运行的 AIX 的升级、为准备迁移克隆磁盘和在线备份 rootvg。

2014-11-17 15:09:23 1501

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除