自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 量化投资 - 指数基金投资

如何买指数基金?何时买?何时卖?这是个永恒的难题。  易方达最近推出了一个买指数基金的策略:定期买入一定数额的指数基金,然后收益率达到10%后就自动卖出。然后以此循环。貌似看着这个策略还可以。不用费尽心思研究什么时候该买入,用定投来分摊买入成本,然后一次性够10%收益就卖出。看起来该策略只要长期投资,就能保证不亏钱,有稳定的收益。  用此策略我买了一段时间上证50指数基金,结果发现买了几个

2018-01-06 17:05:12 1528

原创 PUNCH算法

第一步:找naturalcuts, 将图分成很多个cell,同一个cell里的点捏成一个点,仅保留naturalcuts作为边。把连接较为松散的区域切开。输入:无向图输出:cells目标:连接边数最少(权重最小)步骤:1)广度优先遍历定义参数U为理想的cell大小。随机选取一个点v,做广度优先遍历,遍历到U个点的时候停止。前十分之一的点位core,最外面一圈的点的邻接点

2015-09-17 23:39:29 2036 1

原创 全路径搜索策略

1 为了能重用已有DijkstraSearcher的一些函数,添加一个类DirectedGraph继承自IGraph,重写虚函数。DirectedGraph中有Node类和Edge类。Node类需要std::vectorunsigned>aedge_ids字段,Edge类需要unsigned   snode_id;       unsigned   enode_id;       unsi

2015-09-16 18:48:12 1043

原创 最短路径算法CH

CH的思路:Contraction hierarchies预处理生成一个多层的结构,每个点都处在单独的一层。事先对点进行优先级排序(怎么排都行,但是排序的好坏直接影响到预处理的效率以及搜索的效率。举个例子,邻接点个数)点的优先级(高低)是人为指定的,根据优先级从低到高依次选点进行contraction.什么是contraction呢,假设拿掉这个点,看看会不会影响图中点对之间的shor

2015-09-16 15:58:31 7123

原创 standford NLP课程笔记无 语言模型

语言模型的目的是给句子计算概率。 为什么要计算句子的概率呢?这在多个领域都有作用。比如在机器翻译领域(machine translation),可以用来区分哪个翻译好,哪个翻译不好,如P(high winds tonite) > P(large winds tonite)在拼写矫正领域(spell correction),可以用来矫正错误的拼写,如 the office is about

2015-06-12 15:20:58 2109

原创 standford NLP课程笔记四 编辑距离

编辑距离用来衡量两个串的相似度编辑距离就是用最少的编辑操作将一个词变为另一个词,操作有三种插入删除替换如何计算最短编辑距离? 动态规划字符串X长度为n字符串Y长度为m定义D(i,j)表示X[0,i]和Y[0,j]的最短编辑距离,则D(n,m)表示X和Y的最短编辑距离先计算i,j较小的情况下的D(i,j),然后再 利用已经计算出来的结果来计算i,j较大的情况下的D

2015-06-10 15:33:12 814

原创 standford NLP课程笔记三 句子切分

! , ? 毫无疑问是一个句子的结尾而. 则不一定是句子的结尾,.可以用于句子结尾缩写 如Inc.数字 如0.4,  .02%因此需要一个分类器来确定.是哪种。 二元分类器(是句子结尾,不是句子结尾)更复杂一点的决策树特征带.的单词形态:首字母大写,小写,全是大写,数字.后面的单词形态:首字母大写,小写,全是大写,数字数字特征:带.的单词长度带.

2015-06-10 15:25:52 2551

原创 standford NLP课程笔记二 分词

这一节概略的介绍了一下分词的内容。分词是NLP里面很重要的方面。每个NLP任务都需要做文本的规范化,包括切分单词单词格式规范化切分句子用N表示单词总数,V表示不同的单词数(size of vocabulary),用shake.txt做了实验,将非字母的字符作为分隔符,统计每个单词的出现次数。遇到的问题: d和s 的个数非常多,因为文章中经常会出现‘s类似这样的词

2015-06-10 14:13:50 897

原创 standford NLP课程笔记一 正则表达式

课程地址https://www.coursera.org/course/nlp​记得以前在网页上查正则表达式时,总是被那些归纳总结的表看到头昏压花,今天学了视频课程,感觉学到好多,至少很基本的东西是知道了一些,自己能读写简单的正则表达式了。[] 里面的字符表示每个都可以,比如[wW]oodchuck 可以表示woodchuck和Woodchuck​[12

2015-06-09 17:46:31 809

简单的用java实现读写文本文件的示例.doc

这里包含了三个例子,即 1. 将文件读入到内存(这里是StringBuffer)的例子 2. 将内容中的文本写到文件 3. 将一个文件的内容读出来写入另一个文件中 同时也展示了如果从输入流中读出来内容写入输出流中(仅限文本流) 三个例子可以独立存在,所以根据需要只看其中一个就行了

2011-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除