深交所实习的日子

在深交所实习期间,参与了公告分类项目,使用SVM等分类器达到高准确率。学习了《机器学习》、《信息检索实战》、《统计自然语言处理基础》等书籍,对机器学习和NLP有了深入理解。打算通过金融知识图谱的智能问答系统作为毕业设计课题。
摘要由CSDN通过智能技术生成

说说最近的学习吧!
目前在深交所实习了3个多月了,感受到了一个金融公司的庞大,和宝哥(导师)也学习到了很多的东西,也临时去其他公司学习了一次,感受颇深。当然也体会到了金融公司的宽松的工作氛围和人性化的工作时间,这里相比软件IT公司的确不失为一个养生之地。
在这三个月里,我首先跟着一个哈工大深圳研究院的一个学长做了一个公告分类项目,具体说就是把拓尔思数据公司送来的公告数据进行分类,判断是股票相关还是不相关。我们先后将公告分句,人工标注为股票相关还是不相关,然后提取相关特征,再用SVM、决策树、逻辑回归、随机森林等分类器进行分类,最后效果能达到百分之九十几,还不错,除了一些的确很难判别的容易歧义的公告,例如三棵树、熊博士等等。这是我学习的东西比较多的一个项目,特别是特征提取,这里要感谢我的学长,听说他已经拿到深交所offer,真让人羡慕不已。
在这三个月里我先后学习了一下东西:
- 看完了周志华《机器学习》,对机器学习有一个初步的了解,不过我觉得部分地方数学太深,不易懂,缺少实践,但是作为打开我机器学习之路的启蒙书,真的非常推荐,周老师也是我很崇拜的一个人。
- 看完了《信息检索实战:搜索引擎》,对搜索引擎有了一个初步的了解,不过还需要在实践中加以理解运用,目前想学一个开源搜索引擎。
- 看完了《统计自然语言处理基础》,了解了自然语言处理领域的一些基本概念和问题,特别是经典的n-gram语言模型,也了解了前人怎么处理这些基本的自然语言处理任务的。这是我进入自然语言处理领域的启蒙书,强烈推荐,不过初读时,有些地方不太好理解比如马尔科夫

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值