非技术贴
Richard_More
学习笔记(金融+计算机)
展开
-
用 Python 做文本挖掘的流程
用 Python 做文本挖掘的流程肖智博 · 2 年前收集数据数据集。如果是已经被人做成数据集了,这就省去了很多麻烦事抓取。这个是 Python 做得最好的事情,优秀的包有很多,比如 scrapy,beautifulsoup 等等。预处理(对这里的高质量讨论结果的修改,下面的顺序仅限英文)去掉抓来的数据中不需要的部分,比如 HTML TAG,只保留文本。结合转载 2016-01-16 22:00:33 · 1965 阅读 · 0 评论 -
学习NLP,AI,Deep Learning 的优秀博客链接
下面是国外的优秀的关于NLP,NN的优秀blog,do a mark.1. http://www.wildml.com/ 已读的优秀blog http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/. 文中详细了解释了CNN的框架结构,比如为什么要做pooling,convol原创 2016-01-17 14:35:40 · 798 阅读 · 0 评论 -
学习NLP,AI,Deep Learning 的牛逼的教程
1.Andrew Moore。卡内基梅隆计算机学院的院长大大。这些基本上涵盖了很多的数据挖掘topic。Decision TreesInformation GainProbability for Data MinersProbability Density FunctionsGaussiansMaximum Likelihood EstimationGaussian Bayes Cla原创 2016-01-18 14:16:29 · 9952 阅读 · 0 评论 -
mac使用git管理Github
工欲善其事,必先利其器。在OS X Yosemite 10.10.3安装最新版本Xcode,在terminal下可以发现git已经被安装。 ?12~ mesut$ git --versiongit version 2.3.2(Apple Git-55)之前转载 2016-03-06 14:12:39 · 1165 阅读 · 0 评论 -
mac与windows系统的互相访问
现在假设 我们有一台mac系统计算机和windows7系统计算机,都处于联网状态,如何实现两者之间的文件共享。(1)第一种情况:windows系统远程连接mac系统 (1)mac系统必须允许其他系统远程访问,通过在“系统偏好设置”中的远程登录,设置为打开,并可以 看到 ssh username@ip. 访问mac 的文字。 (原创 2016-03-18 21:56:56 · 6756 阅读 · 1 评论 -
P2P舆情产品-基于大数据透视行业
一. 动机与问题背景 P2P网贷平台在2007年乘着互联网浪潮引入国内,2013年开始蓬勃发展,平台数量和交易金额纷纷大幅增长,与此同时出现了越来越多的问题平台、跑路平台。面对变幻莫测、层出不穷的P2P平台和产品,用户们都在困惑:到底哪些P2P平台比较靠谱?各个平台差别在哪里?哪个平台的资金安全最有保障?如何快速选择适合自己的P2P产品? 设计一款数据舆情产品,对P2P原创 2016-05-22 13:06:49 · 1886 阅读 · 0 评论