开源软件/代码链接合集

定向抓取/抽取:[url]http://www.scrapy.org[/url]
流式处理工具:
收集计算[url]https://github.com/nathanmarz/storm[/url]
流数据统计[url]https://sites.google.com/site/countminsketch/[/url]

中文处理:
简繁转换cconv: [url]http://code.google.com/p/cconv/[/url]
汉字转拼音pinyin4j:[url]http://pinyin4j.sourceforge.net/[/url]

字符串匹配:
ahocorasick python实现
ahocorasick: [url]https://hkn.eecs.berkeley.edu/~dyoo/python/ahocorasick/[/url]
acora: [url]http://pypi.python.org/pypi/acora/1.5[/url]
esmre: [url]http://code.google.com/p/esmre/[/url]
double array trie:
libdatrie: [url]http://linux.thai.net/~thep/datrie/datrie.html[/url]
darts: [url]http://chasen.org/~taku/software/darts/[/url]
darts-clone: [url]http://code.google.com/p/darts-clone[/url]
java aho-corasick: [url]https://github.com/robert-bor/aho-corasick[/url]
机器学习:
分类和rank机器学习工具包sofia-ml:[url]http://code.google.com/p/sofia-ml/[/url]
一些机器学习算法SGD实现:[url]http://leon.bottou.org/projects/sgd[/url]
liblinear: [url]http://www.csie.ntu.edu.tw/~cjlin/liblinear/[/url]
libsvm: [url]http://www.csie.ntu.edu.tw/~cjlin/libsvm/[/url]
lingpipe: [url]http://alias-i.com/lingpipe/[/url]
mahout: [url]http://mahout.apache.org/[/url]
libfm: [url]http://www.libfm.org/[/url]
graphChi [url]https://code.google.com/p/graphchi/[/url]
CRF++ [url]http://code.google.com/p/crfpp/[/url]
CRFSuite[url]http://www.chokkan.org/software/crfsuite/[/url]
Wapiti [url]http://wapiti.limsi.fr/[/url]
mloss: [url]https://mloss.org/software/view/332[/url]

自然语言处理:
opennlp: [url]http://opennlp.apache.org/[/url]
stanford corenlp: [url]http://nlp.stanford.edu/software/corenlp.shtml#Download[/url]
srilm(语言模型):[url]http://www.speech.sri.com/projects/srilm/download.html[/url]
mallet: [url]http://mallet.cs.umass.edu/[/url]
gensim(topic model for human): [url]http://radimrehurek.com/gensim/[/url]
TweetNLP: [url]http://www.ark.cs.cmu.edu/TweetNLP/[/url]
java机器学习datumbox[url]https://github.com/datumbox/datumbox-framework[/url]
语料:
20Newsgroups [url]http://people.csail.mit.edu/jrennie/20Newsgroups/[/url]
南京大学机器学习与数据挖掘数据和代码[url]http://lamda.nju.edu.cn/CH.Data.ashx[/url]
图片处理:
[url]http://code.google.com/p/thumbnailator/[/url]
[url]http://yann.lecun.com/exdb/mnist[/url]

latex:
latex blog edit: http://latex.codecogs.com/gif.latex?
latax学习:[url]http://latex.yo2.cn[/url]
latax Symbols: [url]http://www.artofproblemsolving.com/Wiki/index.php/LaTeX:Symbols[/url]
[url]http://web.ift.uib.no/Teori/KURS/WRK/TeX/symALL.html[/url]
latax math[url]http://en.wikibooks.org/wiki/LaTeX/Mathematics[/url]
[url]http://www.artofproblemsolving.com/Wiki/index.php/Math[/url]

cache:
simple-spring-memcached: [url]http://code.google.com/p/simple-spring-memcached/wiki/Getting_Started[/url]
收藏链接:
ML/NLP: [url]http://lxmls.it.pt/2013/[/url]
python数据分析[url]http://datacommunitydc.org/blog/2013/07/python-for-data-analysis-the-landscape-of-tutorials/?utm_source=rss&utm_medium=rss&utm_campaign=python-for-data-analysis-the-landscape-of-tutorials[/url]
Science Machine learning resource: [url]http://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml[/url]

公开课和slides:
语言类:[url]http://www.codecademy.com/[/url]
数据科学[url]https://github.com/bcaffo/courses[/url]
CMU高级机器学习[url]http://www.cs.cmu.edu/~./epxing/Class/10715/lecture.html[/url]
凸优化[url]http://so.v.ifeng.com/video?q=%E5%87%B8%E4%BC%98%E5%8C%96&c=5#_v_mininav_search_pc[/url]
smola的课程[url]http://alex.smola.org/teaching/[/url]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值