- 博客(4)
- 资源 (8)
- 收藏
- 关注
翻译 Zipfian分布
最近在看Multi-View Learning of Word Embeddings via CCA这篇文章时,里面提到了一个陌生的概率分布模型.Zipfian distribution一个离散幂律概率分布,也就是常常提到的长尾模型.在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,是出现频率第三位的单词的3倍。 在Bro
2017-12-19 15:55:58 10785
原创 典型相关性学习
典型相关性分析(Canonical Correlation Analysis,CCA)的核心思想是:寻找两个变量场XX,YY对应的两组基向量WxW_x,WYW_Y,使得XX,YY在WxW_x,WYW_Y上投影后的结果最大程度地保持XX,YY之间的相关性一致.
2017-12-14 11:30:55 985
原创 特征工程
特征工程是一个任务驱动的经验性处理过程数据与特征处理特征表达 数值型类别型时间型文本型统计型组合特征数据的表示应当转换为更理想的格式数值型幅度调整/归一化Log等变化统计值max,min,mean,std离散化(一个特征变多个特征)(等距切分,等频切分)Hash分桶每个类别下对应的变量统计值histogram试试 数值型=>类别型...
2017-12-13 21:31:19 384
转载 参数服务器——分布式机器学习的新杀器
在大规模数据上跑机器学习任务是过去十多年内系统架构师面临的主要挑战之一,许多模型和抽象先后用于这一任务。从早期的MPI,到后来的Hadoop,乃至于目前使用较多的Spark,都曾被广泛应用于大规模机器学习处理任务。John Langford曾经在他的博客(机器学习领域最好的博客之一)上总结和对比了主流的分布式机器学习框架的抽象[1]: MPI Gradient Agg
2017-12-05 10:36:50 10339
2018 年成都人工智能前沿论坛总结
2018-05-14
灰色系统理论及其应用
2015-06-16
HSA-SysArch-1.01
2015-06-07
光纤连接器件SFF_8472
2014-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人