![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
MachineLearning
MarsXDM
专注于机器学习算法研究及应用!同样的数据使用不同的表达方式会极大地影响解决问题的难度,一旦解决了数据表达和特征提取,很多人工智能任务也就解决了90%!
对机器学习如何通过知识、经验以及学会学习、推理、决策感兴趣。
感兴趣的领域有:教育就业、智能供应链与制造研发。
希望技术能够切实的改善人机交互的效率和体验、组织运营效率以及创新技术在新领域落地。
展开
-
推荐系统相关的Paper
几篇对工业界比较有影响的论文推荐两篇必看最好能自己实现论文当前推荐系统所面临的挑战相关研究AAAI 2018 录用推荐系统相关的部分PapersReference几篇对工业界比较有影响的论文The Wisdom of The Few 豆瓣阿稳在介绍豆瓣猜的时候极力推荐过这篇论文,豆瓣猜也充分应用了这篇论文中提出的算法;Restricted Boltzmann M原创 2018-01-21 22:28:39 · 3333 阅读 · 0 评论 -
【Note】推荐系统冷启动问题
冷启动问题的描述分类解决方案利用用户注册信息选择合适的物品启动用户兴趣利用物品内容进行推荐引入专家知识@ 2018-01-15 学习项亮博士《推荐系统实践》第三章的笔记。1 冷启动问题的描述分类用户冷启动,登录/注册到网站的新用户没有行为数据,因此无法根据其历史行为预测其兴趣,从而无法借此给他做个性化推荐;物品冷启动,如何将新物品推原创 2018-01-21 22:33:30 · 716 阅读 · 0 评论 -
Python推荐系统库——Surprise
@ 2018-01-24Surprise简单易用同时支持多种推荐算法其中基于近邻的方法协同过滤可以设定不同的度量准则支持不同的评估准则使用示例基本使用方法如下载入自己的数据集方法算法调参让推荐系统有更好的效果在自己的数据集上训练模型首先载入数据使用不同的推荐系统算法进行建模比较建模和存储模型用协同过滤构建模型并进行预测1 movielens的例子2原创 2018-01-24 09:12:11 · 52408 阅读 · 30 评论 -
【ML笔记 1】sklearn和机器学习实战
@ 2018-01-24机器学习基础知识sklearn入门宝典sklearn建模实战1 KNN2 SVM3 网格搜索交叉验证1 机器学习基础知识 从过去的大量数据中“总结”出来“泛化规律”,用于新数据预测。3种不同类型的机器学习有监督学习,数据中已经存在标签值,算法通过这些带标签的样本(监督)习得“经验”,当新数据到来时,将习得的“经验”用原创 2018-01-24 17:40:11 · 1074 阅读 · 0 评论 -
数据预处理——离散化
@ 2018-02-07什么是数据离散化非监督离散化监督离散化1. 什么是数据离散化有些数据挖掘算法,特别是某些分类算法(如朴素贝叶斯),要求数据是分类属性形式(类别型属性)这样常常需要将连续属性变换成分类属性(离散化,Discretization)。另外,如果一个分类属性(或特征)具有大量不同值,或者某些之出现不频繁,则对于某些数据挖掘任务,通过合并某些值减少类...原创 2018-02-08 08:28:37 · 14463 阅读 · 1 评论 -
熵权法
@20171107熵权法的原理1 信息熵Information Entropy2 熵权法熵权法的计算步骤1 确定指标体系2 数据预处理3 归一化处理4 计算指标的熵和权5 指标加权计算得分总结示例1 熵权法的原理1.1 信息熵(Information Entropy)熵是热力学的一个物理概念,是体系混乱度或无序度的度量,熵...原创 2018-02-08 08:37:26 · 124388 阅读 · 11 评论 -
CentOS 6 安装 XGBoost
@ 2017-11-27 CentOS 6 上已经有Python 2.6和Python 2.7两个版本,现需要安装xgboost包升级系统的GCC yum install gcc安装Anaconda 根据系统具体配置下载,大约500多MB下载后运行sh Anaconda2-5.0.1-Linux-x86_64.sh,根据提示输入回车及yes即可配置环境变量,运行python...原创 2018-02-08 08:45:29 · 826 阅读 · 0 评论 -
数据预处理——抽样
@ 2018-02-08有效抽样抽样方法1 简单随机抽样3 系统抽样2 分层抽样3 渐进抽样 抽样是一种选择数据对象子集进行分析的常用方法。在统计学中,抽样长期用于数据的实现调查和最终的数据分析;在数据挖掘中,抽样也非常有用。然而在统计学和数据挖掘中,抽样的动机并不相同:统计学使用抽样是因为得到感兴趣的整个数据集的费用太高、太费时间;而数据挖掘使用抽样是因...原创 2018-02-08 11:16:45 · 5615 阅读 · 0 评论