机器学习/数据挖掘之中国大牛

李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性等问题的研究。曾在人大听过一场他的讲座,对实际应用的问题抽象,转化和解决能力值得学习。

周志华:http://cs.nju.edu.cn/zhouzh/,是南京大学的杰青,机器学习和数据挖掘方面国内的领军人物,其好几个研究生都进入了美国一流高校如uiuc,cmu等学习和深造。周教授在半监督学习,multi-label学习和集成学习方面在国际上有一定的影响力。另外,他也是ACML的创始人。人也很nice,曾经发邮件咨询过一个naive的问题,周老师还在百忙之中回复了我,并对我如何发邮件给了些许建议。

杨强:http://www.cse.ust.hk/~qyang/,香港科技大学教授,也是KDD 2012的会议主席,可见功力非同一般。杨教授是迁移学习的国际领军人物,曾经的中国第一位acm全球冠军上交的戴文渊硕士期间就是跟他合作发表了一系列高水平的文章。还有,杨教授曾有一个关于机器学习和数据挖掘有意思的比喻:比如你训练一只狗,若干年后,如果它忽然有一天能帮你擦鞋洗衣服,那么这就是数据挖掘;要是忽然有一天,你发现狗发装成一个老太婆消失了,那么这就是机器学习。

李建中:http://db.hit.edu.cn/jianzhongli/,哈工大和黑大共有教授,是分布式数据库的领军人物。近年来,其团队在不确定性数据,sensor network方面也发表了一系列有名文章。李教授为人师表,教书育人都做得了最好,在圈内是让人称道的好老师和好学者。

唐杰:http://keg.cs.tsinghua.edu.cn/jietang/,清华大学副教授,是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统,该系统也是多个会议的支持商。

张钹:http://www.csai.tsinghua.edu.cn/personal_homepage/zhang_bo/index.html 清华大学教授,中科院院士,。现任清华大学信息技术研究院指导委员会主任,微软亚洲研究院技术顾问等。主要从事人工智能、神经网络、遗传算法、智能机器人、模式识别以及智能控制等领域的研究工作。在过去二十多年中,张钹教授系统地提出了问题求解的商空间理
论。近年来,他建立了神经与认知计算研究中心以及多媒体信息处理研究组。该研究组已在图像和视频的分析与检索方面取得一些重要研究成果。

刘铁岩:http://research.microsoft.com/en-us/people/tyliu/ MSRA研究主管,是learning to rank的国际知名学者。近年逐步转向管理,研究兴趣则开始关注计算广告学方面。

王海峰:http://ir.hit.edu.cn/~wanghaifeng/ 信息检索,自然语言处理,机器翻译方面的专家,ACL的副主席,百度高级科学家。近年,在百度主持研发了百度翻译产品。

何晓飞:http://people.cs.uchicago.edu/~xiaofei/ 浙江大学教授,多媒体处理,图像检索以及流型学习的国际领先学者。

朱军:http://www.ml-thu.net/~jun/ 清华大学副教授,机器学习绝对重量级新星。主要研究领域是latent variable models, large-margin learning, Bayesian nonparametrics, and sparse learning in high dimensions. 他也是今年龙星计划的机器学习领域的主讲人之一。

吴军:http://www.cs.jhu.edu/~junwu/ 腾讯副总裁,前google研究员。著名《数学之美》和《浪潮之巅》系列的作者。

张栋:http://weibo.com/machinelearning 前百度科学家和google研究员,机器学习工业界的代表人物之一。

戴文渊:http://apex.sjtu.edu.cn/apex_wiki/Wenyuan_Dai 现百度凤巢ctr预估组leader。前ACM大赛冠军,硕士期间一系列transfer learning方面的高水平论文让人瞠目结舌。

更多机器学习参见链接:http://www.guzili.com/?p=88

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习数据挖掘大作业是一个用Python语言实现的项目。在这个项目中,我们将使用机器学习算法和数据挖掘技术来分析和处理给定的数据集。 首先,我们需要对给定的数据集进行数据预处理。这包括将数据集导入到Python环境中,清理数据中的噪声和异常值,并处理缺失的数据。 接下来,我们将对数据集进行特征选择和特征工程。根据具体问题的要求,我们选择合适的特征,并对这些特征进行变换和组合,以增强机器学习模型的表现力和泛化能力。 然后,我们将选择适当的机器学习算法来建立模型。根据问题的性质,我们可以选择分类、回归或聚类算法。我们还可以使用集成学习方法来提高模型的准确性和鲁棒性。 在选择算法后,我们将利用训练集上的数据来拟合模型,并使用测试集上的数据来评估模型的性能。我们将使用评估指标,如准确度、召回率、精确度和F1分数来评估模型的性能。 最后,我们将根据模型的预测结果来做出对给定问题的预测或决策。这可能包括将预测结果用于分类、回归或聚类,或者将其用于生成新的见解和洞察力。 在整个项目的过程中,我们将使用Python中的各种库和工具来实现各个步骤。这包括NumPy、Pandas、Scikit-learn等库,它们为我们提供了丰富的机器学习和数据处理功能。我们还可以使用可视化工具如Matplotlib和Seaborn来展示数据和模型的结果。 总之,机器学习数据挖掘大作业py是一个用Python实现的项目,它涉及数据预处理、特征选择和工程、模型建立和评估等步骤。通过这个项目,我们可以提高我们对机器学习数据挖掘技术的理解,并应用这些技术来解决实际问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值