机器学习与数据挖掘
文章平均质量分 81
胡说八道的潘老师
这个作者很懒,什么都没留下…
展开
-
2016“编程之美“挑战赛 复赛整理
比赛概述 初赛的网络平台为 Code Hunt平台,初赛时间为4月23日至4月24日,每天进行一场,时间为14:00-16:00。每场晋级1500人,共决出3000人晋级复赛。 复赛采用团队赛的形式,基于云计算平台在实际大数据的基础上展开人工智能等前沿课题的较量。时间安排 赛题介绍 Microsoft Academic Graph (MAG) 是一个巨大的异构图谱,图谱中包含多种实体:作者、论文、原创 2017-03-07 15:23:29 · 703 阅读 · 0 评论 -
文本分类的研究与实现
主要任务 对基本的文本分类算法进行研究,了解并掌握算法基本原理,设计程序实现分类算法,并用数据集进行测试。数据集的获取 本次研究以搜狗实验室的搜狗新闻数据为基本语料,地址 1.格式转换 原始数据集是只读的XML格式文件(news_sohusite_xml.dat)。首先是编码问题,需要将文件转换为UTF-8编码;然后是标签问题,原始XML格式文件缺少根标签,需要自行添加。本次格式转换部分用ja原创 2017-03-07 14:43:14 · 2658 阅读 · 0 评论