自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

stary_yan的博客

数据爱好者。

  • 博客(4)
  • 收藏
  • 关注

原创 [机器学习]回归分析案例 --- 网游排名分析

[机器学习]回归分析案例 — 网游排名分析项目描述案例来自狗熊会。 基础案例 | 玩家必看之网游排行big picture从项目描述以及数据上看,可以很明显地发现,这是一个非常文本化的数据,也就是无法直接使用机器学习来解决问题。那么,这就非常依赖于将文本量化的能力。本文,我会尝试着完整地把整个项目实现一遍,并给出我的一些理解和感悟。Research首先,我们需要对文本数据有一个大体的认识。各字段的

2017-07-28 20:24:17 1301

原创 基于机器学习的NLP情感分析(二)---- 分类问题

基于机器学习的NLP情感分析(二)—- 分类问题 前文提到了如何把一个文本转换为相应的词向量,本文讨论的是如何进行分类。feature相关性首先,需要看看我之前选出来的feature,是否能够满足需求。这里其实有很多参数没有显示出来。从该图来看,大部分的参数相关性是非常低的,这是一件非常好的事情,因为这说明选出来的参数具有更大表现力。但也发现有一些参数是重复的,这个比较尴尬。当然可以采用PCA

2017-07-18 21:07:35 13257

原创 基于机器学习的NLP情感分析(一)---- 数据采集与词向量构造方法(京东商品评论情感分析)

基于机器学习的NLP情感分析(一)—- 数据采集与词向量构造方法 最近实习期间在做一个对新闻文本情感分析的项目。在此,用京东的商品评论练手,从数据采集到模型实现完整地写一遍,以备未来回顾所需。事实上,我采用的方法并不困难,甚至有点naive,所以权且作为练手吧。数据采集在这里为了避免人工标注的麻烦,使用的是京东iPad的用户评论。事实上,NLP情感分析中最花时间的就是人工标注。仔细查看调试台可

2017-07-18 17:06:29 25132 8

原创 [Python] 多进程编程

python 多进程编程python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程。Python提供了非常好用的多进程包multiprocessing,只需要定义一个函数,Python会完成其他所有事情。借助这个包,可以轻松完成从单进程到并发执行的转换。multiprocessing支持子进程、通信和共享数据、执行不同形式的同步,提供了

2017-07-10 18:19:33 633

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除