![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习有关
小小小北漂
自学能力强, 对新技术敏感度高, 能够很快的将新技术运用到实际开发中
性格开朗,参与过多个项目的开发,熟悉常见业务处理,具有较强的团队合作意识,能快速融入团队
能够承受在一定压力下进行开发,能接受集体加班和非长期(一年及以内)出差,安分守己,踏实敲代码
具有良好的英语阅读能力,能阅读英文资料、技术文档等
展开
-
使用python+机器学习方法进行情感分析(详细步骤)
不是有词典匹配的方法了吗?怎么还搞多个机器学习方法。 因为词典方法和机器学习方法各有千秋。 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类,机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。 回复此公众号“web”获取源转载 2017-09-15 10:58:51 · 1697 阅读 · 1 评论 -
Gensim源代码详解——utils(持续更新中)
#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块包含各种通用实用函数。 """ from __future__原创 2017-09-20 14:10:43 · 4207 阅读 · 3 评论 -
机器学习总章
聚类 机器学习算法(一):聚类算法 - tuqinag的专栏 - 博客频道 - CSDN.NET 距离 距离计算方法总结 - Bin的专栏 - 博客园 各种距离算法汇总 - mousever的专栏 - 博客频道 - CSDN.NET 几种常见距离算法小结 - 数据挖掘专栏 - 博客频道 - CSDN.NET 18种和“距离(distance)”、“相似度(similarity)”转载 2017-09-11 10:55:38 · 262 阅读 · 0 评论 -
Gensim官方教程翻译(七)——分布式潜在语义分析案例(Distributed Latent Semantic Analysis)
仅供个人学习之用,如有纰漏,敬请指正。原文地址 阅读《分布式计算》教程来了解gensim中的分布式计算。 设置一个集群 我们将会通过一个案例展示如何运行分布式潜在语义分析。让我们假设我们有5个计算机,所有的电脑都在一个网段(网络广播可达)。为了开始,首先安装gensim并在每台电脑上设置Pyro(): $ sudo easy_install gensim[distr转载 2017-09-11 10:53:34 · 602 阅读 · 0 评论 -
Gensim官方教程翻译(六)——分布式计算(Distributed Computing)
为何要分布式计算? 需要构建一个百万文档级语料库的语义代表,却耗时太~~长?手上有几个可用的闲置计算机?分布式计算力争通过将给定的任务切分为几个小型任务,并将这些任务指派给几台平行的计算机完成来实现加速计算。 在这里提到的计算节点是指通过其IP地址/端口识别的计算机,并通过TCP/IP协议完成通讯。所有可用的计算机作为一个整体,称为集群(cluster)。分布式是非常粗粒度的(没有太多实转载 2017-09-11 10:52:49 · 524 阅读 · 0 评论 -
Gensim官方教程翻译(五)——英文维基百科的实验
仅供个人学习之用,如有错误,敬请指正。原文地址 为了测试gensim的性能,我们在维基百科英文版上运行了一些实验。 这个页面描述了获取与处理维基百科的过程,以便任何人都能再现这个结果。本教程要求已经正确安装了gensim。 译者注:维基百科的内容在不断更新,因此本文的结果仅供参考,可能与实际情况有出入。 准备语料库 首先,从 http://download.转载 2017-09-11 10:51:14 · 947 阅读 · 1 评论 -
Gensim官方教程翻译(四)——相似度查询(Similarity Queries)
仅供个人学习之用,如有错误,敬请指正。原文地址 如果想要开启日志,别忘记设置: >>> import logging >>> logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)12 相似度接口 在之前的教程《语料库与向量空间》和《主题与转换》中转载 2017-09-11 10:50:20 · 1051 阅读 · 0 评论 -
Gensim官方教程翻译(三)——主题与转换(Topics and Transformations)
为了我自己学习方便,翻译了gensim的官方教程。如有错误,请指正。原文地址 如果想要开启日志,别忘记设置: >>> import logging >>> logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)12 转换接口 在之前的教程《语料库与转载 2017-09-11 10:48:39 · 379 阅读 · 0 评论 -
Gensim官方教程翻译(二)——语料库与向量空间(Corpora and Vector Spaces)
仅供我自己学习方便,翻译了原教程,原文地址:http://radimrehurek.com/gensim/tut2.html ====================正==========文==================== 如果你想记录日志,请不要忘记设置: >>> import logging >>> logging.basicConfig(format='%(as转载 2017-09-07 22:37:26 · 323 阅读 · 0 评论 -
Gensim官方介绍翻译(一)
为了方便自己学习,翻译一下。原文地址:http://radimrehurek.com/gensim/intro.html。 Gensim是一个免费的Python库,它可以用来从文档中自动提取语义主题,并且尽可能地做到轻松(对人)高效(对电脑)。 Gensim致力于处理原始的、非结构化的数字文本(普通文本)。Gensim中用到的算法,如潜在语义分析(Latent Semantic A转载 2017-09-07 22:30:23 · 280 阅读 · 0 评论 -
Gensim源代码详解——dictionary(持续更新中)
#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块实现了字典的概念—单词之间的映射 他们的整数id。 字典可以原创 2017-09-19 20:45:03 · 2098 阅读 · 0 评论