自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 NLTK库进行文本分类的过程

本文针对英文文本,介绍的全部都是基于Python3.7,利用NLTK库进行文本分类的过程.文本分词文本分词即将文本拆解成词语单元,英文文本以英文单词空格连接成句,分词过程较为简单。以下介绍几种方法。正则表达式分词1.以空格进行分词import retext = 'I was just a kid, and loved it very much! What a fantastic so...

2019-04-16 12:53:22 1966

原创 安装python 包的几种方式

1.cmd 进入终端,pip install package 【前提是安装的python,添加了环境变量】2.下载 .whl 类型的文件,这里给一个链接https://www.lfd.uci.edu/~gohlke/pythonlibs/这里边有大部分的包。下载后,在终端 pip install path\packle.whl, path是文件所在路径3.下载github里边的包,是个压...

2019-04-15 15:42:37 1215

原创 python异常处理【try--except】

Python异常 处理try-except-finally@TOC一、try…except有时候我们写程序的时候,会出现一些错误或异常,导致程序终止。例如,做除法时,除数为0,会引起一个ZeroDivisionError例子:a = 10b = 0c = a/bprint('down') 运行结果:ZeroDivisionError: integer division or m...

2019-04-15 14:26:42 2123

转载 文本嵌入

什么是NLP?自然语言处理(NLP) 是计算机科学,人工智能和语言学的交叉领域。目标是让计算机处理或“理解”自然语言,以执行语言翻译和问题回答等任务。随着语音接口和聊天机器人的兴起,NLP正在成为信息时代最重要的技术之一,同时它也是人工智能的关键部分。充分理解和表达语言的含义是一个非常困难的目标。为什么?因为人类的语言很特别。人类语言有什么特别之处?1.人类语言是专门为传达说话人的意图而构...

2019-03-25 22:05:28 3051

转载 Google最新的模型bert

BERT (Bidirectional Encoder Representations from Transformers)10月11日,Google AI Language 发布了论文BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding提出的 BERT 模型在 11 个 NLP ...

2019-03-25 22:01:14 267

原创 数据挖掘常用算法原理

作为一个统计出身的数据人,学习机器学习更要学习原理。对于数学原理透彻理解,不论是模型优化还是参数调整都将是一个很好的理论功底。在此参照网上一篇理论博文,再学习理解一遍。常见机器学习算法(主要是一些常规分类器)大概流程和主要思想。朴素贝叶斯:  有以下几个地方需要注意:1. 如果给出的特征向量长度不同,这是需要归一化为同长度的向量(这里以文本分类为例),比如说是句子中的单词的话,则长度为整个...

2019-01-27 17:46:13 3143

原创 互联网-指标介绍(一)

DAU:日活跃用户(Day Active User),在当天登录过(APP\游戏\活动等账户)的用户,有效反映和衡量一款应用产品核心用户数。关于这个指标,存在一定的争议,有的把每日重复登陆的用户也记录在内(user_id不去重),这种情况一般很难说明一款应用的真实数据,个人感觉不宜用。另外一种方式是不计算重复登陆的用户(user_id要去重),即计算当天曾经登陆过的用户,登陆两次也只算1,这个可以...

2019-01-27 13:28:12 629

转载 互联网数据分析的思路(一)

互联网数据分析的思路(一)首先,明确数据分析的目的。因为 数据是在产品上线后收集到的,所以便于得到后续一系列全面合理的数据,必须需提前做好数据的规划,明确每一个数据所能产生的价值。不同的分析目的,所需要的数据指标不一样对于产品需求经理来说,一般有三个场景中的数据应用:1.每日观测的产品运行数据;2.为了验证某个想法而做的产品实验数据,如A/B测试;3.发布某个功能后的反馈数据。不同...

2019-01-25 14:04:31 1359

身份证号码前六位对应省市名称

2016年版的全国地市名称对应表,相对较为权威,采摘于户籍管理数据。

2019-04-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除