自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 NLP 第十五周 文本分类 & 情感分析

①将文本数据转化成特征向量,常用词袋法。主要有两个API来实现:CountVectorizer(只考虑词汇在文本中出现的频率)TfidfVectorizer(除了考量某词汇在文本出现的频率,还关注包含这个词汇的所有文本的数量能够削减高频没有意义的词汇出现带来的影响, 挖掘更有意义的特征。文本条目越多,Tfid的效果会越显著)进一步加深理解可看 文本特征提取②进一步学习TF-IDF可看 ...

2019-12-11 13:44:43 270

原创 NLP 3rd (数据平滑)

请看这个例子:假设语料是由下面的三个句子构成:①:BROWN READ HOLY BIBLE②:MARK READ A TEXT BOOK③:HE READ A BOOK BY DAVID如果按照最大似然估计的方法计算p(BROWN READ A BOOK)的话:因此:但是这时候问题来了:如果我们这时候要求p(David read a book),这时候概率是多少呢?但是根据我们...

2019-09-23 09:39:13 389

原创 NLP 2nd (前置技术——Numpy使用简介1)

1

2019-09-23 09:35:24 392

原创 NLP 1st (导入)

Natural Language Processing NLP自然语言处理定义介绍自然语言处理,英文Natural Language Processing,简写NLP。NLP这个概念本身过于庞大,可以把它分成“自然语言”和“处理”两部分。先来看自然语言。区分于计算机语言,自然语言是人类发展过程中形成的一种信息交流的方式,包括口语及书面语,反映了人类的思维,都是以自然语言的形式表达。现在世界上...

2019-09-23 07:16:35 636

原创 《汇编语言程序设计(第5版)》 第三、四章小习题 DOSBox 5.x版本

相关概念DOSBox是一个 DOS 模拟程序,由于它采用的是 SDL 库,所以可以很方便的移植到其他的平台。目前,DOSBox 已经支持在 Windows、Linux、Mac OS X、BeOS 、palmOS、Android 、webOS、os/2等系统中运行。是一个软件。它是当前在 Windows 系统运行 DOS 游戏的较为完美的解决方案,该软件不仅能支持相当多的游戏实现正常运行,而且...

2019-04-17 13:21:36 3847 1

原创 标准库 time、datatime、calender、random 的使用

datatime 库的使用Python 时间处理的标准函数库 datatime 提供了一批显示日期和时间的格式化方法。random 库的使用随机运算的标准函数库 random 共提供 9 个常用函数。...

2019-04-17 13:21:18 245

原创 在文件中存储 Python 对象:转换

把多种Python对象写入一个文本文件的各行!!要使用转换工具把对象转成字符串,文本数据在脚本中一定是字符串,而写入方法不会自动地做任何到字符串的格式转换工作。X,Y,Z = 43, 44, 45S = 'Spam' #必须是字符串才能存储在文件中D = {'a' : 1, 'b' : 2}L = [1, 2, 3]F = op...

2019-03-31 17:51:29 447

原创 Python 字符串方法详解

去空格及特殊符号s.strip().lstrip().rstrip(’,’)复制字符串#strcpy(sStr1,sStr2)sStr1 = 'strcpy'sStr2 = sStr1sStr1 = 'strcpy2'print sStr2连接字符串#strcat(sStr1,sStr2)sStr1 = 'strcat'sStr2 = 'append'sStr1 ...

2019-03-25 18:36:36 100

原创 Python 内置函数功能汇总

Duang!68个内置函数abs() 取绝对值>>> abs(-5.24)5.24all() 判断可迭代对象的每个元素是否都为True值。若括号内元素为0

2019-03-17 17:23:17 1842

原创 math 标准库函数功能汇总

Python 数学计算的标准函数库 math 共提供4个数学常数和44个函数。该库是Python提供的内置数学函数库,因为复数类型常用于科学计算,一般计算并不常 用,因此math库不支持复数类型,仅支持整数和浮点数运算。引用 math库import mathmath.fabs(-5)5.0对库中函数采用 math.<函数名>()形式 使

2019-03-16 19:28:17 1247

原创 Jupyter Notebook 与 Markdown 知识点汇总

· Jupyter Notebook 是一个交互式笔记本,支持运行 40 多种编程语言,其本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等 。· Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。JJ...

2019-03-10 18:11:42 273

原创 因为害怕冷场 所以 anti-ice point

I’ ll cover you.

2019-03-05 22:06:05 98

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除