python
文章平均质量分 83
YShuaiLong
热爱生活,珍惜生命。
展开
-
Day3-中文分词技术(常用分词技术介绍)
1:分词技术1.1:规则分词基于规则的分词是一种机械分词的方法,主要是通过维护词典,在切分语句时,将语句的每个字符串与词表中的词进行逐一匹配,找到则切分,否则不切分。1.1.1 正向最大匹配法正向最大匹配法(Maximum Match Method,MM法)的基本思想:假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前子串中的前i个字作为匹配字段,查找字典。如果字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字原创 2021-04-09 10:48:49 · 1263 阅读 · 0 评论 -
Day2-Numpy使用详解
1:简介Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包,提供了矩阵运算的功能。Numpy提供了一下几个主要功能:ndarray————一个具有向量算数运算和复杂广播能力的多维数组对象。 用于对数组数据进行快速晕眩的标准数学函数。 用于读写磁盘数据的工具以及用户操作内存映射文件的工具。 非常有用的线性代数,傅里叶变换和随机数操作。 用于集成C/C++和Fortran代码的工具。除明显的科学用途之外,Numpy也可以用作通用数据的高效多维容器,可以定义任原创 2021-03-04 18:24:22 · 328 阅读 · 3 评论 -
Day1-正则表达式在NLP中的基本应用
1:Anaconda常用命令conda --versionconda infoconda list 已安装的包conda install package_name(package_name:包名)例如:conda install numpy安装多个conda install numpy scipy pandas安装指定版本conda install numpy=1.10卸载conda remove package_name更新conda update原创 2021-03-04 14:56:10 · 1177 阅读 · 2 评论