语言处理
Rabin_
这个人很懒,什么都没有留下
展开
-
如何进行中英文分句以及对中英文进行分词
中英文分词简介中英文分词是进行机器学习文本处理方面必须进行的一步,就类似于机器学习中图像处理的降噪,英文分词主要是将标点符号与英文单词进行分隔,中文分词就是讲每个词组进行分隔,ex:‘我是一只程序猿’------>‘我’、‘是’、‘一只’、‘程序猿’,分词是文本处理中数据预处理的必做工作。英文分词英文分词我们使用nltk中提供的WordPunctTokenizer来进行分词,nltk...原创 2018-09-19 10:07:49 · 3149 阅读 · 2 评论 -
面试被军训汇总(小红书、滴滴、招商银行、快看漫画)
小红书:手撕算法:1:给定一个能够随机产生0-6的随机整数的函数,如何根据这个函数产生0-9的随机整数(要求随机性)(凉):2:给定一个数组(可能会有重复值),收集其中三个数之和为0的所有可能:3:给定一个数组,每个值都代表着他最大能够到达的位置,问该数组能否从第一个值到达最后一个值:基本问答:1:如何进行内存分配:2:给了一个结构体:{char a;char b;int c...原创 2019-09-16 17:37:57 · 715 阅读 · 0 评论