Python
程裕强
开源是人类最大的公益事业!--程裕强
展开
-
Python for循环生成列表
1、示例list = [x*x for x in range(10)]print(list)输出[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]2、小结featList = [fun(e) for e in dataSet]说明,通过元素e循环取数据集dataSet,对e进行二次加工fun(e),依次放入列表featList。3、应用加载停用词表...原创 2019-10-28 14:02:56 · 14478 阅读 · 0 评论 -
自然语言处理:日期识别
#日期识别# 模块:所谓模块就是一个.py文件,用来存放变量,方法的文件# 包(package): 包是更大的组织单位,用来组织区别管理多个模块文件# import 模块 [as 别名模块]# import 包.[N包].模块# import 导入 最后一个必须是模块,而不能以包结尾# from 包.[..包] import 模块# from 包.模块 import 方法#...原创 2019-10-28 09:59:58 · 2289 阅读 · 0 评论 -
UnicodeEncodeError: 'locale' codec can't encode character '\u5e74' in position 2: encoding error
strftime()函数报错UnicodeEncodeError: 'locale' codec can't encode character '\u5e74' in position 2: encoding error我的strftime()函数调用代码如下:time.strftime('%Y年%m月%d日')修改为time.strftime('%Y{y}%m{m}%d{d}).f...原创 2019-10-28 09:18:01 · 3582 阅读 · 1 评论 -
中文分析jieba简单应用
1、三种分词模式import jiebamsg = '安徽省长江流域!'seg_list = jieba.cut(msg, cut_all=True)print('全模式:', '/ ' .join(seg_list)) seg_list = jieba.cut(msg, cut_all=False)print('精确模式:', '/ '.join(seg_list)) seg_li...原创 2019-10-25 14:50:42 · 1038 阅读 · 1 评论 -
Anaconda安装第三方库(jieba)
1、下载https://pypi.org/project/jieba/#files2、安装C:\ProgramData\Anaconda3\pkgs(base) C:\Windows\system32>cd C:\ProgramData\Anaconda3\pkgs(base) C:\ProgramData\Anaconda3\pkgs>cd jieba-0.39(...原创 2019-10-24 18:06:05 · 7143 阅读 · 2 评论 -
中文分词算法:逆向最大匹配法
1、词典./data/rmm_dic.utf8南京市南京市长长江大桥人民解放军大桥2、RMM算法#逆向最大匹配class RMM(object): def __init__(self, dic_path): self.dictionary = set() self.maximum = 0 #读取词典 wit...原创 2019-10-24 11:32:27 · 2113 阅读 · 0 评论 -
numpy:简单的统计计算
import numpy as npvector=np.array([5,10,15,20])vector.sum()输出50m=np.array([ [1,2,3], [10,20,30], [35,45,55]])m.sum()输出201m.sum(axis=0)输出array([46, 67, 88])m.sum(axis=1)...原创 2019-10-24 10:17:50 · 289 阅读 · 0 评论 -
numpy:数据类型转换
import numpy as npvector=np.array(['0','5','10'])vector=vector.astype(float)print(vector)输出[ 0. 5. 10.]vector=np.array(['0','5','10','a'])vector=vector.astype(float)报错ValueError Traceba...原创 2019-10-24 10:09:03 · 627 阅读 · 0 评论 -
numpy:数组比较
m=np.array([ [1,2,3], [10,20,30], [35,45,55]])n=(m==20)print(n)输出[[False False False] [False True False] [False False False]]col2=(m[:,1]==20)print(col2)输出[False True Fals...原创 2019-10-23 17:43:34 · 4013 阅读 · 0 评论 -
numpy:矩阵切片
import numpy as npm=np.array([ [1,2,3], [10,20,30], [35,45,55]])print(m[:,1])print(m[1,:])print(m[:,0:2])print(m[1:3,0:2])运行结果原创 2019-10-23 17:18:38 · 696 阅读 · 0 评论