数据处理
chnhbhndchngn
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
numpy求和np.sum()
numpy求和 import numpy as np a = np.array([[1, 2, 1], [3, 4, 5]]) # axis=0代表将行进行求和, # 也就是将各个列的不同行进行求和 print("axis=0:", np.sum(a, axis=0)) # axis=1代表将列进行求和, # 也就是将各个行的不同列进行求和 print("axis=1:", np.sum(a, axis=1)) # 所有元素求和 print(np.sum(a))原创 2020-08-05 13:06:33 · 9760 阅读 · 1 评论 -
评估方法
from sklearn import metrics # 这些指标是scoring可选择的参数, # cross_val_score, GridSearchCV中的scoreing参数 sorted(metrics.SCORERS.keys()) 结果: ['accuracy', 'adjusted_mutual_info_score', 'adjusted_rand_score', 'average_precision', 'balanced_accuracy', 'comp...原创 2020-08-04 19:03:07 · 346 阅读 · 0 评论 -
全角文本变半角文本
在做自然语言处理的时候发现国内的好多语料库都是采用的全角编码的, 这会有些麻烦, 需要将其改编成半角编码 import os def Q2B(uchar): """全角转半角""" inside_code = ord(uchar) if inside_code == 0x3000: inside_code = 0x0020 else: inside_code -= 0xfee0 # 转完之后不是半角字符返回原来的原创 2020-07-26 10:24:06 · 312 阅读 · 0 评论 -
numpy 操作
向上, 向下取整 import numpy as np # 向上取整, 但不是整数, 需要转换类型 np.ceil(2.6) 3.0 np.ceil(2.6).astype(np.int) 3 # 向下取整, 但不是整数, 需要转换类型 np.floor(2.6) 2.0 np.floor(2.6).astype(np.int) 2 ...原创 2020-07-22 22:37:56 · 306 阅读 · 0 评论 -
python获取 英文标点符号
英文中的所有标点符号 from string import punctuation punctuation 结果: '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~' 删除中文文本中的所有标点符号 import re pun = ",。……——“”‘’!;" punList = list(set(list(pun))) pattern = re.compile("|".join(punList)) res = re.sub(patter..原创 2020-07-22 19:19:24 · 4459 阅读 · 0 评论 -
修改 matplotlib 的默认配置添加雅黑字体
永久解决jupyter中文显示问题原创 2019-12-08 20:27:44 · 2019 阅读 · 0 评论 -
文本数据的全角转半角
搜狗实验室http://www.sogou.com/labs/resource/ca.php提供了很多用于测试和练习的文本数据,不过这里面的数据好多都是使用的全角编码,这里进行修改一下,将全角改变为半角 def Q2B(uchar): """全角转半角""" inside_code = ord(uchar) if inside_code == 0x3000: ...原创 2019-11-28 23:17:41 · 582 阅读 · 0 评论
分享