python
kinghua23
自然语言处理爱好者
展开
-
中文命名实体识别
命名实体识别(Named Entity Recognition) 命名实体识别是NLP里一项很基础的任务,就是从文本中识别出命名性指称项,为关系抽取等任务做铺垫。狭义上,是识别出人名、地名和组织机构名这三类命名实体(时间、货币名称等构成规律明显的实体类型可以用正则等方式识别)。当然,在特定领域中,会相应地定义领域内的各种实体类型。中文命名实体识别的难点:1.中文文本不像英文有空格...原创 2019-12-20 10:09:49 · 2109 阅读 · 0 评论 -
python3安装pyhanlp方法与问题
问题:直接pip install pyhanlp,会报错: ERROR: No matching distribution found for JPype或者说缺少VC++环境: error: Microsoft Visual C++ 14.0 is required.分析:其实没有Microsoft Visual c++环境也是可以的,可以先安装jpyp...原创 2019-12-19 11:25:55 · 1255 阅读 · 0 评论 -
实体识别 | 正则表达式:提取身份证号
提取身份证号:import retext = "418193200001016666"IDCards_pattern = r'^([1-9]\d{5}[12]\d{3}(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])\d{3}[0-9xX])$'IDs = re.findall(IDCards_pattern, text, flags=0)print...原创 2019-12-19 10:41:06 · 4637 阅读 · 0 评论 -
python list中字符串改为int
Python中列表元素转为数字的方法。具体如下:有一个数字字符的列表:numbers = ['1', '2', '3', '4']想要把每个元素转换为数字:numbers = [1, 2, 3, 4]方法一:用一个循环来解决:new_numbers = []for n in numbers: new_numbers.append(int(n))numbers = new...原创 2018-11-19 09:36:10 · 12344 阅读 · 2 评论 -
python - ImportError: Cannot import name ‘XXX’问题出现
问题:python报错 - ImportError: Cannot import name ‘XXX’解决办法:1.XXX版本更新。2.自己的python文件与导入的包重名了,导致引入路径错乱,文件命名尽量不要用关键词。...原创 2018-12-05 15:04:08 · 46403 阅读 · 12 评论 -
ubuntu下pycharm不能输入中文
在Pycharm启动文件里面去手动指定。我的安装路径启动文件为:/home/young/下载/pycharm-community-2018.2.4/bin/pycharm.sh修改文件,在顶端加入以下内容:export GTK_IM_MODULE=fcitxexport QT_IM_MODULE=fcitx exportXMODIFIERS=@im=fcitx然后重启Pychar...原创 2018-12-17 17:46:10 · 2489 阅读 · 1 评论 -
我的nlp学习路线
一、机器学习框架三大深度学习框架比较1.tensorflow–使用数据流图进行数值计算的开源软件库2.Keras–目前封装有全连接网络、卷积神经网络、RNN和LSTM等算法。3.Caffe–考虑了代码清洁、可读性及速度的深度学习框架4.NLTK–用来编写处理人类语言数据的Python程序原版文档5.scikit-learn–基于SciPy的机器学习模块6.gensim–主题...原创 2019-06-12 16:22:53 · 1463 阅读 · 0 评论