自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SinGaln的博客

人工智障、机器瞎蒙、深度乱学、NLP瞎搞工程师!

  • 博客(4)
  • 资源 (9)
  • 收藏
  • 关注

原创 ValueError: setting an array element with a sequence.错误处理。。。

对于这个错误,看了很多的博客资料。都说数组元素没有对齐,找到相应的列补充元素就行,看了之后心累啊。。。。 小编做自然语言处理,几个G的文本啊,怎么找啊!!!!! 所以,经过我的一番努力,终于找到了解决办法。。。。 就几行代码的事:主要是补全元素import numpy as npvec = []f = open('a.txt', encoding='utf-8')while Tr...

2018-08-31 12:43:27 36144 5

原创 自然语言处理语料

搜狗新闻语料 密码:7grc 百度百科数据 密码:gshk SougouR语料 密码:phwd freebase_mid2name 密码:cafv freebase-FB5M 密码:0imt 69万大词库 密码:fmqf 汉语词库 密码:witn 哈工大LTP models ...

2018-08-26 17:15:12 1781 2

原创 jieba分词,去除停用词并存入txt文本

代码如下,停用词获取点击这里。 密码:cef8# -*- coding: utf-8 -*-import jiebaimport jieba.analyseimport jieba.posseg as psegimport refrom pyltp import NamedEntityRecognizer# jieba.load_userdict('userdict.txt')...

2018-08-26 17:04:29 15951 4

原创 中文繁体字转简体

首先,复制以下代码并命名为langconv.py#!/usr/bin/env python# -*- coding: utf-8 -*-from copy import deepcopyimport retry: import psyco psyco.full()except: passtry: from zh_wiki import zh...

2018-08-26 16:58:25 26689

Distant supervision 相关文献

Distant supervision 相关文献 Distant supervision 相关文献

2018-04-16

hownet地名词库

此文件包括了hownet的中的地名词库和一些名词 此文件包括了hownet的中的地名词库和一些名词

2018-04-16

基于图的中文集成实体链接算法_刘峤.

基于图的中文集成实体链接算法_刘峤,是新手入门的必备资料。

2017-11-08

python语料爬虫

做自然语言处理时需要语料来做训练集,利用这个爬虫程序可以很方便的获取语料。

2017-10-31

python爬虫项目集

最为基本的python爬虫项目,适合于初学者学习python爬虫

2017-10-29

Java学习基本代码

最基本的Java学习代码,适合于初学者进一步的了解Java。

2017-10-29

python爬虫框架

最为基本python爬虫框架,适合于初学者学习如何使用python进行爬虫。

2017-10-29

刘峤-知识图谱构建技术综述

知识图谱构建技术综述是一篇很好的知识图谱文章,适合于初学者。

2017-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除