自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ArYe

人工智能

  • 博客(3)
  • 资源 (18)
  • 收藏
  • 关注

原创 词向量变种大全Python原创代码:引入词性、引入TFIDF、单位向量、降维

1、词向量引入词性1.1、原理1.2、预设词性特征1.3、完整代码示例1.4、效果比较及改进方向2、词向量-->单位向量2.1、原理2.2、极简代码3、词向量+TFIDF3.1、原理3.2、极简代码3.3、引入TFIDF前后可视化对比4、降维4.1、降到二维并可视化4.2、降到三维并可视化对训练后的词向量,引入预设词性特征应用场景:关键词抽取提升、命名实体识别提升…大家可以根据自身业务场景来选择是否引入词性

2020-07-25 11:01:00 1304 12

原创 NLP相关的语言学基础

自然语言处理是一门融语言学、计算机科学、数学于一体的科学。只会数学和计算机是不够的,本文补充相关的语言学基础。语言学是以人类语言为研究对象的学科。探索范围包括语言的性质、功能、结构、运用和历史发展,以及其他与语言有关的问题。语言学的重要分支学科:语法学。相关重要学科:英语语法、汉语语法、句法、词法、现代汉语…主要目的:搞清楚哪些词属于什么词类;词性标注表的由来。

2020-07-22 08:09:43 1460

原创 我用程序求解2020广东高考理数压轴题

2020广东理数第21题【函数】已知 f(x)=ex+ax2−xf(x)=e^x+ax^2-xf(x)=ex+ax2−x(1)当 a=1a=1a=1 时,论 f(x)f(x)f(x) 单调性(2)当 x≥0x \geq 0x≥0 时,KaTeX parse error: Undefined control sequence: \geqx at position 6: f(x) \̲g̲e̲q̲x̲^3 + x...

2020-07-12 21:13:24 374 2

编译好的Atlas服务和HIVE-hook

版本2.1.0 apache-atlas-2.1.0-server.tar.gz和apache-atlas-2.1.0-hive-hook.tar.gz

2022-02-03

ClickHouse2021年的安装包

解压后有4个ClickHouse的安装包

2021-09-01

ElasticSearch6.6压缩Linux压缩包

ElasticSearch6.6+kibana-6.6.0+elasticsearch-analysis-ik-6.6

2021-08-25

AI古诗生成2021版.rar

Python程序写诗【训练1分钟】古诗生成,原创链接: https://yellow520.blog.csdn.net/article/details/86726619

2021-06-20

hadoop-3.1.0.rar

适用于Windows10+IDEA上开发hadoop3.13的安装包(或者叫:压缩包;依赖) https://yellow520.blog.csdn.net/article/details/115712233

2021-04-14

segment.rar

Java+Maven实现中文分词:https://yellow520.blog.csdn.net/article/details/115035978

2021-04-06

Spark中文分词+文本分类.rar

Scala中文分词+SparkML逻辑回归 实现 中文文本分类

2021-03-25

离线数仓安装包.rar

亲测可用的JDK、Hadoop、HIVE安装包,配套博文: https://yellow520.blog.csdn.net/article/details/112253651

2021-01-06

大数据入门HIVE和MySQL安装包

配套专栏:https://blog.csdn.net/yellow_python/category_10582173.html

2020-12-25

大数据入门安装包Hadoop、JDK等

配套本专栏(https://blog.csdn.net/yellow_python/category_10582173.html)的大数据入门安装包

2020-12-25

自然语言处理文本分类实验

Python文本分类总结:贝叶斯,逻辑回归,决策树,随机森林,SVM,词向量,TFIDF,神经网络,CNN,LSTM,GRU,双向RNN,LDA:含文本10分类语料、机器学习算法、深度学习算法、专家系统,文本分类结果及结论

2020-09-27

NLP文本10分类EXCEL

用于自然语言处理的文本10分类语料,xlsx格式,数据量19467,分别为: [('science', 2093), ('car', 2066), ('finance', 2052), ('sports', 2017), ('military', 2007), ('medicine', 2000), ('entertainment', 1906), ('politics', 1865), ('education', 1749), ('fashion', 1712)]

2020-09-19

2020中国省市拼音.xlsx

2020年中国一级和二级行政区划的【驼峰拼音】,一共三百多条数据,另附行政区划全称和简称,说得够清楚了,下了就不要给差评。

2020-07-21

region2019.xlsx

中国行政区划2019(2020年采集),采集自国家统计局http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/

2020-05-28

中国行政区划【更新至2018-10-31】

中国行政区划(更新至2018-10-31),数据采集于2019年采集。 采集网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html

2019-03-27

Keras英译中seq2seq简洁示例

Keras【极简】seq2seq英译中示例,附带语料以及训练500次后的模型

2019-02-21

Python程序写诗【1分钟】古诗词生成

Python词向量gensim文本生成,训练【一分钟】,诗词歌赋【一秒生成】

2019-02-11

Python一分钟生成古诗词

Python文本生成程序,从零训练词向量,一分钟生成古诗对联~

2019-01-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除