自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 python编程命名规范

1.模块名和包名采用小写字母并且以下划线分隔单词的形式;如:regex_syntax,py_compile,_winreg2.类名或异常名采用每个单词首字母大写的方式;如:BaseServer,ForkingMixIn,KeyboardInterrupt3.全局或者类常量,全部使用大写字母,并且以下划线分隔单词;如:MAX_LOAD4.其余变量命名包括方法名,函数名,普通变量名则是采用...

2019-07-21 23:56:38 1252

转载 机器学习-13 新闻推荐 doc2vec

新闻推荐,用户阅读的是整条新闻,不可能将整条新闻直接送进去模型训练,这样的话什么都训练不出来。而新闻是由很多词汇组成,需要进行分词,分词后输入模型进行训练,也只是返回这个词在上下文语境相似的词汇,比如我们输入“公安机关”返回“警察”整片新闻,但是警察不是整篇新闻。doc2vec 将整篇文章中多个词映射到空间中,转换为向量(使用的也是余弦相似度)。不再比较单词的相似度,而是比较文档之间的相似...

2019-05-31 01:03:53 511 3

原创 机器学习 -11 XX评论情感分析 jieba

XX评论情感分析项目背景公司活动,新闻,微博,影评,商品评价等,看看是支持的多,还是反对的多。如此大量的评论数据,如果人工审核比较麻烦、耗费时间,因此通过程序建立模型代替人工审看,分析积极成分多还是消极成分多。 数据量1.5万多 。import pandas as pdimport numpy as npimport jiebaimport refrom sklearn.featur...

2019-05-31 00:38:46 701 1

转载 词袋模型

# 操作词袋模型:# CountVectorizer:对语料库中出现的词汇进行词频统计,相当于词袋模型。# 操作方式:将语料库当中出现的词汇作为特征,将词汇在当前文档中出现的频率(次数)作为特征值。import numpy as npfrom sklearn.feature_extraction.text import CountVectorizercount = CountVecto...

2019-05-31 00:11:32 765

转载 自然语言简介

自然语言处理基础自然语言概念自然语言,即我们人类日常所使用的语言,是人类交际的重要方式,也是人类区别于其他动物的本质特征。我们只能使用自然语言与人进行交流,而无法与计算机进行交流。自然语言处理自然语言处理(NLP Natural Language Processing),是人工智能(AI Artificial Intelligence)的一部分,实现人与计算机之间的有效通信。自然语言处...

2019-05-31 00:04:18 6326

原创 pg2neo尝试2

from py2neo import Graph,Nodeimport psycopg2from commonConfig import POSTGRE_CONFIG,NEO4J_CONFIG# POSTGRE_CONFIG = {# 'host' : 'localhost',# 'port' : '5432',# 'user' : 'postgres',#...

2019-05-27 01:34:53 217

原创 pg2neox小尝试

from py2neo import Graph,Node,Relationshipimport psycopg2from commonConfig import POSTGRE_CONFIG,NEO4J_CONFIGclass Neo4j1(Graph): def get_from_pg(self, pg_sql_client, pg_table, pg_schema = 'pu...

2019-05-27 01:06:21 238

原创 jupyter note 数据保存为 PDF

1 找一个有打印预览的浏览器,我用的是Google2 进入打印预览界面 ,点击“打印”3 选择目标打印机:另存为PDF如果所用浏览器没有这个选项,需要安装虚拟PDF打印机...

2019-03-14 20:33:41 712

原创 jupyter note 怎么将数据保存为word

1 保存成word格式第一步 保存为md格式第二步 通过docker界面转化为word如下:pandoc SRVV Web Services -s -o file.docx第1处:上面导出的md文件所在的目录第2处:上面导出的md文件名第3处: 保存的word文件名直接运行,其他地方不要改动...

2019-03-14 20:31:46 7273 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除