- 博客(9)
- 收藏
- 关注
转载 python编程命名规范
1.模块名和包名采用小写字母并且以下划线分隔单词的形式;如:regex_syntax,py_compile,_winreg2.类名或异常名采用每个单词首字母大写的方式;如:BaseServer,ForkingMixIn,KeyboardInterrupt3.全局或者类常量,全部使用大写字母,并且以下划线分隔单词;如:MAX_LOAD4.其余变量命名包括方法名,函数名,普通变量名则是采用...
2019-07-21 23:56:38 1264
转载 机器学习-13 新闻推荐 doc2vec
新闻推荐,用户阅读的是整条新闻,不可能将整条新闻直接送进去模型训练,这样的话什么都训练不出来。而新闻是由很多词汇组成,需要进行分词,分词后输入模型进行训练,也只是返回这个词在上下文语境相似的词汇,比如我们输入“公安机关”返回“警察”整片新闻,但是警察不是整篇新闻。doc2vec 将整篇文章中多个词映射到空间中,转换为向量(使用的也是余弦相似度)。不再比较单词的相似度,而是比较文档之间的相似...
2019-05-31 01:03:53 518 3
原创 机器学习 -11 XX评论情感分析 jieba
XX评论情感分析项目背景公司活动,新闻,微博,影评,商品评价等,看看是支持的多,还是反对的多。如此大量的评论数据,如果人工审核比较麻烦、耗费时间,因此通过程序建立模型代替人工审看,分析积极成分多还是消极成分多。 数据量1.5万多 。import pandas as pdimport numpy as npimport jiebaimport refrom sklearn.featur...
2019-05-31 00:38:46 707 1
转载 词袋模型
# 操作词袋模型:# CountVectorizer:对语料库中出现的词汇进行词频统计,相当于词袋模型。# 操作方式:将语料库当中出现的词汇作为特征,将词汇在当前文档中出现的频率(次数)作为特征值。import numpy as npfrom sklearn.feature_extraction.text import CountVectorizercount = CountVecto...
2019-05-31 00:11:32 774
转载 自然语言简介
自然语言处理基础自然语言概念自然语言,即我们人类日常所使用的语言,是人类交际的重要方式,也是人类区别于其他动物的本质特征。我们只能使用自然语言与人进行交流,而无法与计算机进行交流。自然语言处理自然语言处理(NLP Natural Language Processing),是人工智能(AI Artificial Intelligence)的一部分,实现人与计算机之间的有效通信。自然语言处...
2019-05-31 00:04:18 6343
原创 pg2neo尝试2
from py2neo import Graph,Nodeimport psycopg2from commonConfig import POSTGRE_CONFIG,NEO4J_CONFIG# POSTGRE_CONFIG = {# 'host' : 'localhost',# 'port' : '5432',# 'user' : 'postgres',#...
2019-05-27 01:34:53 222
原创 pg2neox小尝试
from py2neo import Graph,Node,Relationshipimport psycopg2from commonConfig import POSTGRE_CONFIG,NEO4J_CONFIGclass Neo4j1(Graph): def get_from_pg(self, pg_sql_client, pg_table, pg_schema = 'pu...
2019-05-27 01:06:21 243
原创 jupyter note 数据保存为 PDF
1 找一个有打印预览的浏览器,我用的是Google2 进入打印预览界面 ,点击“打印”3 选择目标打印机:另存为PDF如果所用浏览器没有这个选项,需要安装虚拟PDF打印机...
2019-03-14 20:33:41 721
原创 jupyter note 怎么将数据保存为word
1 保存成word格式第一步 保存为md格式第二步 通过docker界面转化为word如下:pandoc SRVV Web Services -s -o file.docx第1处:上面导出的md文件所在的目录第2处:上面导出的md文件名第3处: 保存的word文件名直接运行,其他地方不要改动...
2019-03-14 20:31:46 7290 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人