信息内容安全
文章平均质量分 65
夏荷影
这个作者很懒,什么都没留下…
展开
-
基于酒店评论的文本情感分析
使用数据集: 谭松波–酒店评论语料其中包含正面数据集和负面数据集获取链接:https://pan.baidu.com/s/1oObY4A_Ovo1CY00UrgbBKg提取码:kth7这里感谢大佬的分享的数据:原链接:https://blog.csdn.net/LiuKingJia/article/details/104228617本文中做的工作是将预料划分为积极和消极两种情感,目前使用的是SVM模型进行训练,但是该模型训练效果较差,后期会改用其他模型达到准确率为76%其中正向95%左右原创 2021-01-10 11:41:15 · 3613 阅读 · 21 评论 -
Learning-based Practical Smartphone Eavesdropping with Built-in Accelerometer综述
**一、选取文献及其理由**1.1选取文献Zhongjie Ba,Tianhang Zheng,Xinyu Zhang,Zhan Qin,Baochun Li,Xue Liu,Kui Ren. Learning-based Practical Smartphone Eavesdropping with Built-in Accelerometer, Network and Distributed System Security Symposium, January 2020 (DOI 10.1472原创 2021-01-06 14:42:55 · 1208 阅读 · 0 评论 -
Authoritative Sources in a Hyperlinked Environment 翻译
Abstract 超链接环境的网络结构可以是关于环境内容的丰富信息来源,只要我们有有效的手段来理解它。我们开发了一组算法工具,用于从这些环境的链接结构中提取信息,并报告了在各种上下文中证明它们在万维网上的有效性实验。我们在框架内讨论的中心问题是通过发现关于这些主题的“权威”信息来源来提炼广泛的搜索主题。我们提出并测试了权威概念的算法公式,基于一组相关的权威页面和一组将它们连接在一起的“集线器页面”之间的关系链接结构。我们的公式与与链接图相关的某些矩阵的特征向量有联系;这些联系反过来激励基于链接的分析的额外启翻译 2020-12-15 19:35:31 · 437 阅读 · 1 评论 -
Word2Vec实验浅尝
word2vec环境这里我使用python中的包gensim,该包封装了word2vec及其优化。实验环境为 Win10+python3.9+pycharm这里的下载过程直接使用pip,打开cmd,进入pip所在的Scripts位置,输入pip3 install gensim由于默认下载网址是国外网址,这里建议将源地址改成清华镜像,具体方法见https://blog.csdn.net/wo334499/article/details/72832552所用数据集用来训练的数据集是从维基百科原创 2020-11-23 11:46:25 · 436 阅读 · 0 评论 -
Jieba分词作业记录
Jieba特点支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。支持繁体分词支持自定义词典MIT 授权协议安装说明代码对 Python 2/3 均兼容全自动安装:easy_install jieba 或者 pip install jieba / pip3 install jieba半自动安装:先下载原创 2020-11-21 21:48:35 · 183 阅读 · 0 评论 -
word2vec的简单理解 小白初学
在自然语言处理领域中,本文向量化是文本表示的一种重要方式。在当前阶段,对文本的大部分研究都是通过词向量化实现的,但同时也有一部分研究将句子作为文本处理的基本单元,也就是doc2vec和str2vec技术。word2vec简介大家很熟悉的词袋(bag of words)模型是最早的以词语为基本处理单元的文本向量化算法,所谓的词袋模型就是借助于词典把文本转化为一组向量,下面是两个简单的文本示例:john likes to watch movies, mary likes too.john also原创 2020-11-21 21:22:54 · 390 阅读 · 0 评论 -
基于Python的简单爬虫
PyThon简单爬虫该程序第一部分对新浪上网页链接进行爬取,第二部分对京东上指定页面的图片进行爬取 import reimport urllib.requestdef getlink(url):#设置请求头 headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X Me原创 2020-11-13 20:20:28 · 173 阅读 · 0 评论