笔记
文章平均质量分 92
biyezuopinvip
biyezuopinvvp
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于Python的宋词生成器
高楼处在高处,后面的文本也体现了“高”的特色,“高楼望街”是一番意境,“高楼望夜”又是另一番意境,最后出了一个“俯看五色”,一个“俯”字,也是体现了居高临下,整篇文本无不围绕“高”的主题。这么做的目的就是告诉神经网络,如果前面是“看山”,后面跟一个词语是“不是”。当前面变成“看山 不是 山 , 看山”时,这时“看山”后面就变成“又是”了。这里要重点说明一下,因为要做文本预测的训练,需要从上面的词语推断出下面的词语,所以这里做了一些加工。我找到了一个宋词数据集,是一个csv格式的文件,里面有2万首宋词。原创 2022-01-18 11:05:10 · 4805 阅读 · 0 评论 -
基于Python的对网络评论情感分析:主题与情感词抽取
从数据示例看,数据集只提供了角度词(aspectTerm)的抽取结果,没有情感词的抽取结果,训练加测试数据总共3841条,需要人工标注情感词结果(WTF…问题抽象:其实可以看作一个类似于分词问题的 “序列标注” 问题,如下图所示,给出分词后的输入序列,输出两个同等长度的 BIO 序列,一个作为角度词抽取的输出序列结果,一个作为情感词抽取的输出序列结果,这里 BIO 标记为序列标注问题的惯用标记法,“B” 即为欲标记的目标内容的开始词,“I” 为欲标记内容的中间词(或结尾词),“O” 为不标记的内容。原创 2022-01-18 11:04:58 · 3580 阅读 · 0 评论 -
基于Python的股市市场情绪分析
本文介绍了股市情感分析项目,通过分析投资者情绪与股市走势的关系来辅助投资决策。项目包含标注语料分析、指标构建和模型测试三部分,提供了机器学习与深度学习两种文本分类模型。研究结果显示,看涨情绪指标与股市走势存在一定关联性。作者分享了包含股评文本和指数数据的数据集,并提供了源码下载地址,便于复现研究成果。该项目为非有效市场中的投资决策提供了情绪分析参考。原创 2022-01-18 11:04:31 · 5551 阅读 · 0 评论 -
基于Python的卷积神经网络(CNN)识别MNIST数据集
深度学习发展迅速,MNIST手写数字数据集作为机器学习早期的数据集已经被公认为是机器学习界的果蝇实验(Hinton某年),卷积神经网络是识别图像非常有效的一种架构,于是用CNN识别手写数字也就成为了机器学习界的经典实验。在这个repo中我会呈现最基本的CNN识别MNIST数据集过程。载入数据看看数据啥样儿(也即Visualization)建立模型训练模型测试模型(看看训练的好不好)原创 2022-01-16 01:09:46 · 4811 阅读 · 0 评论 -
基于Jupiter Notebook的回归、分类和聚类可视化分析
本次设计在 Jupiter Notebook 上通过 scikit-learn 对两个数据集分别实现了:1、回归(Air quality dataset):逻辑回归;3、聚类(BLE&RSSI dataset):DBScan、kmeans、GMM、层次聚类算法(其中聚类算法以 t-SNE 实现了结果可视化)。表内数据存在一些值为-200 的缺失值,为了回归的准确性,采用去除含缺失值数据项的方法。代码路径:./BLE_RSSI_dataset/BR_2_classification.ipynb。原创 2022-01-13 01:35:14 · 3543 阅读 · 0 评论 -
基于Python的深度神经网络的中文期刊分类系统
数据文件下载好放入 2_word2vec 中模型文件下载好放入 2_word2vec 中。原创 2022-01-13 01:35:03 · 849 阅读 · 0 评论 -
基于Python的循环神经网络股票价格预测
本文介绍了基于LSTM神经网络的股票价格预测方法。首先使用Tushare获取股票日K数据,选取开盘价、最高价等9个特征进行标准化处理,并生成30天时间序列用于预测第31天的价格。神经网络采用单层LSTM结构,输入维度为9,输出4个价格指标。实验结果显示模型在训练集和测试集上均能较好拟合,中长线趋势预测准确,短线存在一定误差。文章提供了完整的代码下载链接和数据预处理、模型构建的详细说明。原创 2022-01-13 01:34:43 · 6275 阅读 · 0 评论
分享