- 博客(11)
- 资源 (5)
- 收藏
- 关注
原创 调试arima笔记
但是现实中的场景确实是,老版本的用的多,如果坚持用新版本,那么要改动很多东西,像我这种对arima不太熟悉的,蛋疼!就像你要改装车,缺完全不知道内部结构,那怎么办?最好的方法就是:重新安装旧版本,先把代码跑起来!
2023-08-27 11:27:33 87
原创 创建虚拟环境命令
如果指定numpy版本,可以用pip install numpy==1.24。创建好之后激活虚拟环境:activate python38。然后安装各种包:pip install numpy。如何查看已经安装包的版本呢?
2023-08-27 10:50:59 71
原创 lgb
在这里插入import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.linear_model import LogisticRegressionfrom sklea...
2019-04-13 21:37:26 369
原创 任务4自然语言处理
文章目录一. 概念介绍1.词袋模型(Bag of Words)2.停用词(Stop Words)3.TF-IDF模型3.1 词频(TF)3.2 逆文档频率(Inverse Document Frequency)3.3 TF-IDF4. 中文分词二. 中文文本挖掘预处理流程1. 特点2. 数据收集3. 中文分词4. 引入停用词5. 特征处理6. 建立分析模型一. 概念...
2019-04-13 21:34:04 198
原创 LR与SVM 简单应用
LR与svm 简单应用 算法定义 基本实践算法定义LR算法逻辑回归logistic回归是一个分类算法,是一种广义的线性回归分析模型,它常用处理处理二元分类以及多元分类问题逻辑回归问题的起点:线性回归模型是表征了输出向量Y和输入样本矩阵x之间的线性关系,其线性关系的参数为θ,此时模型的预测是的值域为(-∞,+∞),并且我假设y 是连续的。如果最终我们需要y 的结果...
2019-04-11 21:04:38 233
原创 自然语言处理——任务3
文章目录1. 分词1.1 分词概念1.2 词、字符频率统计2. unigram、bigram、trigram2.1 语言模型中unigram、bigram、trigram的概念2.2 unigram、bigram频率统计;(可以使用Python中的collections.Counter模块,也可以自己寻找其他好用的库)3. 文本矩阵化:要求采用词袋模型且是词级别的矩阵化3.1 分...
2019-04-11 21:00:22 332
原创 自然语言处理 第二期
【任务2 - 数据集下载探索模块:IMDB数据集(英文)和THUCNews数据集(中文)】时长:2天1. 数据集数据集:中、英文数据集各一份THUCNews中文数据集:https://pan.baidu.com/s/1hugrfRu 密码:qfudIMDB英文数据集: [IMDB数据集 Sentiment Analysis](http://ai.stanford.edu/~amaa...
2019-04-10 16:29:39 409
原创 自然语言处理
任务:Anaconda 安装Conda 学习Python编辑器安装与学习: jupyter notebook 或者 pycharmTensorflow 库安装与学习一、什么是Anaconda?1. 简介Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。...
2019-04-07 19:29:58 92
原创 原 任务1-数据初始
首先明确任务:建立模型通过长文本数据正文(article),预测文本对应的类别(class)确定好任务之后我们先对数据进行读取,DataFrames的head()方法,看看数据的前五行是如何的import sysassert sys.version_info >= (3, 5)import sklearnassert sklearn.__version__ >= "0....
2019-04-05 21:05:09 210
原创 python学习
开始的前提,默认已经搭建好anaconda环境,我使用anacodna3.7版本。1.python学习1.1print和inputprint是一个打印函数,在python2和python3中有一定的差别python2中a=5print a>>>5python3中a=5print(a)>>>5不同之处:需要加括号。2.pyhto...
2019-02-27 20:04:46 154
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人