Python3数据分析与挖掘建模实战

本文介绍了Python3进行数据分析的基本流程,包括数据预处理、模型构建和评估。涉及的库有Numpy、Pandas、Scikit-Learn、Keras、Gensim等。文章详细讲解了数据清洗、异常值处理、分布分析、相关性分析,以及协同过滤算法在推荐系统中的应用。同时,提到了文本情感分析和商圈聚类模型的构建方法。
摘要由CSDN通过智能技术生成

Python数据分析简介
Python入门

运行:cmd下"python hello.py"

基本命令:
在这里插入图片描述
在这里插入图片描述
第三方库
安装
Windows中
pip install numpy
或者下载源代码安装
python setup.py install
Pandas默认安装不能读写Excel文件,需要安装xlrd和xlwt库才能支持excel的读写
pip install xlrd
pip install xlwt

StatModel可pip可exe安装,注意,此库依赖于Pandas和patsy

Scikit-Learn是机器学习相关的库,但是不包含人工神经网络

model.fit() #训练模型,监督模型fit(X,y),非监督模型fit(X)

监督模型接口

model.predict(X_new) #预测新样本
model.predict_proba(X_new) #预测概率
model.score() #得分越高,fit越好

非监督模型接口

model.transform() #从数据中学到新的“基空间”
model.fit_transform() #从数据中学到新的基,并按照这组基进行转换

Keras是

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值