既是0也是1的寻道书生

诸天炁荡荡,我道日兴隆。

电商产品评论的数据情感分析python代码实现

步骤1:从爬取的数据中提取对应的评论信息 #-*- coding: utf-8 -*- import pandas as pd inputfile = '.../huizong.csv' #评论汇总文件 outputfile = '.../meidi_jd.txt' #评论提取后保存路径 dat...

2018-10-04 10:36:01

阅读数 1732

评论数 8

电商产品评论数据情感分析

背景与挖掘目标 在这种电商平台激烈竟争的大背景下除了提高商品质量、压低商品价格之外,了解更多消费者的心声对于电商平台来说也变得越来越有必用,其中非常重要的方式就是对消费者的文本评论数据进行内在信息的数据挖掘分析。 对某平台的热水器评沦进行文本挖掘分析本次数据挖掘建模目标如下: 分析某一品牌热水器...

2018-10-04 09:48:59

阅读数 4180

评论数 1

数据分析之数据预处理

数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 数据清洗 数据清洗主要是删除原始数据集的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等. 缺失值处理 处理缺失值的方法可分为3类: 删除记录 数据插补 不处理 如果存在大量缺失的列,可以采用删...

2018-10-04 09:26:03

阅读数 500

评论数 0

数据分析之数据探索

数据探索 解决的问题: 样本数据集的数量和质量是否满足模型构建的要求? 是否出现从未设想过的数据状态? 其中有没有么明显的规律和趋势? 各因素之间有什么样的关联性? 数据质量分析: 对缺失值、异常值、不一致值、重复数据及其含有特殊符号的数据 缺失值分析: 产生的原因: 有些信息暂时无法获取,...

2018-10-03 22:52:43

阅读数 165

评论数 0

python基础库之Pandas

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- from pandas import Series,DataFrame import pandas as pd import nump...

2018-09-09 19:37:22

阅读数 120

评论数 0

python基础库之Numpy

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np # 一维数组 a = np.arange(100) print(a) print(a.dty...

2018-09-09 17:38:35

阅读数 109

评论数 0

机器学习之特征工程

1、特征工程是什么 特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。从数学的角度来看,特征工程就是人工地去设计输入变量X。 其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法...

2018-08-05 15:32:18

阅读数 159

评论数 0

机器学习解决问题的流程

了解场景和目标 对要解决的问题做具体分析,理解业务场景,这种场景中的常用模型。 了解评估准则 最终的目标是从准确率还是召回率方向(打个比方)做为模型的评估标准 认识数据 了解数据是否平衡,类型,结构,关联关系 数据预处理(清洗,调权) 类型转化,缺失值处理,标准化或者归一化,one-hot ...

2018-08-05 11:10:33

阅读数 119

评论数 0

机器学习房价预测模改进

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import pandas as pd import matplotlib.pyplot as...

2018-08-05 00:07:25

阅读数 313

评论数 0

机器学习简单房价预测模型

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import pandas as pd train_df = pd.read_csv('D:/...

2018-08-04 17:45:38

阅读数 1103

评论数 0

机器学习模型评估、选择与验证

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from sklearn.metrics import zero_one_loss # 0-1损失函数 y_true = [1,1,1,1,1,0,0,0,0,0] y_pred = [0,0,0,1,1,1,1,...

2018-07-29 10:09:05

阅读数 228

评论数 0

机器学习数据预处理

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from sklearn.preprocessing import Binarizer #二元化 X = [ [1,2,3,4,5], [5,4,3,2,1], [3,3,3,3,3],...

2018-07-29 09:48:33

阅读数 126

评论数 0

python 集成学习 RandomForestClassifier,RandomForestRegressor 模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 23:18:39

阅读数 625

评论数 0

python 集成学习 GradientBoostingClassifier,GradientBoostingRegressor 模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 22:55:55

阅读数 1637

评论数 0

python 集成学习 AdaBoostClassifier,AdaBoostRegressor模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 22:23:29

阅读数 640

评论数 0

python 多层神经网络与线性不可分数据

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from matplotlib import pyplot as plt from mpl_toolkits.mplot3d import Axes3D import numpy as np from sklearn ...

2018-07-08 11:43:09

阅读数 178

评论数 0

python 人工神经网络模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from matplotlib import pyplot as plt from mpl_toolkits.mplot3d import Axes3D import numpy as np from sklearn....

2018-07-08 11:36:10

阅读数 266

评论数 0

python SVM 非线性分类模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,cross_validati...

2018-07-08 10:57:33

阅读数 792

评论数 0

python SVM 线性分类模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 导入对应的包和数据 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,cros...

2018-07-08 10:42:57

阅读数 969

评论数 0

python 聚类与EM算法模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets.samples_generator import make_blob...

2018-07-08 10:08:12

阅读数 552

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭