- 博客(6)
- 收藏
- 关注
原创 电商产品评论数据情感分析
#!/usr/bin/env python # coding: utf-8 # # —— 基于电商产品评论数据情感分析 —— # ### 1.案例简介 # # 1、利用文本挖掘技术,对碎片化、非结构化的电商网站评论数据进行清洗与处理,转化为结构化数据。 # 2、参考知网发布的情感分析用词语集,统计评论数据的正负情感指数,然后进行情感分析,通过词云图直观查看正负评论的关键词。 # 3、比较“机器挖掘的正负情感”与“人工打标签的正负情感”,精度达到88%。 # 4、采.
2022-05-28 11:53:13 882 1
原创 房屋价格预测
import pandas as pd import matplotlib.pyplot as plt import numpy as np # 读取数据 train = pd.read_csv('train(1).csv') test = pd.read_csv('test(1).csv') print(train.shape) print(test.shape) # 查看数据类型和描述 print(train.info()) print(train.describe()) # 统计每列Null的...
2022-04-21 15:40:42 1064
原创 一元线性回归梯度下降算法
# 思想:使损失函数MSE最小,拟合出的函数越准确 # 案例:假设你是一家餐厅的老板,考虑开一家分店,根据该城市的人口预测利润 import pandas as pd import numpy as np df = pd.read_csv('data.txt', header=None) print(df) # 取所有的人口转成数组 x = np.array(df.iloc[:, 0]) # 取所有的利润转成数组 y = np.array(df.iloc[:, 1]) # print(y) # 样...
2022-04-21 14:54:42 245
原创 泰坦尼克号乘客获救预测
import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.model_selectio...
2022-04-21 14:31:31 1695
原创 喜好程度预测
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.neighbors import KNeighborsClassifier df = pd.read_csv('datatest.csv', names=['出行', '游戏时间', '冰激凌', '配对结果']) print(df)...
2022-04-21 13:47:54 1473
原创 电商经销商年度消费业务分析实验报告
实验概述 实验目标和主要内容 实验目标:练习掌握数据预处理; 练习掌握模型训练; 练习掌握聚类分析。 开发平台:PyCharm Community Edition 2021.3.2 x64 语言:Python 主要内容: 根据电商经销商年度消费业务的数据,通过K-means聚类算法,对数据集进行训练,进行无监督学习,将消费者进行分类。 实验设计 关键算法分析 算法1:加载数据 主要代码: 算法2:数据探索 根据数据分布,对新鲜产品的年度支出、奶制品上的消费、...
2022-04-21 11:27:13 2128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人