自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于电商产品评论数据情感分析

#!/usr/bin/env python# coding: utf-8# # —— 基于电商产品评论数据情感分析 ——# ### 1.案例简介# # 1、利用文本挖掘技术,对碎片化、非结构化的电商网站评论数据进行清洗与处理,转化为结构化数据。# 2、参考知网发布的情感分析用词语集,统计评论数据的正负情感指数,然后进行情感分析,通过词云图直观查看正负评论的关键词。# 3、比较“机器挖掘的正负情感”与“人工打标签的正负情感”,精度达到88%。# 4、采.

2022-05-27 17:47:14 2661 10

原创 实验1:MapReduce课程实验

1.使用Tool工具类实现Mapreduce :WordCountTool方法package mapreduce;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;import org.apache.hadoop.fs.FSDataInputStream;import org.apache.hadoop.fs.FileStatus;import org.apache.ha

2022-04-18 20:39:14 1896

原创 电商经销商年度消费业务分析实验报告(源代码)

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.preprocessing import LabelEncoderfrom sklearn.preprocessing import Normalizerfrom sklearn.cluster import KMeansfrom sklearn.metrics import silhoue.

2022-04-18 19:42:15 254

原创 实验四房屋价格预测(源代码)

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 读取数据train = pd.read_csv('train.csv')test = pd.read_csv('test.csv')print(train.shape)print(test.shape)# 查看数据类型和描述print(train.info())print(train.describe())# 统计每列Null的占比print.

2022-04-12 21:36:27 532

原创 实验三一元线性回归梯度下降算法(源代码)

# 思想:使损失函数MSE最小,拟合出的函数越准确# 案例:假设你是一家餐厅的老板,考虑开一家分店,根据该城市的人口预测利润import pandas as pdimport numpy as npdf = pd.read_csv('data.txt', header=None)print(df)# 取所有的人口转成数组x = np.array(df.iloc[:, 0])# print(x)# 取所有的利润转成数组y = np.array(df.iloc[:, 1])# pri.

2022-04-12 17:26:31 1514

原创 实验二泰坦尼克号乘客获救预测(源代码)

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelEncoderfrom sklearn.model_selection import train_test_splitfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection .

2022-04-01 22:30:26 409

原创 实验一喜好程度预测(源代码)

import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierdf = pd.read_csv('datatest.csv', names=['出行', '游戏时间', '冰激凌', '配对结果'])print(df)#.

2022-03-23 16:22:15 1761

实验1喜好程度预测源代码

实验1喜好程度预测源代码

2022-03-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除