![](https://img-blog.csdnimg.cn/20190927151117521.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
3.大数据理论课
国民小跟班
喜欢总结、极简主义、观点分享、懒人懒办法系列
展开
-
大数据理论课(第十节-----表格关键数据分类和无关数据剔除)
一、数据关键信息提取分类统计import pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.cluster import KMeansdata=pd.read_csv(r"G:\大数据实验数据库\3.大数据实验数据\credit_card.csv",sep=",",encoding="G...原创 2019-12-10 20:14:02 · 219 阅读 · 0 评论 -
大数据第9节课(课后习题)
实训3:构建基于wine数据集的SVM模型import pandas as pdimport numpy as npfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.svm import SVC#1.读取数据wine=pd.read_csv(r"G:\大数据实验数据库\3.大数据实验数据\wine.csv",enco...原创 2019-12-05 11:29:24 · 811 阅读 · 0 评论 -
大数据理论课(第九节----复习布尔序列、学习svm模型)
一、复习 关于 布尔序列 在数据清洗中的应用P150import numpy as npimport pandas as pddetail=pd.read_csv(r"G:\大数据实验数据库\3.大数据实验数据\detail.csv",encoding="GB18030")ser1=detail["counts"]x1=ser1.mean()-3*ser1.std()>ser1...原创 2019-12-03 22:07:29 · 184 阅读 · 0 评论 -
大数据理论课(第八节----机械学习和KMean的使用)
一、机械学习1、数据读取from sklearn.datasets import load_breast_cancercancer=load_breast_cancer() #导入数据cancer.feature_names #患病者所有的属性cancer_data=cancer.datacancer_target=cancer.target p...原创 2019-11-28 22:18:36 · 259 阅读 · 0 评论 -
大数据理论课(第七节----数据补充、异常处理、数据标准化、哑变量处理、数据离散)
一、数据插入(1)数据补充import numpy as npimport pandas as pdfrom scipy.interpolate import interp1dfrom scipy.interpolate import lagrange#一、插入数据#1.构造拉格朗日函数x=[1,2,3,4,5,7,8]y=[5,6,8,9,19,20,22]lvl=lag...原创 2019-11-19 21:28:36 · 467 阅读 · 0 评论 -
大数据理论课(第六节-----pandas对DataFrame表格的切割、合并、去重)
一、表格创建的几种方法import pandas as pdimport numpy as np#1.pd.read_csv方法data=pd.read_csv(r"G:\大数据实验数据库\3.大数据实验数据\meal_order_info.csv",encoding="GBK")#2.pd.read_sql_table方法import sqlalchemyconn=sqlalc...原创 2019-11-13 09:54:37 · 653 阅读 · 0 评论 -
大数据理论课(第五节----TCP通讯和pandas模块的使用)
# 1.客户端import threadingimport socket#接收方法def recvmsg(sock): while 1: try: data=sock.recv(1024) print(data.decode("UTF-8")) #保证发送不为空 if(d...原创 2019-11-08 16:18:45 · 194 阅读 · 0 评论 -
大数据理论课(第四节----pandas操作数据库数据)
from sqlalchemy import create_engine import pandas as pd#一.读取数据-------------------------------------------------------------------------------detail=create_engine("sqlite:///G:/大数据实验数据库/0.engine数...原创 2019-11-03 22:01:06 · 560 阅读 · 0 评论 -
大数据理论课(第三节----菜单栏制作+直方图绘制+pandas的使用)
一、如何创建菜单栏import socketimport threadingimport tkinter as tkimport tkinter.messageboximport tkinter.scrolledtextimport tkinter.filedialogfrom tkinter import *#-----------------一、创建窗口----------...原创 2019-10-22 20:28:44 · 267 阅读 · 0 评论 -
大数据理论课(第二节----Matplotlib的用法)
一.绘制基本图1.Matplotlib构图方法import numpy as npimport matplotlib.pyplot as plt# %matplotlib inline #含义:将matplotlib绘制的图显示在页面里而不是弹出一个窗口#注释plt.title("函数图像") #标题plt.xlabel("变量x") #定义x坐标名称plt.yla...原创 2019-10-15 21:12:19 · 179 阅读 · 0 评论 -
大数据理论课(第一节----Numpy的用法)
1. 矩阵的创建及与传统数组的比较import numpy as npal=np.array([1,2,3,4,90,100])x=[1,2,3,4,90,100]print(al)print(x)2. 矩阵的规格、类型相关的函数介绍al.shape 查看当前是几行几列的矩阵al.reshape(x,y) 将矩阵变成x行y列的矩阵al.dtype() ...原创 2019-10-09 19:46:11 · 400 阅读 · 0 评论