1.4 数据处理与可视化

数据的导入和内存管理
1.数据表文件的读取
由于现在大多数系统内存都在几个G,因此小点的数据表处理比较简单,可以直接读入内存并结构化
下面例子是用python读取数据表文件,并将其存到矩阵中,并输出矩阵的行、列数
# -*- coding: utf-8 -*-

import sys
import os
from numpy import *

# 配置utf-8输出环境
reload(sys)
sys.setdefaultencoding('utf-8')

#数据文件转矩阵
# path: 数据文件路径
# delimiter: 文件分隔符
def file2matrix(path,delimiter):
    recordlist = []
    fp = open(path,"rb")     # 读取文件内容
    content = fp.read()
    fp.close()
    rowlist = content.splitlines()     # 按行转换为一维表
    # 逐行遍历
    # 结果按分隔符分割为行向量
    recordlist =[ row.split(delimiter) for row in rowlist if row.strip()]
    return mat(recordlist)    # 返回转换后的矩阵形式

root = "testdata" #数据文件所在路径
pathlist = os.listdir(root) # 获取路径下所有数据文件
for path in pathlist:
    recordmat = file2matrix(root+"/"+
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
鸢尾花数据集是机器学习领域中非常经典的一个数据集,包含150条记录,每条记录有4个特征,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度,以及它们所属的3个类别之一:Setosa、Versicolour、Virginica。 我们可以使用ECharts来对这个数据集进行可视化分析,具体步骤如下: 1.准备数据 首先,我们需要将鸢尾花数据集导入到程序中,并进行处理。可以使用Python的pandas库来读取CSV文件,然后将数据转换成ECharts需要的格式。 2.绘制散点图 使用ECharts的散点图功能,将每个样本点绘制在坐标系上。可以根据鸢尾花的类别,将不同类别的样本点用不同的颜色表示。 3.添加坐标轴和图例 通过设置xAxis、yAxis和legend等属性,添加坐标轴和图例,使得图表更加清晰易懂。 4.添加工具箱 使用ECharts的工具箱功能,可以为图表添加一些交互式的工具,如缩放、刷新、保存等。 以下是一份基于ECharts的鸢尾花数据可视化代码示例: ```javascript // 基于ECharts的鸢尾花数据可视化 // 导入数据 var data = [ [5.1, 3.5, 1.4, 0.2, 'Setosa'], [4.9, 3.0, 1.4, 0.2, 'Setosa'], [4.7, 3.2, 1.3, 0.2, 'Setosa'], [4.6, 3.1, 1.5, 0.2, 'Setosa'], ... ]; // 转换数据格式 var series = []; for (var i = 0; i < data.length; i++) { var item = { value: [data[i][0], data[i][1], data[i][2], data[i][3]], symbol: 'circle', symbolSize: 10, itemStyle: { color: data[i][4] === 'Setosa' ? 'red' : data[i][4] === 'Versicolour' ? 'green' : 'blue' } }; series.push(item); } // 绘制图表 var myChart = echarts.init(document.getElementById('main')); myChart.setOption({ title: { text: '鸢尾花数据可视化' }, tooltip: {}, legend: { data: ['Setosa', 'Versicolour', 'Virginica'] }, xAxis: {}, yAxis: {}, series: [{ name: 'Setosa', type: 'scatter', data: series.filter(function(item) { return item.itemStyle.color === 'red'; }) }, { name: 'Versicolour', type: 'scatter', data: series.filter(function(item) { return item.itemStyle.color === 'green'; }) }, { name: 'Virginica', type: 'scatter', data: series.filter(function(item) { return item.itemStyle.color === 'blue'; }) }], toolbox: { feature: { saveAsImage: {} } } }); ``` 这份代码将鸢尾花数据集中的四个特征绘制在坐标系上,不同类别的样本点用不同的颜色表示,图表中还包含了图例和工具箱。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值