背景:
在绘制散点图时,有时候会因为散点太多,导致散点图很杂乱。在参考知乎文章https://zhuanlan.zhihu.com/p/245185626后觉得这种处理思路不错。MATLAB也有binscatter函数,但是我感觉可能存在以下问题:
1. 画出来的严格意义上并不是散点,而是一种类似热力图的图种;
2. bin的大小固定且相等,不能根据数据本身进行调整。
PS:当然,以上两个问题可能都是因为我自己不会调><
因此尝试采用MATLAB编写了预处理函数,代码如下:
function [new_x,new_y] = group_classify(x,y,group_num,method)
if (~exist('method','var'))
method = 'linear' ;
end
if strcmp(method,'linear')
xx=linspace(min(x),max(x),group_num+1);
%如果group_num=1,则xx长度为2(group_num+1)
for i = 1 : group_num
index = find(x>=xx(i)&x<xx(i+1));
new_x(i) = nanmean(x(index));
new_y(i) = nanmean(y(index));
end
end
if strcmp(method,'equal')
N=length(y);
each_num = fix(N/group_num);
for i = 1 : group_num
new_x(i) = nanmean(x(each_num*(i-1)+1:each_num*i));
new_y(i) = nanmean(y(each_num*(i-1)+1:each_num*i));
end
end
end
各参数意义如下:
输出部分:
new_x : 处理后的x坐标数据
new_y : 处理后的y坐标数据
输入部分:
x:原始x坐标数据
y:原始y坐标数据
group_num:想要得到的数据长度
method:分组方法,
'linear'表示对x进行等间距分组,
'equal'表示对原始数据长度进行等间距分组
举个例子:
原始散点图:
采用linear:
采用equal:
两个group_num都是50。大家觉得结果怎么样呢?