近日碰到一个奇怪的 bug。handler 处理消息,message.obj 赋值的是一个byte 数组,在处理消息的过程中这个 byte数组神奇的变化了数据内容。当时也没考虑到多线程问题,特此记录下。
事件起因
先看代码,代码如下
private volatile boolean isReadRun;
//第一个线程,Read线程
private Runnable readRun = new Runnable() {
@Override
public void run() {
Logs.d(TAG, "run: readRun--------");
isReadRun = true;
try {
datagramSocket = new DatagramSocket(port);
byte[] data = new byte[128];
DatagramPacket packet = new DatagramPacket(data, data.length);
while (datagramSocket != null && !datagramSocket.isClosed()) {
datagramSocket.receive(packet);
splitFrame(data, data.length);
isReadRun = true;
}
} catch (IOException e) {
e.printStackTrace();
} finally {
if (datagramSocket != null) datagramSocket.close();
isReadRun = false;
if (!handler.hasMessages(TRY_RECONNECT_MSG_ID)) {
handler.sendEmptyMessageDelayed(TRY_RECONNECT_MSG_ID, 1000);
}
}
}
};
@Override
public void splitFrame(byte[] frame, int readLen) {
dispatcher.dispatcher(frame);
}
@Override
public void dispatcher(byte[] frame) {
Message message = Message.obtain();
message.obj = frame;
handler.sendMessage(message);
}
//第二个线程,Dispatcher线程处理消息的 handler
private Handler handler = new Handler(LooperFactory.getInstance().getDispatcherLooper()) {
@Override
public void handleMessage(Message msg) {
byte[] frame = (byte[]) msg.obj;
Logs.d(TAG, "handleMessage: frame=="+ByteUtil.byte2hex(frame));
}
};
一个线程循环接受 UDP Socket 广播数据,接收到数据后,通过Handler发送给Dispatcher 线程处理。在 Dispatcher 线程处理的过程中 frame 数据内容有较低的概率突然变成另外一组数据。关键是把 “handleMessage: frame==” 这行log去掉,数据就不会变化,神奇。。刚开始以为是 ByteUtil.byte2hex 这个方法有问题,仔细看代码后发现问题不在这里。
最终原因在 byte[] data = new byte[128] 这一行,这个 data 是一直贯穿到 Dispatcher 线程的 frame 。过程: data --> splitFrame() --> dispatcher() ->handler.sendMessage->handleMessage ->frame ,所以 Dispatcher 线程 的frame 和 Read 线程的 data 都是指向同一个地址,也就是说两个线程里的数组引用同时指向一个相同的地址,其中一个线程改变了地址里的值,另外一个线程获取数据时也会改变。
修改
在 splitFrame 方法里copy 一下数据完美解决。
@Override
public void splitFrame(byte[] frame, int readLen) {
byte [] data = new byte[frame.length];
System.arraycopy(frame,0,data,0,frame.length);
dispatcher.dispatcher(data);
}
总结
- 在一个线程里,数据莫名其妙的改变了,大概率是多线程导致
- 添加log 和 删除log 对数据莫名其妙的改变有影响的情况,大概率多线程导致