第二章 python-pcl、open3d读取、显示pcd、bin格式点云数据
文章目录
前言
点云数据实际上就是许多组点的集合,每个点由{x,y,z}组成。当然理论上的只包含有3D坐标。
实际激光雷达获取的点云数据还会包含强度、反射率等等。但我们一般只用提取{x,y,z}来处理即可。
点云数据相比于其他传感器数据的核心优势就是在于 精准的深度信息。可惜获取具体的坐标信息。
环境
因为涉及到深度学习的应用,所以运用的整体环境是基于 python 使用pycharm编辑。
主要涉及库 python-pcl open3D mayavi numpy 等等用来处理点云数据并显示。
实际上点云的核心处理库应该是PCL 类似于图像处理中的Opencv 。后面也会有扩展。
一、点云数据类型
基于激光雷达录制的点云文件具有多种格式,如pcd、npy、ply、bin、pcap、lvx等等。
而读取点云数据也有多个库,python-pcl open3D mayavi numpy。
这里主要使用 python-pcl 和 open3D 两个核心库。
1.基于python-pcl 读取显示pcd、bin格式文件
代码如下(示例):
import numpy as np
import pcl.pcl_visualization
pt = pcl.load("D://code-python//Data//lidar//2094.799809520.pcd")
#转为数组 形如 24000 x 3
points = pt.to_array()
#但是pcl显示是要 N*4 所以要扩展一列 取一列插入数组使 N*3 变为 N*4
x = points[:,0]
points = np.insert(points,3,x,axis=1)
# 这里对第四列进行赋值,它代表颜色值,根据你自己的需要赋值即可;
points[:, 3] = 255
# PointCloud_PointXYZRGB 需要点云数据是N*4,分别表示x,y,z,RGB ,其中RGB 用一个整数表示颜色;
color_cloud = pcl.PointCloud_PointXYZRGB(points)
visual = pcl.pcl_visualization.CloudViewing()
#窗口名
visual.ShowColorCloud(color_cloud, b'sta')
flag = True
while flag:
flag != visual.WasStopped()
这里就可以成功显示 颜色是根据自己设置
下面基于 numpy 读取bin格式点云文件
import pcl.pcl_visualization
import numpy as np
# lidar_path 指定一个kitti 数据的点云bin文件就行了
#bin文件为2进制文件
lidar_path = r'D:/code-python/Data/lidar/000000.bin'
# reshape成 N*4
points = np.fromfile(lidar_path, dtype=np.float32).reshape(-1, 4)
# 在这里对第四列进行赋值,它代表颜色值,根据你自己的需要赋值即可;
points[:,3] = 255
# PointCloud_PointXYZRGB 需要点云数据是N*4,分别表示x,y,z,RGB ,其中RGB 用一个整数表示颜色;
color_cloud = pcl.PointCloud_PointXYZRGB(points)
visual = pcl.pcl_visualization.CloudViewing()
visual.ShowColorCloud(color_cloud, b'cloud')
flag = True
while flag:
flag != visual.WasStopped()
2.基于open3d 读取显示pcd格式文件
代码如下(示例):
import open3d as o3d
import numpy as np
point = o3d.io.read_point_cloud("D:/code-python/Data/lidar/000000.pcd")
o3d.visualization.draw_geometries([point])
#open3d显示的时候有个bug 要把python pycharm设置为高性能 系统显示里 图形设置
效果相对于 python-pcl的显示还是差一点,不过也挺不错。同时是可以调的,它也是一个成熟的3D处理库。有许多内置的处理函数。
3.解析pcap格式点云文件并通过python-pcl显示
这里参考一位大佬的代码:
作者:lonlon ago
https://zhuanlan.zhihu.com/p/158621756
代码如下:
# -*- coding: UTF-8 -*-
import dpkt
import collections # 有序字典需要的模块
import time
import numpy as np
import struct
# 安装了pcl , 可以使用它来进行可视化
import pcl.pcl_visualization
viewer = pcl.pcl_visualization.PCLVisualizering()#初始化一个对象
viewer.SetBackgroundColor(0, 0, 0) #颜色
viewer.AddCoordinateSystem()
viewer.InitCameraParameters()
# vlp 16 的参数
'''
https://blog.csdn.net/qq_34911636/article/details/89946329#commentBox
激光雷达每一帧的数据长度固定为1248字节,其中分别为前42字节的前数据包标识、12组数据包、4字节时间戳和最后两字节雷达型号参数。
12组数据包中前两字节为数据包的开始标识(0xFFEE)、接下去两字节为的旋转角度(当前角度)值和连续32*(2字节的距离值+1字节的激光反射强度值)字节的距离信息,
其中32*3字节分别为雷达两次获取探测信息,每个数据包开头所携带的旋转角度是指当前数据包前16*3字节对应的角度,而后16*3字节对应的旋转角度激光雷达没有直接给出,
需要通过计算前后两次旋转角度然后求取平均值获得。
1248 = 42 + 12*(2 + 2 + 32*(2+1)) + 4 + 2 =1248
雷达扫描频率为10Hz,每秒数据包在480帧左右,即每次扫描会产生48个左右的数据包,需要将分散的数据包数据合并称为一次扫描的点云数据
75个udp包产生一圈数据 vlp格式解析那篇文章 下面评论没理解 为什么是75 75*384*10 = 288000
若按照这样理解 角分辨率按照0.1度 360/0.1 = 3600 一圈转3600次 一次16个点 = 57600 10hz 1s 10圈 即 57600*10 = 576000 反正
有点乱
'''
DISTANCE_RESOLUTION = 0.002 # 距离数值分辨率 2mm转换为单位米
udp_package_num = 1
line_per_udp = 12 # 每个UDP 有多少列
point_per_udp_line = 32 # 每个UDP 的每列包含有多少个点
point_num_per_udp = point_per_udp_line * line_per_udp # 32*12=384
thetas_lines = [-15, 1, -13, 3, -11, 5, -9, 7, -7, 9, -5, 11, -3, 13, -1, 15] #垂直角度w代表值
thetas_point = thetas_lines * 2 * line_per_udp * udp_package_num #感觉是嵌套列表 列表乘以一个数字 [[x],[x],[x]...]
thetas_point = np.radians(thetas_point) #角度从度转为弧度 thetas_point为输入的角度 它返回一个数组, 其中包含输入数组中给定度数的等效弧度角。
thetas_point_cos = np.cos(thetas_point) #cos弧度
thetas_point_sin = np.sin(thetas_point) #sin弧度
data_fmt = '<' + (('H' + 'H' + 'HB' * point_per_udp_line) * line_per_udp + 'IH') * udp_package_num
base_range = np.array(range(2, point_per_udp_line*2+1, 2)) # 32, 距离值的基础索引
#range (start,stop,step) range(2,65,2) 32个数
angle_base_range = np.array([1])
d_range = []
r_range = []
angle_range = []
k = 0
data_gap = 2 + 2*point_per_udp_line # 每一列的长度 其实是2字节标识 2字节旋转角度 32*(2字节距离,1字节反射强度)点 这里貌似只计算旋转角度+距离66
for i in range(udp_package_num):
for j in range(line_per_udp):
d_range.append(base_range + k * data_gap + i * 2) # 66 是 HH + HB*32 d.range 列表增加,多个列表嵌套
r_range.append(base_range + k * data_gap + i * 2 + 1)
angle_range.append(angle_base_range + k * data_gap + i * 2)
k += 1
d_range = np.hstack(d_range) # 多个array组成的列表
r_range = np.hstack(r_range)
angle_range = np.hstack(angle_range)
# 水平角度插值,如果有角度跳变会怎么样? 针对从360跳变到20的这部分拟合的并不是很好,误差很大;已经改正
x_index = np.arange(point_num_per_udp)
xp_index = np.arange(0, point_num_per_udp, point_per_udp_line) # array([ 0, 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352])
def unpack_udp(data):
data_tuple = struct.unpack(data_fmt, data) # 原始格式是元祖,要转array,元祖不能索引
data_unpack = np.array(data_tuple, dtype=np.int64) # np.array会多耗时15毫秒 todo 这里为什么会报错?? 可能是时间戳的数值太大了
distances = data_unpack[d_range] # 115200
refs = data_unpack[r_range] / 255
angles = data_unpack[angle_range]
angles = np.radians(angles / 100).astype(np.float32) # 除以100再弧度值
# 第一种处理角度的方式
# angles = np.tile(angles, (32, 1)).flatten('F') # 因为angle只有1个,数据有32个,需要复制32次
# 第二种方式
angles_interp = np.interp(x_index, xp_index, angles).astype(np.float32)
if angles[0] > angles[-1]: # 出现了角度的转折点
# replace_angle = np.linspace(0,20,32) # 针对从360跳变到20 的角度替换
change_index = np.argmax(angles)
replace_index = change_index * 32 + 1
interp_num_2 = int(angles[change_index+1]*32/40) # 每个UDP数据包之间的角度间隔为 40,每个包有32条线;
interp_num_1 = 32 - interp_num_2
replace_angle_1 = np.linspace(angles[change_index], 35999, interp_num_1) # 针对从360跳变到 20 的角度替换
replace_angle_2 = np.linspace(0, angles[change_index+1], interp_num_2) # 针对从360跳变到 20 的角度替换
angles_interp[replace_index:(replace_index+interp_num_1)] = replace_angle_1
angles_interp[(replace_index+interp_num_1):(replace_index+32)] = replace_angle_2
distances = distances * DISTANCE_RESOLUTION
x = distances * thetas_point_cos * np.sin(angles_interp)
y = distances * thetas_point_cos * np.cos(angles_interp)
z = distances * thetas_point_sin
raw_points = np.stack((x, y, z), axis=1).astype(np.float32)
# raw_points = np.stack((distances, angles_interp, refs, ), axis=1) # 也可以只要原始数据
print(type(x))
print(len(x)) #384一组 每个udp384一组
#print(x)
return raw_points
def main(file_path):
# f = open(file_path) # 此写法为python2之下,
f = open(file_path, mode='rb') #python3
try:
pcap = dpkt.pcap.Reader(f) # 先按.pcap格式解析,若解析不了,则按pcapng格式解析
except:
print("it is not pcap ... format, pcapng format...")
pcap = dpkt.pcapng.Reader(f)
# 接下来就可以对pcap做进一步解析了,记住在使用结束后最好使用f.close()关掉打开的文件,虽然程序运行结束后,
# 系统会自己关掉,但是养成好习惯是必不可少的。当前变量pcap中是按照“间戳:单包”的格式存储着各个单包
# 将时间戳和包数据分开,一层一层解析,其中ts是时间戳,buf存放对应的包
all_pcap_data = collections.OrderedDict() # 有序字典
# all_pcap_data_hex = collections.OrderedDict() # 有序字典,存十六进制形式
cir_point = []
i = 1
for (ts, buf) in pcap:
try:
eth = dpkt.ethernet.Ethernet(buf) # 解包,物理层
if not isinstance(eth.data, dpkt.ip.IP): # 解包,网络层,判断网络层是否存在,
continue
ip = eth.data
# if not isinstance(ip.data, dpkt.tcp.TCP): # 解包,判断传输层协议是否是TCP,即当你只需要TCP时,可用来过滤
# continue
if not isinstance(ip.data, dpkt.udp.UDP):#解包,判断传输层协议是否是UDP
continue
transf_data = ip.data # 传输层负载数据,基本上分析流量的人都是分析这部分数据,即应用层负载流量
if not len(transf_data.data): # 如果应用层负载长度为0,即该包为单纯的tcp包,没有负载,则丢弃
continue
if len( transf_data.data) != 1206: # 长度过滤 todo 为什么会有512字节的数据
continue
all_pcap_data[ts] = transf_data.data # 将时间戳与应用层负载按字典形式有序放入字典中,方便后续分析.
points = unpack_udp(transf_data.data)
if i % 76 != 0: # vlp16 每75个UDP数据包形成一圈数据
cir_point.append(points)
else:
cir_udp = np.vstack(cir_point)
print(cir_udp.shape) # 最后需要的一圈完整的点云数据 只包含了28000余个xyz坐标
cloud_all = pcl.PointCloud(cir_udp[:, 0:3].astype(np.float32)) # 可视化
viewer.AddPointCloud(cloud_all)
viewer.SpinOnce(100)
viewer.RemoveAllPointClouds(0)
cir_point = []
i += 1
except Exception as err:
print( "[error] %s" % err)
f.close()
if __name__ == '__main__':
#file_path="D:xxxxxx.pcap"
file_path = "2020-10-21-10-13-57_Velodyne-VLP-16-Data.pcap"
main(file_path)
这里其实都是数据格式解析,要知道怎么样的数据格式,用什么方式能够更好的解析。
当然好的工具使用起来也是很舒服,感谢开发这些库的大佬们。
总结
本文仅仅简单介绍了基于python的不同类型点云数据读取、显示方法,这些都比较简单。
ubuntu下一般都是录制bag 文件,并通过rviz显示,后续可以扩展一下。