个人项目
文章平均质量分 50
chamomoe
这个作者很懒,什么都没留下…
展开
-
食材识别
目的:识别出一个菜里面有哪些食材细节:使用mobile net。输出层为多个2分类器的并列。也就是输出每一位代表一种食材,可以同时存在多种食材。 食材的标注比较麻烦 先通过关键字爬取不同食材相关的图片。比如爬取青椒肉食,虎皮青椒,青椒炒蛋等关键字的图片作为青椒食材的训练数据。爬下来后手动清洗出1000张图片。然后用搜索引擎的相似图片查找,手动清晰出相似的但是没有青椒的负样本3000张...原创 2019-02-24 18:07:21 · 2624 阅读 · 1 评论 -
相机和imu标定
目的:得到imu和相机的空间变换,和时间戳延迟细节:使用kalibr结果:角度的标定非常稳定 平移的标定非常tricky,因为使用不用imu噪音参数的时候,能到完全不同的平移量。所以个人建议只是用标定出来的角度,平移量通过物理测量得到。或者先通过已知外参的架子上,通过调整噪音参数让算法输出的平移量准确。然后用这组噪音参数来标定其他外参的设备。当然前提是使用的相同的imu和相机。...原创 2018-11-16 11:38:28 · 4433 阅读 · 4 评论 -
激光视觉融合建图
目的:地图中语义的信息是通过激光点云生成的(车道线,可行驶区域等)。所以视觉定位的地图必须要和激光点云对齐。 另外不同光照条件下的视觉匹配有困难,可以通过激光点云来对齐这些视觉地图方案:激光跑slam生成pose 直接用这个pose来三角化视觉特征点。 因为还有个视觉到激光的转换是不确定的,所以可以做一个建点+激光视觉标定的优化。 激光的pose作为先验节点放在优化问题中 使用...原创 2018-11-09 20:56:39 · 8079 阅读 · 12 评论 -
基于描述符匹配的图像去重
目的:深度学习中希望把一些由同一张图片通过编辑而生成的不同版本的图片去掉 比如上面两张图片,其实是一张图片,但是从整体的外观来看,有很大的不同。如果采取简单的md5码,或者颜色值判断很难做到去重。描述:通过描述符匹配,如果两张图片能匹配上说明是一张图片。 匹配上的图片还有可能是误匹配,这个时候需要使用几何一致性进行筛选 通过旋转不变形筛选 上图是一个误匹配...原创 2019-02-24 20:26:50 · 587 阅读 · 0 评论 -
录制rosbag的ios app
目的:使用苹果手机把imu,图像以及gps录制成rosbag格式,共算法研究使用功能:修改topic功能。 录制文件自动命名 实时wifi传输数据 上传bag文件功能 录制:图像,IMU,Gps 输出图像尺寸设置功能 输出图像格式(彩色/黑白) 输出频率设置 录制文件查看,文件名修改和删除 在地图上显示gps 同步显示图像,gps和imu滤波出来的姿态 显示bag属...原创 2018-10-27 21:21:48 · 515 阅读 · 0 评论 -
定位算法移植到ios
目的:把maplab编译到ios细节:先要编译opencv的framework,boost的静态库。这两个网上有很多信息怎么编译。 编译好后就把这两个库加入到工程里面。 Eigen也需要加入到include目录中。 xcode里面新建ios的静态lib的工程,把所有cpp文件加入到工程中。注意最好只把定位有用到加入,比如优化的代码就不要加入了,免得多了麻烦。 开始编译,当然会有很...原创 2019-02-25 09:37:39 · 310 阅读 · 0 评论 -
激光点云生成
目的:把lidar采集到的一圈一圈的点云组合成全局点云细节:使用LOAM LOAM算法严重依赖lidar扫描的时序。也就是如果换了一种lidar,算法的改动比较大。但是因为LOAM使用特征进行匹配,精度上比Cartography高。 如果用的Velodyne 16线。github上有一个叫Lego LOAM的程序可以直接用。不过这个程序和IMU的结合不好,也没有考虑运动畸变。就是简...原创 2019-02-25 23:02:30 · 4622 阅读 · 0 评论 -
英语听力挑战微信小程序
英语听力练习实在是让人想睡觉,有没有什么方法能够让人越练越兴奋,一不注意1个小时就过去了呢?答案当然是有的:使用英语听力挑战微信。经过自己的经验,经常睡觉前说练练听力,结果一下半个小时就过去了。 非常及时的反馈,自己总想去达成满分,结果一篇文章就这么一下听了十多遍。 并且还有排行榜,如果有更多的小朋友一起来你追我赶,一定会更有激情。使用方法:扫描二维码: 微信中搜索:英语听力挑...原创 2018-10-06 17:22:34 · 3167 阅读 · 0 评论 -
Google AI Open Images Kaggle 比赛
比赛描述:一个识别和定位图片中物体的比赛 google提供的数据集的细节: 180w张图片,每个图片有多个标注框,数据大概600T 不是某个类别只要出现了就会被标注出来。 数据存在极度的不均衡 类别有层级关系,检测出子类物体,一定也要检测出父类物体才行 评估的时候也不是图片中出现了的物体都必须检测出来。每张图片有个存在列表和不存在列表,只有检测出来了存在列表的东西,或者没...原创 2019-02-24 17:27:11 · 629 阅读 · 0 评论 -
高速公路上基于地图的视觉定位精度量化评估
目的:基于地图的视觉定位不能直接用绝对位置和gps来比较精度。因为定位地图不一定完全和gps对齐了的。所以只能使用gps的相对变化和定位结果的相对变化的对比来评估定位精度。 并且gps在局部也不一定准,如果把gps的完整轨迹和定位出来的轨迹直接做对齐然后比差异的话,这样并不能知道是具体哪个位置定位不准。描述:使用GPS轨迹来评估基于视觉的定位结果的质量。将定位轨迹分段后和GPS轨迹做相...原创 2019-02-24 16:51:29 · 1187 阅读 · 0 评论 -
人工电磁特异材料的一些研究
背景:材料的电磁特性就两个参数,磁导率和介电常数。大多情况下,这两个值都应该是正的。不过自然界也有极少数的材料,这两个参数在某一些频率下是负的或者等于零。这类特意材料能够产生很多特异的效果,比如隐身,光计算等等。这方面的研究主要分为两个方向:怎么人造出各种特异材料。 磁导率和介电常数是由物质的原子和电子的群体运动决定的。 如果我们能够在不同尺度上人造这种原子电子结构,然后把众...原创 2019-02-23 11:40:12 · 1685 阅读 · 1 评论 -
游戏视觉内容逆向破解
目的:对游戏的美术资源的存储方式进行逆向,解析后可以提取各种美术资源或者替换游戏中的某些资源。 基本都是出于兴趣和好奇性进行的工作。研究细节:部落冲突(COC)美术资源破解 把游戏文件从手机中导出后,很容易看出哪些文件是和美术资源有关的。 不过这个资源是压缩格式的数据+一些文件头。对文件头进行一些修改后,可以使用普通的解压工具将文件转换成明文格式。 提取图像信息 美术资源...原创 2019-02-23 20:21:52 · 1786 阅读 · 2 评论 -
网络游戏网络封包破解
目的:想做挂B 完全破解封包格式后,可以做网游的模拟器。细节:RO网络封包破解 最早是用封包查看工具,看到ro的封包都是明文的,就觉得能有大文章做。 大一开始研究怎么在自己的程序中hook其他程序的网络封包。直到大二下半学期学了计算机原理,加上找到一本相关的书才成功做到,当时真的是好兴奋。但当自己做到的时候发现封包内容已经加密了。 但是只使用了静态加密,但当时又其他事情吸引了...原创 2019-02-23 21:21:13 · 14273 阅读 · 0 评论 -
《天宫》端游开发
细节:硕士才毕业的时候,想要搞点不按部就班(找个能让我留在美国的程序员的工作)的事情,决定回国做游戏。当时就去了这个做名字叫《天宫》的客户端网游的团队。这个游戏最后发布的时候改了名字,不过发布的时候我也不在这个团队了。那个年代(2012年)的端游基本都是基于天龙八部这个游戏的代码上改出来的。然后经历了多个游戏项目的添加和布丁。拿到我们团队手上的版本已经是非常的繁杂了,可谓是到处都是祖传...原创 2019-02-23 22:02:47 · 333 阅读 · 0 评论 -
《天天魔兽》手游开发
目的:顺应金主爸爸的希望,要山寨COC(部落冲突)细节:使用javascript作为UI的语言。 cocos2d-x作为游戏引擎。 服务端是完全重写的,毕竟手游的服务端基本就是用来纯点数据。 渲染采用的基于swf的架构,也是完全重写的。 客户端逻辑重新架构。所以当时还專門学了设计模式。客户端非UI部分主要分为三层结构: 渲染层:怎么播放swf文件,包含两个实现类 直接播放C...原创 2019-02-23 22:49:01 · 414 阅读 · 0 评论 -
基于unity的3d视觉算法可视化
目的:把3d视觉的各种结果直观的展示出来,并且能够和结果有些互动。比如点击某个frame,显示相关的信息。 Unity能够提供丰富的用户界面功能和互动功能,所以考虑使用Unity来做可视化。并且Unity还可以跨平台。细节:最大的难点是怎么在unity和算法之间交换数据。 Unity使用的C#托管类的语言。算法一般用c++非托管类的语言。所以需要用CLI(c++/c#)混编机制。 ...原创 2019-02-24 12:06:08 · 1138 阅读 · 0 评论 -
Matlab版本的ORB-SLAM开发
目的:负责人说做研究要用matlab,我们又在用orb-slam,所以就准备把orb-slam全套移植到matlab里面。细节:orb-slam中的函数一个一个的在matlab里面写。但是matlab本身不是面向对象的,所以算法的整体架构还是有变换。 设计了一个核心数据结构,这个结构中存储了所有算法的状态:3d点,frame等。所有函数都直接和这个结构交换数据。 支持把这个matla...原创 2019-02-24 12:34:29 · 4185 阅读 · 4 评论 -
MSCKF算法研究
目的:找一个能把imu和视觉融合起来的算法。细节:网上搜索了下,17年初的时候基本VIO算法就是MSCKF最完备。github上面有一个非官方的实现,就下下来研究。 但是跑kitti的数据都效果很差。debug的时候甚至还查出一些书写错误,比如x写成y。后面看issue,作者也说不算是完成的代码。 然后开始在matlab里面根据论文来写。一个一个模块的调试,最后终于跑了起来,虽然效果...原创 2019-02-24 14:37:09 · 5183 阅读 · 8 评论 -
基于ros的建图和定位算法可视化
目的:方便算法调试 用于给客户展示算法的性能 能够用于实时系统细节:最后选用了ros的rviz 可视化工具可以通过ssh方式控制算法的启动关闭,各种参数 可以显示各个传感器的状态:是否有数据,数据是否正常 可以显示不同可视化元素:各种匹配,点云,车道线等 采用rviz的插件机制开发自定义的UI 开发自定义的view controller,实现第一视角的显示 显示算法的状态...原创 2019-02-24 15:06:56 · 3149 阅读 · 1 评论 -
实车定位演示系统
目的:汽车一边运行一边实时展示基于地图的定位结果细节:硬件: 使用的传感器是单目摄像头+imu+gps。 地图使用点描述符作为匹配特征,并且有和定位特征点对齐了的车道线。 有一台工控机作为运行算法的机器,然后通过网线链接到副驾驶的一台笔记本,这个笔记本运行可视化程序。然后汽车后排挂载一台大的显示器,通过hdmi和可视化机器相连。其他传感器都直接可工控机相连。 gps的天线吸...原创 2019-02-24 15:49:28 · 390 阅读 · 0 评论 -
基于描述符匹配的激光点云定位
目的:使用纯激光点云进行实时全局定位。 点云的全局匹配比较困难,即使使用NDT也只能在一个先验位置附近搜索。 NDT匹配运算量较大。 动态物体影响较大。效果:每次匹配在100ms左右,还有提升空间。 适用于小到100平米大到3000平米区域的全局匹配。 全局定位水平平均精度在30cm,垂直精度在60cm 滤波后水平平均精度在20cm,垂直精度在20cm方法:主要算法基于...原创 2019-02-16 14:50:39 · 4403 阅读 · 2 评论