一个简单的 C++ 对象池实现

对象池

前一段时间的工作中,有一项任务是检查线上代码中的动态内存分配与释放,能预先分配的统一预先分配,减少线上运行时动态分配、释放造成的性能开销。对于一些大对象来说,频繁的分配、释放会影响性能,我们可以使用对象池技术(Object Pool)来进行优化。

对象池,说白了就是一个池子,预先分配了一堆对象,原先的 new 改成从池子里取对象,delete 改成把对象放回池子。也就是池子中的对象是可以重复利用的,避免了频繁的分配、释放。

按照上面的简单思路,一个对象池的基本功能应该包括:

  • 构造函数中申请一批对象
  • 析构函数中释放对象
  • 提供获取和回收对象的接口 Get()Recycle()
  • 池子空了的时候支持扩容

实现起来也不难,用一个队列维护所有对象,用的时候从队列中取,回收了 push 回队列即可。不过显式的 回收 操作用起来不是很方便,忘记回收会造成资源浪费。可以考虑利用 C++ 智能指针(smart pointer)自定义删除器(deleter)来实现自动回收。

自定义智能指针的删除器

先看一个例子(这是一个错误使用智能指针的例子,只是为了展示 deleter 做了什么):

int main(int argc, char **argv) {
  Object *obj1 = new Object;

  std::shared_ptr<Object> p1(obj1);
  std::cout << p1.use_count() << std::endl;

  std::shared_ptr<Object> p2(obj1);
  std::cout << p2.use_count() << std::endl;

  return 0;
}

运行结果:

1
1
malloc: *** error for object 0x7f845f400340: pointer being freed was not allocated
*** set a breakpoint in malloc_error_break to debug
Abort trap: 6

报错了,提示说释放了一个未分配的指针。这是因为 std::shared_ptr 默认的 deleter 就是 delete,当两个 shared_ptr 实例出作用域时,执行了两次 delete obj1,所以出错。

我们不用默认的 deleter ,试试自己定义一个 deleter 来避免第二次 delete (再强调下,这个例子只是为了展示 deleter ,实际工作中没人会这么写的):

More

高考10年

这两天全国各地陆续发布了高考分数线,我也刚刚过完了这辈子第 28 个年头,转眼间,距离我参加高考已经 10 年了。

我对自己高考总分印象很深,因为不多不少,正好和我中考总分一样。

More

夏虫不可语冰,井蛙不可语海

今天,在百度 AI 开发者大会上,Robin 正式宣布百度和金龙合作的 L4 自动驾驶小巴量产了,一起奋斗了大半年的同事们都很开心,金龙当天的股票还涨停了,大家调侃道怎么没想到早点买金龙的股票。

晚上回到家,打开知乎,刷到这样一个答案,真是哭笑不得😂:

如何看待百度称首款 L4 级别自动驾驶巴士量产下线?

论吹牛,百度说第二,没人敢说第一

这车就是一个简单的循迹行驶,架好差分GPS基站,先用人工开一遍,录一下轨迹,然后一直按着轨迹绕圈圈跑,连感知设备都用不上。

利益相关,匿了

这位答主贴的图的确是厦门金龙研发现场的,看得出来应该是一位“内部人士”。

看完这个回答和评论区内容,先是愤怒,然后是想笑,最后是无奈。

愤怒是因为我所在的组就是做感知的,没有任何证据直接说“连感知设备都用不上”相当于完全不认可我们的工作,更何况这还是一位内部人士(不太可能是 baidu 这边的人,如果是金龙的员工,那就更让人心寒了)。

想笑是由于答主在评论区里还俨然一副专家姿态,“自己百度差分GPS”(敢情还是得用百度😐),“装了感知设备,未必代表就用了”,“你自己想想这照片我怎么拍的,再猜猜我是做什么的”。当时我就想到一句话:

夏虫不可语冰,井蛙不可语海

无奈是评论里竟然还有很多人认同答主,这才是最可悲的。像这位朋友评论说“装几个简单的雷达或者红外绕车子一周,然后if else就差不多了。。。”、“实现广义的L4不难”都让人啼笑皆非。

一件本来很让人高兴的事情,却变了味道。一方面是 baidu 近年来的公众形象问题,另一方面也反映出大众对自动驾驶的认知还远远不够。

像上面这位“内部人士”显然对于自动驾驶是没有多少了解的,甚至可以说“无知”也不为过。但可怕的不是无知,而是面对自己不熟悉的内容的傲慢与偏见。

关于“夏虫不可语冰,井蛙不可语海”,还有一个老笑话:

联合国给几个世界各地的小朋友们出题:“关于其他国家粮食短缺问题,请大家说说自己的看法”。非洲小朋友不知道什么是粮食,美国小朋友不知道什么是其他国家,欧洲小朋友不知道什么是短缺,拉美小朋友不知道什么是请,中国小朋友不知道什么是自己的看法。

很讽刺不过也很现实。人哪有那么容易理解自己没见过的事物呢?从某种意义上来说,我们每个人都是“夏虫”。但是面对无尽的未知,我们不应该抱着傲慢的态度,而应该以开放、谦卑、学习的心态来对待。

以后遇到无法沟通的人或者无脑喷子,想想这句话,也就释怀了。

std::vector<std::shared_ptr<XXX> > 初始化的坑

现在写 C++ 用智能指针基本是习惯了,不过今天遇到一个细节处的错误:

std::vector<std::shared_ptr<A> > a_vec(n, std::make_shared<A>());

本意是初始化了一个元素都是智能指针对象的数组,看起来很美好,实际上这个数组里所有元素都指向了同一个实例。看一下 C++ 文档上的参数说明:

val
Value to fill the container with. Each of the n elements in the container will be initialized to a copy of this value. Member type value_type is the type of the elements in the container, defined in vector as an alias of its first template parameter (T).

vector 所有成员用 val 的拷贝来初始化,智能指针的拷贝嘛,还是指向同一个实例。

正确的初始化方式:

std::vector<std::shared_ptr<A> > a_vec(n);
std::for_each(std::begin(a_vec), std::end(a_vec), [](std::shared_ptr<A> &ptr) {
  ptr = std::make_shared<A>();
});

C++ 更新动态库后强制转换基类指针遇到的坑

这两天被一个 bug 折磨得不轻,发新版本更新了 caffe-output 动态库,结果发现某一 layer 中一个参数读出来是随机数,模型预测结果总是不对。最后一点一点找 diff,发现是发布时打包的 caffe 动态库有错误,新版本 caffe 基类 layer 增加了这个参数作为成员变量,而老版本 caffe 动态库中没有这个成员变量。

直接看下面的例子吧=_=_

More

美签小记

最近公司一些业务要派人去美国分公司出差半个月,虽然没准备派我去,不过作为刚入职半年的壮丁,难免以后要去当苦力,还是让我先去办理一下。

读本科的时候总想着去美帝读书,后来因为各种原因打消了念头,没想到工作没多久竟然要去办理美帝的签证,真是造化弄人。

问了下同事,办理的是 B1/B2 商务签证,大部分人都是一年签证,每年都要去办一次,还有种是十年签证,拿到的人比较少。

按照公司提供的流程准备了材料,提交给中美商会,然后等着去面签就可以了。

面签之前要准备好的材料有:

  • 护照
  • 蓝色面试预约单
  • 预约确认单
  • DS-160 确认页
  • 照片
  • 签证申请费收据
  • 邀请信(公司提供)
  • 在职证明
  • 英文简历

这里说下 DS-160 ,这表格真的够长,同事告诉我说一定要认真填,有些时候 DS-160 填写情况就决定了你这次签证成功与否。还有就是照片要是白色背景、不能戴眼镜。

面签当天,没想到人非常多,我预约的是9点半,最后排队到11点才轮到我。英语口语一直不太好,有点紧张,前一天晚上还找了些面签的对话材料练习了下,我前面的小哥用英文和签证官(一个白人小哥)扯了半天,好像签证官还是不太满意,小哥还来了句“我是英文专业的” Orz 。到我了,我刚想开口用英文说明申请理由,小哥用非常不标准的普通话问我:“你为什么要去美国?”(请自行脑补音调),我愣了一下没说话,他又重新问了一遍,我才反应过来,用中文回答道:“公司派我去的。”完了就让我递给他邀请信和 DS-160 确认页。我还再想等下会问到什么英文问题,结果小哥对我微笑着说:“你通过了,可以走了。”啥?这也太顺利了吧,我很怀疑😂

过两天查了下邮件,真的过了,还是 10 年签。。。总有种今年人品用光了的感觉。。。

WebGL初探

Coursera 上最近新开了一门课 Interactive Computer Graphics with WebGL,通过 WebGL 来介绍计算机图形学。

从本科时学习 OpenGL 1.x ,到研一重新学习 OpenGL 3.x 之后基于 shader 的方法,OpenGL 也算是我的一位老朋友了。现在 Web 开发热火朝天,桌面应用 Web 化早已成为趋势,我正好借着这门课学习下 WebGL,同时也了解一下网络前端开发。


OpenGL

OpenGL = Open Graphics Library,是图形硬件的一种标准软件接口,其最初由 SGI 创建,用于在不同硬件体系结构的图形设备上进行二维和三维图形的绘制。OpenGL 不是一种编程语言,也不是 OpenCV 之类的算法工具库,而是一个图形显示标准 API 集合。


Modern OpenGL

学习过 OpenGL 1.x 和 2.x 的朋友应该对 glBegin()glVertex()glEnd() 印象深刻,使用这种方式绘制属于“立即模式”(immediate mode),每次顶点被创建后都会由 CPU 发送给 GPU 进行绘制,从而造成了 CPU 和 GPU 之间的性能瓶颈。

立即模式在 OpenGL 3.1 及之后的版本已经被移除,Modern OpenGL 是基于 Shader 来进行图形的绘制的,即所有绘制工作都应由 GPU 负责,CPU 仅仅负责将要绘制的数据传送给 GPU。

Shader(着色器) 也是一种程序,其使用 GLSL(GL Shading Language) 编写,分为顶点着色器(vertex shader)和片段着色器(fragment shader),前者处理顶点相关的属性,后者处理像素点相关的属性。着色器在程序运行时进行编译。

Modern OpenGL 通过“保留模式”(retained mode) 进行图形绘制:将所有顶点数据放在一个数组中,将该数组发送给 GPU ,通过 shaders 完成绘制。


WebGL

WebGL 是 OpenGL ES 2.0 的 JavaScript 实现,是面向浏览器的 OpenGL。WebGL 可以与 HTML5、CSS 结合使用,借助本地系统显卡在浏览器中构建和显示三维场景与模型。

WebGL 使用 JavaScript 作为编程语言,尽管有一些问题和局限性,但能在浏览器轻松构建三维图形程序仍是一件很酷的事!


More

使用 OpenCV 裁剪 PDF 页面

网上找到的一些课件讲义等资料有时候会是 PPT 多页打印而成的 PDF 文件,比如下图这种:

slides in pdf

有些人希望对 PDF 页面进行裁剪,将 PDF 还原为原 slides 那样一页一张演示文稿的形式。(其实我个人觉得没什么必要,因为不影响阅读,而且 PDF 格式读起来还不用频繁翻页了。)

前几天,我在知乎上看到了有这样需求的一个问题。 当时想到用 Python 和 OpenCV 来做这样的图像处理小任务应该很简单的吧。于是动手撸了段代码,简单的 “边缘检测+轮廓提取”,最后结果看起来还不错:

pdf cropped results

下面给出 Python 代码并简单解释下。

More