OPPO C++开发面试经历：音视频+底层优化深度考察

C++2025年6月19日作者: 美历团队

3年C++经验，详细复盘OPPO三轮技术面试，涵盖C++11/14特性、内存管理、音视频编解码、FFmpeg、低延迟直播系统设计等核心考点

背景介绍

先交代下我的情况，985本科软件工程专业毕业，在一家做音视频SDK的公司干了三年C++。日常就是和FFmpeg、WebRTC、OpenGL打交道，算是音视频领域的老兵了。OPPO一直在我关注列表里——他们做手机影像系统，音视频这块的技术需求肯定很大，而且听说他们内部有专门的音视频实验室，技术氛围不错。

投简历是通过前同事内推的，大概四天后HR就联系我了。整个流程三周，三轮技术面+一轮HR面，节奏比较紧凑。下面详细复盘每轮面试。

面试流程复盘

一面：C++11/14+内存管理（约1小时）

一面是个看起来很沉稳的工程师，开场先聊了几句项目经历，然后直接进入C++基础考察。

第一个问题：C++11的智能指针有哪几种？各自的引用计数机制有什么区别？我从unique_ptr的独占所有权、shared_ptr的共享引用计数、weak_ptr的弱引用三个维度讲了一遍。面试官追问：shared_ptr的引用计数是怎么实现的？是线程安全的吗？我解释了控制块（control block）机制——引用计数存储在堆上的控制块中，通过原子操作保证线程安全。他继续追问：shared_ptr的线程安全是指什么？对象本身线程安全吗？这个我之前确实搞混过，后来想清楚了——引用计数的增减是线程安全的，但shared_ptr指向的对象本身不是线程安全的，多线程同时读写对象还是需要加锁。

接下来是一连串C++11/14特性问题：move语义解决了什么问题？完美转发的实现原理？、lambda表达式的捕获方式有哪些？、右值引用和左值引用的区别？这些问题我都答得还行，但面试官在move语义那块追问了一个细节：move本身不移动任何东西，那它到底做了什么？我说move本质上就是一个static_cast，把左值转换成右值引用，真正的移动发生在移动构造函数或移动赋值运算符中。

内存管理部分问得比较深入：内存对齐是什么？为什么要对齐？、new/delete和malloc/free的区别？、内存池的实现思路？内存池那块我讲了固定大小内存池和可变大小内存池两种方案，固定大小的用空闲链表实现，分配和释放都是O(1)；可变大小的用伙伴系统或者slab分配器。

代码题是：实现一个线程安全的单例模式，要求懒加载且高效。我写了Meyer's Singleton——利用C++11的局部静态变量线程安全特性，代码非常简洁。面试官问：这个方案有什么局限性？我说如果单例的析构顺序依赖其他单例，可能会出问题，这时需要用atexit手动控制析构顺序。

二面：音视频编解码+FFmpeg（约1.5小时）

二面是个做了很多年音视频的老法师，一上来就问我对编解码的了解程度。

他问：H.264和H.265的主要区别是什么？H.265的压缩率为什么更高？我从编码工具集的角度做了对比——H.265支持更大的CTU（64x64 vs 16x16的宏块）、更多的帧内预测模式（35种 vs 9种）、更灵活的帧间预测（Merge模式和AMVP）、以及SAO滤波器。面试官追问：H.265的编码复杂度比H.264高多少？在移动端实时编码有什么挑战？我说编码复杂度大概是H.264的3-5倍，移动端需要用硬件编码器（MediaCodec）来保证实时性，但硬件编码器的参数控制不如软件灵活。

FFmpeg部分是重头戏。面试官问：FFmpeg的架构是怎样的？你用过哪些模块？我从libavformat（封装/解封装）、libavcodec（编解码）、libavfilter（滤镜）、libswscale（图像缩放）、libswresample（音频重采样）几个模块讲起，然后说了我在项目中主要用libavformat和libavcodec做音视频的解封装和解码。他追问：FFmpeg的解码流程是怎样的？从打开文件到获取解码帧的完整流程？我详细讲了avformat_open_input→avformat_find_stream_info→avcodec_find_decoder→avcodec_open2→av_read_frame→avcodec_send_packet→avcodec_receive_frame的完整流程。

他还问了一个很实际的问题：音视频同步是怎么做的？如果音视频不同步怎么排查？我讲了以音频为主时钟的同步方案——视频帧根据音频时间戳来决定是渲染还是等待。不同步的排查从时间戳精度、解码延迟、渲染时机几个方面入手。面试官追问：如果音频时钟本身不稳定呢？我说可以用音频重采样来调整播放速率，或者用更精确的音频时钟源。

代码题是：用FFmpeg实现一个简单的视频转码功能，从H.264转H.265。这道题考察的是对FFmpeg API的熟悉程度，我写了核心的解码→编码流程，包括AVFrame和AVPacket的管理。面试官让我考虑一下内存泄漏的问题——AVFrame和AVPacket需要及时unref，否则会造成内存泄漏。

三面：项目深挖+系统设计（约1.5小时）

三面是部门技术负责人，问题更加宏观。

他先让我讲一个最有挑战的项目，我选了之前做的低延迟直播系统。他问的问题非常深入：

你们怎么实现低延迟的？端到端延迟是多少？

我从采集→编码→传输→解码→渲染每个环节分析了延迟，以及我们的优化方案——硬件编码减少编码延迟、WebRTC的SRTP减少传输延迟、零拷贝渲染减少解码到显示的延迟。最终端到端延迟控制在300ms以内。

WebRTC的拥塞控制算法了解吗？GCC和BBR有什么区别？

这个我答得不太好，只讲了GCC基于丢包率和延迟梯度的带宽估计，BBR基于带宽和RTT的模型。面试官让我回去深入了解GCC v2的实现细节。

系统设计题是：设计一个实时音视频通话系统，需要考虑哪些模块？如何保证通话质量？

我从信令服务器、STUN/TURN服务器、媒体服务器三个核心模块讲起，然后讲了通话质量保障的几个维度——网络质量监控（丢包率、延迟、抖动）、自适应码率（根据网络状况动态调整编码参数）、音频处理（AEC回声消除、NS噪声抑制、AGC自动增益控制）。面试官对AEC很感兴趣，追问：AEC的实现原理是什么？自适应滤波器的收敛速度和稳态误差怎么平衡？我讲了时域LMS和频域块LMS两种方案，以及步长因子对收敛速度和稳态误差的trade-off。

最后聊了大概15分钟的技术方向，面试官介绍了OPPO在音视频领域的一些布局，包括他们自研的影像算法和AI增强的编解码技术，听起来确实很有技术含量。

真题汇总

1. C++11智能指针的种类和引用计数机制？shared_ptr的线程安全性？

2. move语义的本质？完美转发原理？

3. 内存对齐的原因？内存池的实现思路？

4. 实现线程安全的懒加载单例模式

5. H.264和H.265的区别？H.265压缩率更高的原因？

6. FFmpeg的架构和解码完整流程？

7. 音视频同步方案？不同步的排查方法？

8. 用FFmpeg实现视频转码功能

9. 低延迟直播系统的实现方案？

10. 实时音视频通话系统设计？AEC回声消除原理？

心得建议

第一，C++基础必须扎实。OPPO的C++面试不会只问概念，而是会一直追问到实现细节。比如shared_ptr的线程安全性，你得搞清楚什么是线程安全的、什么不是，不能含糊。

第二，音视频专业知识要深入。编解码原理、FFmpeg API、音视频同步这些是基本功，不能只停留在会用API的层面，要理解背后的原理。面试官特别在意你是否真正理解编解码的原理，而不只是调用了FFmpeg的函数。

第三，项目经验要有深度。音视频开发不像业务开发，面试官会从性能指标开始问——延迟多少、码率多少、帧率多少，然后追问你是怎么优化的。如果你只是用了某个框架但没有深入理解，很容易被问住。

第四，系统设计能力很重要。三面的系统设计题考察的是全局视野，你需要从整体架构出发，考虑各个模块的职责和协作方式，而不是只关注某个技术点。

第五，关注新技术趋势。AI+音视频是当前的热点，面试中如果能展示你对AI增强编解码、AI超分等新技术的了解，会加分不少。

FAQ

Q：OPPO C++开发的工作强度如何？

A：面试时了解到项目期加班较多，尤其是新机型发布前。但平时节奏还行，周末一般不加班。

Q：对FFmpeg经验有硬性要求吗？

A：音视频方向的岗位基本都要求FFmpeg经验，但如果是做底层优化的岗位，更看重C++和操作系统基础。

Q：面试结果多久出？

A：我是一面后3天约二面，二面后4天约三面，三面后一周出结果，整体大概三周。

Q：学历要求？

A：C++开发岗本科就行，但985/211优先。音视频方向更看重项目经验和专业能力。

Q：薪资水平？

A：3年C++经验，月薪大概在25-35k之间，总包在40-55w左右。OPPO的薪资在手机厂商里算不错的，年终奖看部门效益。

#C++开发#OPPO#音视频#FFmpeg#底层优化#编解码#面试经历