京東數據分析崗面試經歷分享:SQL+Python+業務思維全考察
2年數據分析經驗社招京東數據分析崗面試全復盤,含SQL窗口函數、Python pandas、AB測試、業務指標拆解等真題詳解,京東數據分析面試2026最新經驗。
背景介紹
先說下我的情況,2年資料分析經驗,目前在一家網際網路公司做資料分析師,主要負責使用者行為分析和業務資料監控。日常工作就是寫SQL取數、做報表、跑AB實驗這些。公司不算大,資料團隊就5個人,什麼活都得自己幹,從取數到建模到視覺化一條龍。
說實話,在小團隊做資料分析,最大的問題就是成長空間有限。業務方提什麼需求就做什麼,很少有機會做深度的專題分析,更別說搭建完整的資料體系了。所以一直想找個更大的平台,能有更豐富的資料場景和更專業的團隊。
今年4月份,一個獵頭在LinkedIn上找到我,說京東在招資料分析師,問我有沒有興趣。說實話京東一直是我想去的公司,畢竟電商領域的資料體量和複雜度都是頂級的,對資料分析的要求也更高。獵頭幫我投了簡歷,大概3天後就收到了面試邀請。
完整面試流程復盤
一面(約1小時,SQL+Python+業務題)
一面的面試官是資料團隊的一個資深分析師,看起來30出頭,問問題很直接,不繞彎子。面試分為三個部分:SQL、Python、業務分析。
SQL部分:
面試官先問了一個基礎問題:視窗函式中rank、dense_rank、row_number的區別。這個我答得比較流暢——rank是並列排名會跳號(1,1,3),dense_rank是並列排名不跳號(1,1,2),row_number是不管並列直接遞增(1,2,3)。然後面試官出了道實戰題:求連續3天登入的使用者。
這道題的思路是:先按使用者分組,用row_number給登入日期排序,然後用登入日期減去排序號得到一個「基準日期」,如果同一個使用者的基準日期出現3次以上,就說明有連續3天登入。我寫了大概10分鐘,面試官讓我解釋了一下邏輯,然後追問了如果資料量很大怎麼最佳化——我講了可以先按日期分割槽,減少單次處理的資料量。
Python部分:
問的第一個問題是pandas中merge和join的區別。我講了merge是更通用的合併方式,可以指定left/right/inner/outer,可以基於多個列合併;join預設是基於索引合併,語法更簡潔。然後面試官問了一個資料清洗的實際問題:有一個使用者行為日誌表,裡面有重複記錄和異常值,怎麼清洗?
我的思路是:先用drop_duplicates去重,可以根據使用者ID+時間戳+事件型別來判斷重複;然後用describe()看數值型欄位的分佈,用3σ原則或箱線圖識別異常值;對於缺失值,根據業務場景選擇填充或刪除。面試官對這個回答比較滿意,追問了如果異常值佔比很大怎麼辦——我說要和業務方確認,可能是資料採集的問題,不能簡單刪除。
業務分析部分:
面試官出了一個經典問題:如果GMV下降了20%,你怎麼分析?我按照「總體→拆解→定位」的思路來回答:
1. 先確認資料準確性——是統計口徑變了還是真的下降了?
2. 按維度拆解——按時間(是突然下降還是持續下降)、按品類(哪個品類降幅最大)、按渠道(哪個渠道出了問題)、按新老使用者(是新使用者少了還是老使用者不買了)
3. 定位原因——結合業務動作(有沒有改版、有沒有促銷結束、競品有沒有大促)
4. 給出建議——根據原因提出對應的解決方案
面試官追問了:如果按品類拆解後發現所有品類都在下降,你怎麼進一步分析?我說那就看是不是流量端的問題——整體流量是否下降?轉化率是否下降?客單價是否下降?逐層定位到具體的環節。
二面(約1小時,AB測試+指標體系+資料看板)
二面的面試官是資料團隊的負責人,問題更偏方法和論和實際落地。
AB測試設計:
面試官問了一個很實際的問題:如果要測試一個新的推薦演算法,你怎麼設計AB實驗?我從以下幾個方面展開:
1. 實驗設計:確定實驗組和對照組,選擇分流方式(按使用者ID hash分流),確定實驗週期(至少一個完整週期,考慮週末效應)
2. 指標選擇:核心指標(點選率、轉化率)、護欄指標(確保不會負面影響其他指標,如退貨率、客訴率)
3. 樣本量計算:基於最小可檢測效應(MDE)和統計功效(通常取80%),用公式或線上工具計算
4. 結果分析:用t檢驗或卡方檢驗判斷差異是否顯著,注意多重比較問題
面試官追問了:如果實驗結果顯示核心指標提升顯著但護欄指標也有負面影響,你怎麼決策?我講了需要評估綜合收益——如果核心指標的提升價值遠大於護欄指標的負面影響,可以上線但需要持續監控;如果負面影響不可接受,需要最佳化方案後再測試。
指標體系搭建:
面試官讓我給一個電商APP設計指標體系。我從OSM模型出發:
1. 目標層(O):GMV、使用者數、留存率
2. 策略層(S):流量獲取、轉化提升、客單價提升、留存改善
3. 度量層(M):DAU、UV、轉化漏斗各環節轉化率、客單價、複購率、7日/30日留存
面試官對這個框架比較認可,但指出我遺漏了供給側的指標——商家數、商品豐富度、履約時效這些也很重要。確實,電商是雙邊市場,我只考慮了使用者端。
資料看板設計:
面試官問:如果要給業務負責人做一個日常經營看板,你會放哪些內容?我講了:
1. 核心KPI卡片:GMV、訂單量、客單價、DAU(含同比環比)
2. 趨勢圖:GMV和訂單量的日趨勢
3. 漏斗圖:從訪問到下單的轉化漏斗
4. 排行榜:品類TOP10、渠道TOP10
5. 異常告警:關鍵指標偏離閾值時高亮顯示
面試官追問了看板的更新頻率——我說核心指標即時更新,詳細資料T+1更新。面試官認為這個設計合理。
業務Case:如何評估促銷活動效果
面試官出了一個場景題:剛結束了一個滿減促銷活動,怎麼評估效果?我的分析框架:
1. 直接效果:活動期間的GMV、訂單量、參與使用者數、客單價變化
2. ROI分析:活動成本(補貼金額)vs 帶來的增量GMV,計算ROI
3. 使用者分群:新客vs老客的參與度和轉化率差異
4. 溢位效應:活動是否拉動了非活動品類的銷售
5. 負面影響:活動後是否有銷量回落(提前消費效應)、退貨率是否上升
面試官對這個回答很滿意,說考慮得很全面。
HR面(約30分鐘)
HR面比較常規,主要問了以下幾個問題:
1. 職業規劃:短期想深耕資料分析,長期希望往資料產品或資料管理方向發展
2. 為什麼選京東:電商資料場景豐富,資料體量大,能學到更多
3. 期望薪資:我報了一個合理的漲幅,HR沒有當場回覆
4. 目前還有其他offer嗎:如實回答
結果
HR面後大概1週,收到了offer。薪資漲幅約25%,雖然不是特別高,但京東的平台和資料場景對我來說更有價值。而且團隊規模比現在大很多,能接觸到更專業的資料工程和演算法團隊,對職業發展幫助很大。
面試真題匯總
一面真題:
1. 視窗函式rank、dense_rank、row_number的區別
2. SQL實戰:求連續3天登入的使用者
3. pandas中merge和join的區別
4. 資料清洗:重複記錄和異常值的處理
5. 業務題:GMV下降20%怎麼分析
二面真題:
1. AB實驗設計:新推薦演算法的測試方案
2. 樣本量計算與統計顯著性判斷
3. 核心指標與護欄指標的權衡
4. 指標體系設計:電商APP的OSM模型
5. 資料看板設計:日常經營看板內容
6. 業務Case:促銷活動效果評估
HR面:
1. 職業規劃
2. 為什麼選京東
3. 期望薪資
心得體會與建議
1. SQL是基本功,必須熟練。資料分析面試幾乎一定會考SQL,而且不是簡單的查詢,視窗函式、多表關聯、子查詢這些是標配。建議把LeetCode上的SQL題刷一遍,重點練視窗函式和日期相關的題目。
2. 業務思維比技術能力更重要。面試中業務題的佔比很大,面試官更看重你分析問題的框架和邏輯,而不是具體的技術實現。建議平時多關注業務,理解資料背後的業務含義,不要只做一個「取數工具人」。
3. AB測試是高頻考點。幾乎每個資料分析面試都會考AB測試,從實驗設計到結果分析都要掌握。建議系統學習一下AB測試的統計原理,包括假設檢驗、樣本量計算、多重比較這些。
4. 回答業務題要有框架。不要想到什麼說什麼,先給出分析框架,再逐步展開。比如GMV下降的問題,先確認資料準確性,再按維度拆解,再定位原因,最後給建議。有框架的回答會讓面試官覺得你思路清晰。
5. Python不用太深入,但pandas必須熟。資料分析面試對Python的要求不算特別高,主要是pandas的資料處理能力。merge、groupby、pivot_table、apply這些操作要能熟練使用。
常見問題FAQ
Q:資料分析面試一定要會Python嗎?
A:看公司。有些公司只要求SQL+Excel,但大廠基本都要求Python。建議至少掌握pandas和numpy的基本操作,能做資料清洗和簡單分析。
Q:SQL要學到什麼程度?
A:視窗函式是必須掌握的,多表關聯、子查詢、CTE這些也是標配。建議能獨立完成LeetCode中等難度的SQL題。面試中的SQL題一般不會特別難,但要求寫得快、寫得對。
Q:沒有電商經驗能過京東的資料分析面試嗎?
A:可以。面試官更看重你的分析思維和學習能力,而不是行業經驗。當然,如果你能提前了解一些電商的核心指標(GMV、客單價、轉化率、複購率等),會更有優勢。
Q:AB測試怎麼準備?
A:建議從三個方面準備:1)統計基礎——假設檢驗、p值、置信區間、統計功效;2)實驗設計——分流方式、樣本量計算、實驗週期;3)結果分析——顯著性判斷、多重比較、Simpson悖論。
Q:資料分析面試會考算法題嗎?
A:一般不會考LeetCode那種算法題,但SQL題和Python資料處理題是必考的。有些公司可能會考簡單的統計推斷題,比如t檢驗、卡方檢驗的應用。