指標是一種強大的工具;它們可以幫助您衡量自己關心的事情。擁有遠大的目標是件好事,但要知道自己是否取得了進步、激勵團隊并建立責任感,您需要能夠用數字來表達它們。
但說起來容易做起來難。有幾十種指標似乎在衡量同一件事,而且每天都有新的流行指標出現。你應該使用哪些指標,又應該不惜一切代價避免哪些指標?
在過去十年中,我一直生活在指標之中,并發現有一些區分好指標和壞指標的一般原則:
原則 1:指標應該是你想要衡量的指標
通常,您無法直接測量您關心的確切事物。
假設我的目標是衡量我的新聞通訊帖子的質量;我該怎么做呢?“質量”是主觀的,沒有普遍接受的公式來評估它。因此,我必須為我的目標選擇我實際上能夠衡量的最佳(或最不壞)代理。在這個例子中,我可以使用打開率、喜歡等作為質量的代理。
這與人們通常所說的指標“相關性”密切相關:如果改進指標,是否會為企業創造價值?如果沒有,那為什么要衡量它?
例如,假設您在 Uber 工作,想了解您的供應方是否健康。您可能會認為平臺上的司機數量或他們在應用程序上花費的在線時間是一個很好的衡量標準。
這些指標并不糟糕,但它們并不能真正告訴你你的供應方是否真的健康(即足以滿足需求)??赡苁切枨蟪^了驅動力的增長,或者大部分需求增長發生在上午,但供應增長主要發生在下午。
更好的指標是將供給和需求結合起來;例如乘客打開應用程序而沒有可用司機的次數。
原則 2:指標應易于計算和理解
人們喜歡花哨的指標;畢竟,你付錢給數據團隊就是為了做復雜的分析,對吧?但復雜的指標很危險,原因如下:
它們很難理解。如果你不確切了解某個指標是如何計算的,你就不知道如何解釋其變動或如何影響它。
他們強制進行集中分析。通常,數據科學是唯一能夠計算復雜指標的團隊。這剝奪了其他團隊進行分散分析的能力。
它們容易出錯。復雜的指標通常需要多個團隊的輸入;我已經記不清有多少次因為眾多上游輸入中的一個被破壞而發現錯誤了。更糟糕的是,由于公司中只有少數人可以計算這些指標,因此同行評審很少,錯誤往往在很長一段時間內都未被發現。
它們通常涉及預測。許多復雜的指標都依賴于預測(例如,根據過去的數據預測群組表現)。這些預測通常不準確,并且會隨著新數據的輸入而隨時間而變化,從而造成混亂。
以 LTV:CAC 為例:
除了它不是最適合其工作方式的指標之外,它也很危險,因為計算起來很復雜。分子 CAC 要求你按群組匯總營銷和銷售部門的各種成本,而分母 LTV 則是對各種因素的預測,包括留存率、追加銷售等。
這些指標就是當你在兩年后才意識到方法論上存在問題并且你一直在查看“錯誤”的數據。
原則 3:良好的(操作性)指標應具有響應性
如果您想持續管理業務以達到指標,則需要具有響應能力。如果指標滯后,即變化需要數周或數月才能影響指標,那么您將無法獲得可讓您持續改進的反饋循環。
您可能想通過預測變化的影響而不是等待它們出現在指標中來解決此問題,但這通常是不明智的(請參閱上面的原則2)。
當然,跟蹤收入等滯后指標很重要(尤其是對于財務或領導層而言),但大多數團隊應該花大部分時間關注領先指標。
原則 4:指標應該難以操縱
一旦你選定一個指標并要求人們負責改進該指標,他們就會找到最有效的方法來做到這一點。這通常會導致意想不到的結果。以下是一個例子:
Facebook 希望向用戶展示相關內容,以增加他們在網站上停留的時間
由于“相關性”難以衡量,他們使用參與度指標作為代理(喜歡、評論等)。
出版商和創作者意識到算法的工作原理,并找到心理操縱的方法來增加參與度 ? Click Bait 和Rage Bait誕生
“當一項措施成為目標時,它就不再是一項好的措施。”
— 古德哈特定律
在上面的例子中,只要用戶繼續在平臺上花費時間,Facebook 可能就不會介意質量下降。但在很多情況下,如果指標被大規模操縱,就會造成嚴重損害。
假設您提供推薦獎金,用戶因推薦注冊而獲得獎勵。最有可能會發生什么?人們將嘗試創建數十個虛假賬戶來領取獎金。更好的推薦指標是要求在平臺上達到最低交易金額(例如 25 美元)才能獲得獎金。
因此,防止操縱的一種方法是設計指標來限制您預期的不良行為。另一種方法是將指標配對。這種方法是由安迪·格羅夫在他的《高產出管理》一書中介紹的:
“因此,由于指標指導一個人的活動,你應該警惕反應過度。你可以通過將指標配對來做到這一點,這樣就可以同時衡量效果和反作用。”
— 安迪·格魯夫,《高產出管理》
在實踐中,情況會怎樣?如果您只是因為希望客戶立即獲得幫助而以“第一時間響應”為標準激勵客戶支持代理,那么他們只會對每張新工單回復一條通用消息。但如果您將其與工單解決時間(或客戶滿意度)目標結合起來,則可以確保代理真正專注于更快地解決客戶問題。
原則 5:好的指標不應設定任意的閾值
你會發現科技公司中的許多流行指標都與閾值相關。
例如:
至少有 5 個連接的用戶數
視頻觀看次數 > 1,000
這是有道理的;通常,采取行動本身并不是一個很有價值的信號,你需要設置一個閾值來使指標有意義。觀看大部分視頻的人與只是點擊視頻的人有很大不同。
但是:閾值不應該是任意的。
不要因為“1,000 次觀看”是個不錯的整數就選擇它;這個門檻應該以數據為基礎。觀看次數達到 1,000 次的視頻之后的點擊率會更高嗎?還是會催生出更多后續內容?創作者留存率會更高嗎?
例如,Twitch會測量觀看直播時間至少為 5 分鐘的用戶數量。雖然數據顯然影響了這一選擇,但目前尚不清楚他們最終為何選擇 5 分鐘。
在 Uber,我們嘗試讓數據告訴我們閾值應該在哪里。例如,我們發現附近有很多其他餐廳的餐廳在 UberEats 上更可靠,因為更容易留住送餐員。我們根據我們在圖表中看到的“肘部”設定了我們認為低密度餐廳的閾值:
這種方法在許多業務領域都有效;例如,我們還發現,一旦乘客或司機在平臺上達到一定數量的初次出行,他們就更有可能留下來。
您并不總是能找到像這樣的“神奇”閾值,但您應該在確定任意值之前嘗試識別一個閾值。
原則 6:良好的指標創造背景
沒有上下文的絕對數字很少有用。你經常會看到這樣的新聞公告:
“為客戶處理了 10 億行數據”,或者
“我們平臺向創作者支付了 1 億美元的收益”
這些數字什么都說明不了。要想讓它們有意義,就必須把它們放在上下文中。平臺上每個創作者的平均收入是多少?在什么時間范圍內?換句話說,將絕對數字轉化為比率可以增加背景信息。
當然,上述例子中有些是故意的;公司不想讓公眾知道細節。但這個問題并不僅限于新聞稿和博客文章。
從絕對角度來看您的銷售渠道可能會告訴您它是否隨著時間的推移而增長;但要使其真正有意義,您必須將其與銷售團隊的規?;蛩麄兂袚呐漕~聯系起來。這為您提供了渠道覆蓋率,即渠道與配額的比率,這是一個更有意義的指標。
創建這些類型的比率還可以使比較更具洞察力和公平性;例如,比較每個部門的收入將使大部門看起來更好,但比較每個員工的收入可以實際了解生產力。
原則 7:指標需要明確的所有者來控制該指標
如果您希望看到某個指標發生變化,您需要有一個人負責改進它。
即使多個團隊的工作有助于提高指標,您仍然需要一個負責實現目標的“所有者”(否則您最終會陷入互相指責的境地)。
這里有三種潛在的問題場景:
沒有主人。沒有人執著于改進它,這個指標將繼續沿著當前的軌跡發展。
多個所有者。所有權不明確會導致摩擦和缺乏責任感。例如,在 UberEats ,有時不清楚某些指標是歸當地城市團隊還是中央運營團隊所有。在很短的一段時間里,我們花在開會討論這個話題上的時間比實際執行的時間還多。
缺乏控制。任命一個無力(或感覺無力)改變指標的所有者是導致失敗的另一個原因。這可能是因為所有者沒有直接控制指標的手段、沒有預算來這樣做,或者缺乏其他團隊的支持
原則 8:好的指標可以最大限度地減少噪音
只有當您能夠解讀指標的變化時,指標才具有可操作性。要獲得清晰的讀數,您需要盡可能多地消除“噪音”源。
例如:
假設您是一家小型 B2B SaaS 初創公司,您將網絡流量視為漏斗頂部的領先指標。如果您只查看“原始”訪問次數,那么您會受到來自您自己的員工、朋友和家人以及訪問網站的現有客戶的干擾,并且您可能會發現網絡流量和漏斗下端指標之間的相關性很小。
如果可能的話,從報告中排除這些流量來源,將使您更好地了解潛在客戶渠道的實際情況。
原則 9:某些指標應成為行業標準
對于某些指標,重要的是它們可以在公司之間進行比較。例如,如果您從事 B2B SaaS 業務,您的 CFO 會希望將您的凈收入保留率 (NRR)、CAC 回報或 Magic Number 與競爭對手進行比較(您的投資者也會希望這樣做)。
如果您以不符合市場標準的方式計算這些指標,您將無法通過基準測試獲得任何見解,并會造成很多混亂。這并不是說您不應該編造指標;事實上,在我的職業生涯中,我自己也編造了一些指標(可能會寫一篇單獨的文章來介紹如何做到這一點)。
但大多數財務和效率指標的定義最好保持不變。
綜上所述
綜上所述,我想明確一點:對于任何用例來說,都沒有完美的指標。每個指標都會有缺點,你需要選擇“最不壞”的那個。
希望上述原則能夠幫助您做到這一點。