資訊中心

您當前的位置: 首頁 > 資訊中心 > 產業數字化 > 正文

數據治理:指標體系管理

發布時間:2022-11-21 09:49:56 環球時報

在數據治理中,數據指標一般都是業務中最基礎的分析內容,但是業務不斷地快速發展迭代,指標管理上就會出現很多問題。所以在數據治理中指標系統的管理也是其中必要的一環。

01

為什么要有指標管理

要回答這一問題,先來看一下在指標管理中經常會遇到的問題有那些:

1. 相同名字邏輯不同

指標名稱相同,統計口徑不一致,缺少命名規范限制。

不同業務僅從自己部門出發,缺少全局視角,如財務口徑的營收要嚴格按照嚴謹的邏輯計算實收實付的每一分錢,而產品/運營端則更多考慮轉化效果,但在各自的KPI監控報表中,都把指標命名為營收。

 2. 相同邏輯名字不同

指標統一邏輯一致,但不同產品命名不一致,不同階段、或不同業務方/產品經理對指標命名不同,導致在不同數據產品頁面,同一指標不同名。

3. 口徑不清晰

只是同義詞再復述一遍,如活躍用戶數:訪問用戶數。

4. 命名難理解

表意不清模棱兩可,或過于專業化僅指標創建人才可以懂。例如轉化率指標,有創單轉化率、成單轉化率,直接叫轉化率可讀性就非常差。

5. 邏輯不準確

指標口徑描述有誤,例如UV指標,口徑描述為“按照設備ID去重”,實際上不同平臺去重邏輯并不一致,如微信小程序按照UnionID去重、APP按照DeviceID去重,PC和H5按照loginkey去重。

 6. 數據難追溯

數據產品指標數據來源缺少直觀的鏈路追蹤能力,指標數據異常問題排查通過翻代碼去看數據來源,路徑長、耗時久,早上業務反饋指標問題,排查出結論后可能一上午就過去了。

7. 數據質量差

指標管理常見的問題綜合在一起,往往會導致業務對數據指標的信任度大打折扣,發現數據波動后,第一反應是先和數據部門確認數據是不是有問題,而不是去考慮業務上有何變動。

02

指標的組成

數據域

指面向業務分析,將業務過程或者維度進行抽象的集合。其中,業務過程可以概括為一個個不拆分的行為事件,在業務過程之下,可以定義指標;維度,是度量的環境,如顧客下單事件,訂單類型是維度。為了保障整個體系的生命力,數據域是需要抽象提煉,并且長期維護更新的,變動需執行變更流程。

業務過程

指公司的業務活動事件,如加購、支付都是業務過程。其中,業務過程不可拆分。

時間周期

用來明確統計的時間范圍或者時間點,如最近30天、自然周、截止當日等。

修飾類型

是對修飾詞的一種抽象劃分。修飾類型從屬于某個業務域,如日志域的訪問終端類型涵蓋APP端、PC端等修飾詞。

修飾詞

指的是統計維度以外指標的業務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞APP、PC端等。

度量/原子指標

原子指標和度量含義相同,基于某一業務事件行為下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如支付金額。

維度

維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬于一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、周、日等級別內容)。

維度屬性

維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。

指標分類主要分為**原子指標、派生指標、衍生指標**

1.  **原子指標**    基于某一業務事件行為下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如呼單量、交易金額

2.  **派生指標**    是1個原子指標+多個修飾詞(可選)+時間周期,是原子指標業務統計范圍的圈定。派生指標又分以下二種類型:

1.  事務型指標:

是指對業務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標。

2.  存量型指標:

是指對實體對象(如司機、乘客)某些狀態的統計,例如注冊司機總數、注冊乘客總數,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標,對應的時間周期一般為“歷史截止當前某個時間”。

**衍生指標**是在事務性指標和存量型指標的基礎上復合成的。主要有比率型、比例型、統計型均值

03

指標管理如何做

指標化管理的概念很多年前就存在,各個互聯網公司都在建設自己的管理平臺,學習了很多關于指標管理系統建設的文章會發現,做的事情大同小異。主要是圍繞指標管理的痛點問題,以阿里的OneData理論為方法論依據,相同的事情只要做一遍,剩下的是提供產品化的解決方案,讓指標建設、指標復用更加的規范和高效。

主要包括:

1)建立指標生產協同機制,指標的誕生要經過需求申請、審核、數據開發、上線應用流程,收口指標創建過程,避免指標建設的隨意性帶來的“污染”。

2)制定指標命名、口徑說明規范,按照原子指標+業務限定+統計維度的方式,將規則集成到平臺內,通過系統規則來把控指標輸出。

3)指標字典線上化,解決線下文檔(excel)管理指標存在的共享難、更新不及時、權限管控缺失等問題。

4)指標數據邏輯綁定,即除了維護指標的業務元數據外,還要建立指標的技術元數據,指標數據從哪個模型、哪個字段、何種計算邏輯得到。

5)指標輸出,指標管理最大的價值還是為數據產品提供數據輸出,將Hive層模型同步到MySQL、Greenplumn、Kylin、CK等查詢性能更優可以秒級響應的查詢引擎,通過接口調用JDBC連接方式直接獲取數據。

而實現這些是需要一個完整指標管理系統,來保證對應的規則要求落實到位。例如需要有權限管理,來限制不同的用戶有哪些指標的查看權限,指標的審批流程在定義一個指標邏輯計算口徑中需要指定負責人和審批人統一負責這個指標的規范。同時具有指標的快速檢索功能,方便在定義指標或者查看已有指標時快速定位。

04

指標管理的作用

1.提高溝通效率,減少存在相同邏輯不同命名的問題,在同一認知維度進行溝通

2.統計口徑收斂在一起統一管理,指標真確性提高

3.指標負責到人,有問題可以直接找到對接人,快速地解決問題。

4.對數據安全和權限的把控將會更加精細化,資源的管理也更加規范,在一定程度上會提升業務指標開發的成本。

05

寫在最后的話

指標管理平臺是可以幫助企業進行指標規范化管理的有效工具,但規范化帶來的犧牲就是流程的冗長和效率問題。

每個階段都有每個階段要發展的東西,不要想著一步到位,很可能會得不償失。小公司需要要考慮的就是效率生存問題,而大公司就要考慮流程規范,相對于小公司大公司更多考慮公司的穩定正常運轉。但是沒有一個指標管理系統也要在一定程度上人為去規范指標的開發,維護好指標的計算口徑和取數邏輯。

首頁
好了AV第四综合导航电影