什麼是 Data Clean Room (DCR) 資料無塵室? 為何 DCR 是對抗 Cookieless 必備應用?

去年至今,本刊持續報導全球大廠 Data Clean Room 的方案及佈局,甚至也提過此服務將成為企業數據裝備競賽中,必備的武器之一。然而,關於 Data Clean Room 的產品及技術規格,一直尚未在市場上有統一的標準,因此在市場推廣及規模化企業用戶上,總容易窒礙難行。2023年二月 IAB Tech Lab 終於公布,將籌備及發表第一版 Data Clean Room 標準指南,目前正廣納各方意見由專案小組審查,尤其針對廣告應用上以及技術串接規格,都將提出建議及規範。這項消息對於廣告業來說,究竟意義為何呢?

要用數據前得先嚴格保護數據隱私

我們可以想像,如果有一個大型廣告主,打算運用 Data Clean Room方案,進行受眾重疊清洗、與媒體合作數據活化切分更細的受眾,再將這些運算完的結果運用至 DSP 中。如此複雜的過程,在過去沒有標準化規範,各技術供應商得彼此遷就合作,開出許多特規或是暫時性的解法,為了滿足該專案順利上線。因此,由第三方公正單位所提出的產品及技術標準指南,就是為了要解決數據合作的技術溝通摩擦。首要,要強化就是各家 Data Clean Room 之間的「互通性」(Interoperability),因此 IAB Tech Lab 倡議 Open Private Join and Activation(簡稱 OPJA),其目的就是為了讓來自兩個不同 Data Clean Room 的資料之間,可以彼此匹配受眾且共享結果,同時又能保護使用者隱私。

Data Clean Room 的討論度,花園圍牆外向來是比較熱絡,但這次 IAB Tech Lab 推出的規範, Google 和 Meta 皆是 IAB Tech Lab Rearc Addressability Working Group 的會員,負責討論及提出相關規範,甚至 Google 也對 OPJA 規範提出具體的貢獻,這些將有助於業界對於 Data Clean Room 的應用將更加普及。

然而,近年來在國內外也的確有需多公司發生資料外洩的問題。站在市場獲利的觀點,若能更有效保護使用者數據符合各種隱私法規,的確有助於市場推廣。IAB Tech Lab 針對此議題,廣納產業各方意見後,歸納出幾項業界認為最重要的條件,「包含所有個人身份資訊(PII)都必須加密且不應直接共享」、「參與方不應獲得包含在數據集中使用者的身份訊息」、「所有參與者皆不能獲得重疊受眾中的個人資訊」、「缺乏上述任一條件則非真正的 Data Clean Room」。想當然耳,廣告主要去評估一家合格的 Data Clean Room 廠商,是一件複雜且困難的事情。例如,廣告主要評估廠商的隱私強化技術(Privacy-Enhancing Technologies ,簡稱 PETs), PETs 本身不是一個靜態的標準值,而是根據廣告主自身數據精準度、數據顆粒度及資安層級,來取捨判斷 PETs 的程度。總而言之,我們都知道在即將不久的將來,數據應用將因各種政策及沙盒,而陷入乾枯的荒蕪沙漠。Data Clean Room 的應用有機會緩解廣告成效分析及成效下滑的隱憂,但資料安全仍永遠是第一優先要去考量且解決的議題,我想這也是 IAB Tech Lab 倡議 OPJA 的真諦。

到底什麼是 Data Clean Room?

Data Clean Room(資料無塵室)是近年來在廣告產業日益重要的一種資料交換模式。流程概略上是:

  1. 廣告主及媒體將隱私資料(如使用者個資)都放到同一個資料庫(也就是 Data Clean Room )
  2. 在 Data Clean Room 可以將兩邊資料取交集,找到廣告主與媒體的共同的受眾
  3. Data Clean Room 將機敏資料移除之後,再匯出做後續廣告使用

這關鍵在於,廣告主跟媒體可能都掌握了雙邊使用者的個資,如 Email 或手機電話等,但卻又沒有一個安全可以交換的環境、也擔心資料外洩造成的隱私疑慮,因此透過 Data Clean Room 作為中介。

Data Clean Room 可以解決什麼問題?

在第三方 Cookies 失效的情況下,第一方數據變得相當重要,但往往使用者的個人數據又有高度的隱私,不適合直接提供給外部使用,而一個中立第三方可以做資料清理跟交換,就變得非常有價值。

也可以與 Unified ID 2.0 為首的身分識別解決方案做一個比較:

在新一代 ID 解決方案中,主要原理是透過將 Email 或手機透過第三方(UID Operator)做加密處理,變成是廣告主和媒體無法解密還原的 ID,再來讓多邊進行比對。

而在 Data Clean Room,則是把這一個保護資料的工作,放到多邊資料結合比對後,在匯出的過程時才移除掉個資,避免第一方資料外洩的風險。

打個比方,廣告主將其品牌的集點卡會員手機資料匯入到 Google 的 Ads Data Hub,就可以和 Google 的會員資料比對,有哪些是有在這次的廣告活動中接觸到的集點卡會員,但只能看到自己有匯入的資料與 Google 的交集,沒辦法看到 Google 其他沒有交集到的使用者資料。

而除了可以做成效分析之外,也可以做為投放時的受眾。以前述集點卡會員為例,當品牌將資料打包進去 Data Clean Room 時,也可用來比對出 Google 端的使用者 ID,排除掉已知有集點卡的會員後,再把受眾名單輸出到 Google Ads 或 DV360 做後續使用。

國外 Data Clean Room 持續普及中

在過去幾年中,各大媒體集團也都推出了 Data Clean Room 的解決方案讓廣告主可以自由使用,像是大廠 Google Ads Data Hub、Facebook Advanced Analytics、Amazon Marketing Cloud,新興的媒體也有 Disney Data Clean Room 等解決方案。

要注意 Amazon Marketing Cloud 跟 AWS Bastion 有所不同,Amazon Marketing Cloud 是讓廣告主可以去存取 Amazon 上的廣告曝光資料,而 Bastion 則是讓任何媒體可以匯入資料,與其他廣告主建立自己的 Data Clean Room。

扣除掉這些媒體品牌的 Data Clean Room 解決方案,也有像是資料倉儲大廠 Snowflake 提供的分散式 Data Clean Room 解決方案,只要廣告主與媒體都是使用 Snowflake 的資料倉儲服務,就可以進行安全的資料交換。

這次 AWS 即將推出的產品雖然還未知細節,但考慮到 AWS 的超高市占率,很有可能也是類似的作法:各家公司在自己的 AWS 帳號中載入第一方資料,再透過平台做中介交換。

台灣也有強大的 Data Clean Room 解決方案

在日本我們已經陸續看到包含電通集團與軟銀、LINE 等合作 Data Clean Room 的解決方案。在台灣市場 TNL Mediagene 與 91APP 合作算是台灣第一個成功的 Data Clean Room 的案例,TNL Mediagene 旗下 Ad2 廣告聯播網透過 91APP jooii® AI 應用,將 TNL Mediagene 媒體集團22個媒體品牌及流量合作的200個網站的使用者及流量數據,分析使用者特徵向量及樣貌進而在 jooii® AI 深度學習運算,用零售的理解、思維(模仿零售專家的大腦)來運作產出受眾標籤,91APP jooii® AI 在廣告運用場景,其運作原理如下:

  • 受眾探索評分
  • 受眾組合生成
  • 受眾優化預測

雙方再運用 Data Clean Room 的技術去加密去識別化數據,目的就是為了確保數據在封閉、無塵的環境下受到保護,進而比對媒體、廣告聯播網數據融合零售訊號後,究竟在消費場景的特徵為何?換言之,Ad2 廣告聯播網透過 91APP jooii® AI 的賦能,在 Data Clean Room 的環境中讓原本強大的創意媒體廣告聯播網,直接升級成 RMN2.0 零售媒體廣告解決方案,就連廣告成效報表都升級成珍貴的消費者洞察報告。

簡言之,我們相信隨著明年第四季 Chrome 淘汰第三方 Cookies 引爆,Data Clean Room 需求在台灣市場廣告代理商及大型廣告之間,勢必會形成一種剛需甚至成為品牌競爭的數據裝備競賽。要知道,好的 Data Clean Room 方案,除了基本資料保護、交換技術之外,更重要豐富、有意義、可形成行銷受眾策略的數據,期待台灣 Data Clean Room 的應用及觀念可以在2024年趕上全球市場的腳步,以應變後 Cookieless 時代數位廣告產業衝擊。(by BrickRichard