跳到主要內容

為什麼臉書問你看過哪些電影?

最近不斷改版的臉書(Facebook)開始不斷主動收集使用者資料,例如你看過什麼電影、電視節目、音樂與書籍。這些資料看起來沒有什麼,但其實背後隱藏很大商機。美國最大影片出租以及影音線上串流公司Netflix,今年2月推出了第一部自製影集〈紙牌屋〉(House of Cards),不僅迅速攻上收視率之冠,更在 IMDb上得到15000個評分者平均9.0 的高分,可以說是叫好又叫座。這件事情類似「7-11不靠任何食品代工廠,自行研發並推出自有品牌,最後完全擊垮所有既有品牌」,基本上就是一家公司跨足看似不相干的多角化並且獲得巨大成功的個案。但故事背後的本質遠非如此。

Netflix原本是DVD出租的生意,本質上是通路商;後來做了線上影音串流服務,則變成網路公司。這麼一家專擅於通路經營以及網路服務的公司,理論上無法與傳統製片公司的製作水準相提並論──不用說製作影集本身就有高度門檻,即使找得到最好的劇本、導演、演員拍出好影片,也不見得能賣座。Netflix能完成難度這麼高的多角化,其實依靠了經營線上影音串流服務所得到的大量資料。Netflix 全球使用者超過 2500 萬人,平均每天有300 萬次搜尋、 3000 萬次的點擊、播放、暫停、快轉、回播,同時有400 萬次評價。這樣的數據,叫做大數據(Big Data,又譯海量資料、巨量資料),其特點是:Volume(大量)、Velocity(快速)、Variety(多樣)以及Veracity(真實)Netflix掌握了觀眾的背景資料以及所有收視細節,這些乍看之下沒有結構化、沒有邏輯歸屬的資料,經過各種統計處理,就可能找出某些規律與法則

我在Blog上曾經寫過一篇文章〈先射箭,再畫靶心〉,談的就是這種不先預設結果而去找資料應證或者否證,反而是先分析資料的做法。在學術研究上這種做法或許可能帶來爭議,但在實務上,反而沒有比這更務實的做法。但要能真正從大數據中撈出有意義的資訊,卻並不是容易的事情。首先,像這類非結構化資料的特徵就是:資料幾乎沒有標籤化。一方面,大數據中資料與資料之間的連結非常薄弱,要想辦法建立連結本身就是困難的事情;另一方面,即使想出如何建立連結的方式,要演算這些動輒數千TB的資料也絕非易事

目前在網路世界得以收集大數據的公司可以分為兩種商業模式,一類如Netflix、亞馬遜書店(Amazon)能直接將消費行為變成資料庫,另一類如臉書、Google無法直接得到消費者行為的資料。第一類企業相對容易運用資料庫獲利,因為所有的消費者背景與消費者行為全部都在資料庫裡面,這些企業太容易投其所好。第二類企業賺的是廣告商的錢而非使用者的錢,因此要促使消費者願意點閱廣告,增加平台對廣告的影響力,那就不是容易的事情,因為太過間接。第一類企業比第二類企業容易成功,事實上第二類企業目前也只有Google看起來持續取得成功。

老實說,我一直認為臉書這家公司的資料處理能力極有問題。臉書是全世界最大型的社群網站擁有極端海量的資料,多數使用者的生活細節在臉書工程師面前根本毫無遁形。然而,臉書居然能不斷推出讓使用者更加惱火的新介面與新廣告模式,某種程度也十分讓人不得不讚嘆這些拿了超級高薪的管理者與工程師簡直是比華爾街金融業更肥的肥貓一族。現在臉書終於恍然大悟,不管收集再怎麼多食物的遺照、空泛的生日祝賀以及各種關於日常瑣事的抱怨,他們還是弄不懂消費者到底喜歡什麼!這真又是個讓人讚嘆的高深結論。於是臉書得出一個結論,就是他們必須從每個消費者實際消費過的商品中找出規則,才能針對每個人推出具有影響力而且不讓人發怒的廣告。這也就是臉書這次改版的主要動機,千萬不要誤以為他們只是想讓你的朋友們知道你看過什麼電影。

自由主義的最大假設之一,資訊透明化。大數據使得資訊越來越透明化──對於企業而言──但對於一般人而言,大數據並沒有帶來更多對世界的理解。我們透過數據為世界理解,一切行為都化約成編碼;不論你認為這是好是壞,這件事情都正在發生。當你點下臉書大量關於電影、影集、音樂與書籍的資訊時,你得理解你正在將自己的行為化成臉書的現金。假設臉書的工程師終於能處理這些資料並且開始說服廣告商他們的實力不遜於Google。

喔,以下這段話得給臉書的工程師。如果你們真的願意做出什麼努力,好歹修改一下自動加入詐騙盜版社團的規則,拜託,你們真的不知道被動加入這些社團有多讓人厭惡嗎?

延伸閱讀
坐擁 Big Data,Netflix 拍胸脯保證:只要是我推的影集一定會大賣!
Netflix是如何用大數據捧紅「紙牌屋」的
美國線上影音影集「紙牌屋」一炮而紅解開Netflix擊敗HBO的成功密碼
Netflix analyzes a lot of data about your viewing habits

這個網誌中的熱門文章

[影評]攻敵必救──你想二刷,是因為劇本太弱

《攻敵必救》(Miss Sloane, 又譯槍狂帝國、斯隆女士)是2016年的政治驚悚片。本片成本1300萬美金,最後票房300萬美金,屬於慘賠;IMDb拿到7.3分、爛番茄新鮮度71%,評價普普。本片女主角潔西卡崔絲坦(Jessica Chastain)提名金球獎最佳女主角,除此以外沒有得到什麼重要獎項肯定。
對於這麼一部票房不佳、評價普普的電影,其實我沒有太大興趣寫評論,但從去年上映至今,我至少在我的FB上看過三個人強力推薦此片,認為此片是去年最優秀的電影之一、奧斯卡居然完全不提名真是太奇怪了云云。同時,也有許多人表明想二刷該片。
為什麼這麼多人想二刷呢?這是個有趣問題。
先說我對這部電影的結論好了。這是一部劇本很差的電影,沒有入圍奧斯卡很正常。唯一可以討論的,可能是最佳女主角這個獎項(但她也提名金球獎了),其他大獎根本想都不用想。這部電影的故事其實並不差,但是劇本有很嚴重的硬傷,本片導演也完全無法挽救。到底《攻敵必救》有哪些硬傷呢?

台北市房價崩盤只是時間問題

引言──如果你還認為台北市房價還有空間上漲.....

前陣子Facebook上有張圖被廣為轉載,大致內容是台北市房價租金比(Price Rent Ratio, PRR)為64倍,位居全球之首。房價租金比的計算公式是「房屋總價格/年租金」,意思是:房子的價錢足以讓人租幾年。實際租屋價格被視作是實質住宅供需的合理價格,消費者物價指數(CPI)中也是計算租屋價格(在台灣權重約佔20%),因此台灣近十年年台灣房價雖然飆漲但CPI上升的幅度並不大,原因之一就是租金幾乎沒有成長。正因為租屋價格代表需求的合理價格,因此房價租金比越大就表示房價背離合理價值越遠。然而,倍數在怎樣的位置算是合理呢?一般而言二十年是合理的位置,意思是說:當一棟房子的價格相當於二十年租金時,不如就買下來吧

但為什麼是二十年呢?扣掉二十歲到二十五歲之前由父母扶養不論,成人能工作的時間大約是三十年,然而卻需要住五十年的時間──這樣看起來似乎表示二十倍似乎很少?然而房子的價格理受時間因素而折舊(這是重要的問題,後文會有更詳細的分析),新成屋五年價格開始下滑,三十年之後降價幅度非常小幾乎停滯。再加上人生有很多不同階段,例如結婚者可能在新婚時需要住雙人套房,成為四人家庭時需要標準的三房兩廳,退休後又只需要住雙人小房;單身者則可能需要工作時期市中心的單人套房以及退休後的寬敞景觀宅。房子是一個人生活的延伸,人的生活會隨時間改變,房子當然需要改變。更不用說房子裝潢大約十年一換,換裝潢的時候往往也是人生轉折時,許多人更會趁此時換屋。考慮這些因素,我們應該理解的結論是:所謂「合理」的PRR倍數並不是一個固定的數值,而跟一個國家人民的生活模式有很大關連。同時我們也必須理解的是:即使合理PRR倍數並非固定,卻也有一定範圍,那跟人的生活模式改變、房子本身折舊有關──因此合理倍數,大約十年到三十年之間

全球房地產指標(GlobalPropertyGuide, GPG)這個網站(見延伸閱讀)列出了全球85大城市的PRR,其中就有72個城市落在剛剛提到的10~30倍之間,超出40倍的城市只有3座。從這角度看來,我想各位應該可以理解台北市的房價有多誇張,64倍幾乎是一個人成年之後到死亡的完整時間,其中我們只有一半時間能工作,可能有三次以上的重要人生時期轉折;而房子的殘值也將在三十年之間不斷下滑,五十年之後除了等都更重蓋之外幾乎沒有能真…

一個作家之死:林奕含三個層次的幻覺破滅

林奕含自殺的火藥庫,來自於「被老師誘姦」以及「沒有愛的家庭」;這兩者一樣重要,缺乏任何一者,林奕含走上絕路的機率都會大大降低。這兩點,很多人拿來分開談,但我認為重點是這兩件事情發生在同一個人身上時候的交互作用。

「被老師誘姦」這件事情,在心理上真正造成的創傷,跟自尊有關。林奕含的斯德哥爾摩症候群,完全就是一種透過合理化手段來防止自尊受傷的「防禦機制」,只有林奕含承認「我愛他」,才能避免知覺到「自己受騙」、「自己被對方輕視」、「對方根本不在乎自己」。

然而,沒有一個人,能夠長期透過防禦機制矇騙自己。合理化機制像是一種止痛劑,雖然你吃了之後暫時不痛,但是痛因沒有解除,你就得一直吃下去。但這個止痛劑並非沒有副作用。每個人的生活世界都很廣,你會遇到各種人事物,總有一天會碰到跟你相近的故事。一次、兩次、三次之後,這個止痛劑會越來越沒有效果。

這件事情很嚴重嗎?其實還好。說穿了,就是「幻滅」。