社交媒體如何洩露你的情緒走向

  • 朱爾斯·蒙塔古
  • (Jules Montague)
看手機的女人

圖像來源,Getty Images

你的Facebook時間線或Instagram相冊,就是你個人的心理健康數字晴雨表。

它並不隱藏在較為明顯的地方,比如表情符號、井號以及格言警句裏面。相反,它潛藏在一些你本身不知道的較為微妙的信號裏,就像醫生的血壓計和心率檢測儀一樣,可以對你的心理健康提供凖確的診斷。

對於一些用戶來說,社交媒體無非就是分享最新的貓咪視頻或旅行照片的地方,但是現在他們可能會對此結論感到驚訝。這還意味著社交平台蘊藏著重要的潛力,比如拯救生命。僅在美國,每隔13分鐘就有一起自殺事件。儘管如此,預判自殺想法和行為的能力在過去50年的研究中沒有實質性進展,預測精神病發作或抑鬱症發生面臨同樣的難題。

但是通過數據挖掘和機器學習,在社交媒體的海量碎片數據中提取信號,這一現狀正在被徹底改變。人們已經通過這些方法跟蹤並預測了流感的爆發。現在開始轉向應對心理疾病。

有研究發現,如果你患上了抑鬱症,你的Instagram就可能更會推送一些色彩更藍,更灰,更暗,人臉更少的照片。這些照片收到的讚會變少,但是評論會變多。你還可能會喜歡用"墨井"濾鏡,把彩色照片變成黑白照片,而不是用"瓦倫西亞"濾鏡提高亮度。

即便如此,單憑這些特點也不足以診斷或預判抑鬱症。不過,這對構建能夠預判抑鬱症的模型起關鍵作用。此時此刻,機器學習就派上用場了。

圖像來源,Alamy

圖像加註文字,

美國總統唐納德·特朗普推文經常使用比較樂觀語言。

哈佛大學和佛蒙特大學(University of Vermont)的研究人員最近利用這些技術分析了Instagram上近44000條貼文。由此得到的模型可正確識別70%的抑鬱症患者,而普通的醫生只能診斷出42%的患者。模型出現假陽性的比例也較低(不過這個數字來自另一批人,所以這樣比較可能不公平)。甚至在心理醫師作出正式診斷之前,用戶的訂閲內容中就已經出現明顯的抑鬱信號——這就讓Instagram成為某種預警系統。

長期以來,心理醫師認為語言和心理健康之間存在關聯,比如精神分裂症患者說話會前後脫節和離題,而抑鬱症患者會較多的使用第一人稱單數。最新的方法是把推特名字輸入AnalyzeWords。這是一個免費的文本分析工具,它會關注虛詞(代詞、冠詞和介詞)以分析情緒和思維模式。我最近在推特上發佈的1017個詞語表明我感到憤怒和擔憂,在積極情緒方面低於平均值——我最近確實對世界的狀況感到頗為悲觀。把@realdonaldtrump輸入AnalyzeWords,你會發現特朗普在積極情緒方面得分很高,因此他的擔憂、憤怒和抑鬱情緒可能低於平均值。

但是研究人員正在深入探究心理健康方面的問題,而不是這種對情緒和社交風格的快速、有時甚至很搞笑的測驗。(AnalyzeWords可以發現和平均值相比你是否偏向"山谷女孩(Spacy/ValleyGirl)")

可以反映出抑鬱症的信號包括負面詞匯("不"、"永不"、"監獄"、"謀殺")使用增加和正面詞匯("快樂"、"沙灘"和"照片")使用減少。但是這些信號基本上不具有決定性。美國哈佛大學、斯坦福大學和佛蒙特大學更進一步,從大約28萬推文中提取出許多特徵(心情、語言和語境)。由此得出的計算模型在判斷抑鬱症用戶方面得分很高,還正確預判了九成創傷後應激障礙(PTSD)。

圖像來源,Getty Images

佛蒙特大學的數學、自然科學和工科研究者和教授克里斯·丹弗斯(Chris Danforth)說,積極詞匯和負面詞匯的比例是模型內的關鍵預測變量。其他重要的預測變量還包括更長的推文字數。

丹弗斯強調說,研究只評測了一小部分特定人群,所以他認為該研究只是概念性驗證。但是他很樂觀。"這些研究結果以及其他類似的研究結果表明在線行為可以用來為診斷和篩查工具提供信息,"他說。如果加入生理信息(比如來自 FitBit和睡眠應用的信息),這些工具還可以產生更強大的力量。

機器學習對精神分裂症的預判凖確率平均可達88%,這種程度的成功率只有通過人機協作才可能實現。

應該如何處理所有這些信息?賦權可能是一個良好的開端。微軟研究院的一個團隊成功預測了哪些懷孕的媽媽有可能性情舉止大變,這一切都基於她們分娩前和分娩後早期的推特使用情況。她們分娩前後的抑鬱和焦慮獲得的診斷並不充分。不過,研究者也強調他們的目標並不是取代傳統的診療和預判方法。但是,設想一下,如果待產婦女嘗試在智能手機上運行這類預測模型,又會怎樣。她們可以通過手機應用獲得"產後抑鬱風險值"以及相關資源信息,還有在需要時獲得急救幫助。

不過,這個領域仍然比較保守,特別是關於隱私方面。假如你心理健康留下的數據痕跡公之於眾,該怎麼辦?你可能會被醫藥公司盯上,或者遭遇僱主、保險公司的歧視。除此之外,此類項目有一些並不受制於臨牀試驗接受的嚴格倫理監管。用戶常常並不知道他們的數據被挖掘。隱私和互聯網倫理學者邁克爾·齊默(Michael Zimmer)曾解釋說:"社交媒體上有一些私人信息以某種方式被呈現出來,並不說明人們可以輕易獲取並公開這些信息。"

圖像來源,AnalyzeWord

圖像加註文字,

AnalyzeWords通過研究你在推特上的用詞,來評估你的心理狀態。

對於這個美麗新世界,還需要加上一些限制。2013年,谷歌流感趨勢工具(Google Flu Trends)大幅高估了流感的高峰值。哈佛的一個研究團隊責怪大數據的傲慢(Big Data Hubris)稱:"它常常帶有隱性的預設,認為大數據可以取代傳統的數據收集和分析,而非為後者的補充。"

數據挖掘和機器學習也有助於提早發現心理健康問題。目前,從抑鬱症發作到與治療提供者接觸要花6至8年的時間。而焦慮症要花9至23年。接下來,我們有希望看到改善。目前全球有20億用戶經常使用社交媒體——這是這些方法可以推廣使用的基礎。正如馬克·扎克伯格(Mark Zuckerberg)在近期規劃Facebook的人工智能時寫道的:"世界曾發生過極為悲慘的事件——比如自殺,其中一些還進行了直播——這些原本是有可能避免的,前提是有人提前意識到這些人發生了什麼,並及早報告。"

心理健康存在於看醫生之前和之後的現實生活中,症狀也會隨時發生變化。網帖、圖片和推文能暴露個人的心理健康狀態,也許利用網絡也能促進心理健康的預測、診斷和康復。

請訪問 BBC Future 閲讀 英文原文