深圳「振華數據」:如何看待中國國企「監控資料庫」外洩的消息

  • 李翰文
  • BBC中文
振華數據的資料庫據報覆蓋約240萬人,包括多國軍方、政界、商界等人的資料。

圖像來源,Getty Images

圖像加註文字,

振華數據的資料庫據報覆蓋約240萬人,包括多國軍方、政界、商界等人的資料。

多家英國、印度、澳大利亞等地的傳媒早前報道,一家中國國有公司利用自動化技術,在網絡上搜集全球各國政界、商界等知名人士的資料,範圍更覆蓋他們的親友和關係密切人士,引起外界對中國情報搜集的關注。

澳洲廣播公司、英國《每日電訊報》、《印度快報》等媒體周一(9月14 日)發稿,引述一個從在越南富布賴特大學(Fulbright University Vietnam)任教的美國學者包定(Christopher Balding,又譯克里斯托弗·巴爾德或巴爾丁)那裏取得的資料庫,指這個由一家位於中國深圳的「振華數據」公司建立的資料庫,收錄了各地的政客、法官、軍官、商人、甚至影視明星的資料。

報道引起各界關注,一些評論認為這個資料庫顯示中國官方搜集和整理情報的能力。但同時有專家指出,資料庫內收錄的絶大多數都是公開資料,而編寫搜集網絡上公開資料的電腦程式也不是什麼難事,質疑事件是否如外界所言這樣敏感。

圖像來源,EPA

圖像加註文字,

資料庫收藏英國首相約翰遜等多國元首的資料,但大多為公開資料。

「振華數據」是什麼樣的公司?

這個資料庫稱為「海外核心信息數字庫」(Oversea Key Information Database),由一家稱為「振華數據」的公司開發。

振華數據的網站目前已被關閉,但BBC中文透過網站存檔服務,找到公司的網站。網站的介紹指這個資料庫有四部份,包括人物庫、機構庫、資訊庫和關係庫。網站顯示資料庫存有約240萬個人物的資料。

其中,網站介紹人物庫包含全球「軍、政、商、科技、傳媒、民間組織等領域的領袖及核心人物」,並包括他們在推特、臉書、領英(LinkedIn)、Instagram和博客平台的資料,拼合成個人檔案。

機構庫就包含「軍、政、商、科技、傳媒、民間組織等領域」的核心機構,資訊庫提供它們相關的新聞資訊。這個資料庫還會紀錄各個人物和機構之間的關係。

圖像來源,ZHENHUA / WAYBACK MACHINE

圖像加註文字,

振華的網站顯示資料庫收藏約240萬個人物的資料,網站目前已經關停。

編寫這個資料庫的振華數據母公司是振華電子集團,總部設於貴州省,貴州省國資委和同為國有企業的「中國電子」是最大股東。根據香港媒體報道,公司行政總裁是王雪峰,他曾經在美國國際商業機器(IBM)公司工作,也曾經在微信上表示支持利用數據發動「資訊戰」。

BBC中文透過振華數據的網站找到一位姓孫的聯絡人,對方形容有傳媒報道「無中生有」,但記者追問詳情後,對方就匆忙掛線。

中國官方至今仍未就振華數據相關的報道作出表態。 《印度快報》引述中國駐新德里一名外交消息人士指,中國未曾、也不會要求公司或個人收集或提供資料,但沒有說明中國官方與振華數據的關係。

這個資料庫是什麼?

向傳媒披露這個資料庫的美國學者包定在個人網站透露,他透過一個在振華數據的消息人士,取得資料庫的複製本,並在一家澳大利亞網絡安全公司Internet 2.0首席執行官羅伯特·波特(Robert Potter)的協助下分析,之後與多國不同媒體分享資料,讓他們跟進報道。

根據相關報道,澳洲總理莫里森、印度總理莫迪、英國首相約翰遜等政客的資料都被收錄在這個資料庫。

澳洲廣播公司指,資料庫似乎對軍官特別有興趣,例如一名被標紀為可能成為一艘美國航空母艦的軍官,資料庫內有他詳盡的升遷紀錄。報道稱,中國人民解放軍和共產黨都是振華數據的主要客戶之一。

資料庫並不單存有政要的個人資料,一些與他們有緊密關係的人也榜上有名。例如資料庫內除了載有英國首相約翰遜的資料外,也有他的大學同學古皮(Darius Guppy)的名字,同時被註明為約輸遜的「關係密切者」。資料庫有約240萬名人士的資料,包括最少5100萬名美國人、4萬名英國人、3.5萬名澳大利亞人、5000名加拿大人和500名日本人。

此外,有份參加報道的英國《每日電訊報》指,資料庫也收集了與英美軍艦行蹤的推特帖文,包括它們什麼時候停泊在什麼地方。

《每日電訊報》又舉例指,資料庫內軍火商英國航天系統的主席羅傑·卡爾(Roger Carr)的個人背景介紹,與英國航天系統網站對羅傑·卡爾的介紹一樣,顯示振華數據是透過英國航天系統的網站下載這筆資料。

報道傳出後引起外界關注中國搜集和整理情報的能力。英國保守黨議員西利(Bob Seely)表示關注,指振華數據這種做法是為了尋找每個人的弱點。

音頻加註文字,

"劍橋分析"風波:大數據比家人伴侶還了解你

澳洲廣播公司更引述一名看過這個資料庫情況的人員形容,這個資料庫是2016年劍橋分析事件的「加強版」。當年一家名為劍橋分析 (Cambridge Analytica)的英國公司,被指透過收集和分別臉書上個別用戶的數據,影響2016年英國脫歐公投和同年舉行的美國總統大選。

報道又引述當地學者漢密爾頓教授(Clive Hamilton)形容,資料庫包含的範圍廣泛,情況令人憂慮。「如果你是一個政客的14歲女兒,我們現在知道中國情報部門在監察你在社交網站說過的話,並把現在或將來可能有用的資料紀錄下來。」

Facebook發言人向BBC中文說,振華數據搜集資料的方式違反了它的使用條款,即使是公開資料也不可以這樣做。發言人又指Facebook已經將它封鎖,並要求對方停止相關行為。推特也指出,公司與振華數據並沒有數據分享協議。

圖像來源,Getty Images

圖像加註文字,

在網絡上保護自己的私隱不是一件容易的事。

向傳媒披露這個資料庫的美國學者包定(即克里斯托弗·巴爾德)曾經在北京大學匯豐商學院任教。2017年劍橋大學出版社曾在旗下的中國版網站,刪除300多篇在《中國季刊》發表的文章,之後撤回決定。

克里斯托弗·巴爾德當時曾經發起聯署,希望劍橋大學出版社和學術界面對中國審查時要挺身而出。

克里斯托弗·巴爾德在2018年離開北京大學匯豐商學院,指中國已經變得「令我感覺不能安全地當一個教授」。他同年轉到越南富布賴特大學。

影響到底有多大?

振華數據的資料庫引起爭議,但一些專家留意到資料庫內大多的訊息都是目標人物在網絡上公開的資料。澳洲政治評論網站Crikey記者基恩(Bernard Keane)形容,振華數據的工作只是公開來源情報搜集,與一般社交平台、市場推廣公司、廣告商等的工作沒有兩樣。

澳洲廣播公司的報道指部份資料似乎來自私人的銀行紀錄、求職申請和心理分析,又指相信振華數據從「暗網」取得某些資料,但沒有具體說明是哪些紀錄。

有份整理振華數據資料庫的網絡安全公司Internet 2.0首席執行官波特接受英國《衛報》訪問時說,西方國家對情報搜集工作有政府和媒體制衡,與振華數據建立「海外核心信息數字庫」的情況不能相比。

但澳洲資料保安媒體公司(Information Security Media Group)執行編輯柯克(Jeremy Kirk)認為,波特的說法是混淆了收集公開資料與截聽私人通訊。他接受BBC中文訪問時解釋,截聽私人通訊的確通常有司法機構制衡,但這與情報機構取得本來就是公開的資料不同。

柯克又透露他去年12月至今年1月已經透過一個網絡保安研究員取得這個資料庫,他說振華數據當時錯誤設定自身伺服器的保安系統,讓任何人都可以透過網絡搜尋器下載這個資料庫。

他強調自己只看過資料庫的一小部份,因此不排除資料庫其他部份藏有一些敏感資訊,但他所見大都是可以公開取得的資料。他接受BBC中文訪問時又解釋,從網站收集資料的技術已經有20多年歷史,技術上並不難做到。

柯克又指出,許多網站和平台都有提供類似的服務,例如總部設在美國的Pipl公司。根據這家公司的網站,它提供的服務包括搜尋與指定目標人士的個人資料、社交聯繫、聯絡資料等,目標客戶包括執法機構、保險公司、調查記者等。

但波特接受BBC中文訪問時指出,兩者無法相提並論。他說,振華數據的行政總裁王雪峰曾經發表支持「資訊戰」的言論,「取得這些數據後的目標,就是它們的分別」。