我們該用社交資料做研究嗎?

   
2015-01-21

我們該用社交資料做研究嗎? | 文章內置圖片
(圖/取自網路)

 

快速和低廉是利用社交媒體來研究人們的想法和行為的巨大優勢,因此許多行為科學家們都急切地希望通過它來開展研究。而當下日益壯大的社交媒體群,也因此成為了行為科學研究者的資訊「寶庫」。但卡內基梅隆大學和邁吉爾大學的電腦科學家們,對這種想法提出了質疑:這些來自社交媒體的大量資料,可能會誤導行為學的研究。

       

 

卡內基梅隆大學的於爾根•菲費爾(Juergen Pfeffer)與邁吉爾大學的德里克•魯茨(Derek Ruths)認為,來自推特(Twitter)和其它社交媒體的資訊中存在固有的偏見,行為科學家們需要尋找到一個可以糾正這些偏見的方法,或他們至少要承認這些通過社交媒體資訊所得的資料是存在缺陷的。

       

 

這不是一個微不足道的問題。卡內基梅隆大學軟體研究所助理研究教授菲費爾和邁吉爾大學電腦科學系助理教授魯茨指出:在5年前,我們還幾乎沒有社交媒體這個資料來源,但目前,每年會有成千上萬篇的研究論文是基於社交媒體所提供的資料的。

       

 

「並非所有的大資料都可以作為很好的研究基礎。」菲費爾說。很多研究者認為通過收集一個足夠巨大的資料庫,就可以克服資訊中可能存在的偏見或者曲解的缺陷。雖然,研究者很難抗拒使用社交媒體作為研究資料來源的欲望。「人們想要說一些關於世界上正在發生的事情,那麼,社交媒體就是一個很好的管道。」菲費爾說道。例如,在2013年的波士頓馬拉松爆炸事件後,菲費爾在短短兩周內收集到了2500萬條與事件相關的微博。儘管這樣可以免費得到數以萬人的行為學資料,但仍需強調:「行為學研究中還是那句老話—瞭解你的資料。」

       

 

研究者會利用社交媒體研究一些很令人矚目的問題—比如想知道人們怎麼看待電子煙,人們是如何交流表達自己對於糖尿病的焦慮的,或者阿拉伯之春的抗議行動是否可以預測。現在,社交媒體已經可以作為這些問題的資訊源。

 

 

社交媒體常常使用專利化的演算法來生成或過濾他們的資料流程,同時,他們在改變這些演算法時也不會提示其它人。所以在使用社交媒體的資訊進行研究時,資料樣品採集的缺陷也就無法得到解決。雖然某些研究者與個別社交網站有特殊關係,因此可以瞭解到網站內部的工作情況;但大部分研究者對網站這些演算法的操作是一無所知的。魯茨和菲費爾認為,隨著這些「嵌入研究者」的增多,會逐漸導致研究社會媒體的群體發生兩極分化。

       

 

每一位使用社交媒體的人都知道,這些網站裡的每一個帳號,並非都是由現實中的某人在使用。還有些帳號是專業作家或者公共關係代表的,他們使用社交媒體是為了代表名人或者公司。有些帳號僅僅是「僵屍」帳號,還有時「關注數」還是可以用錢買到的。社交媒體網站試圖鎖定和消除這些虛假帳戶,那些在2013年註冊的Twitter帳號,有一半已經被刪除。但是對於形單影隻的研究者來說,從一個資料庫中發現這些無效帳戶是十分困難的。

       

 

「進行現實社會科學研究的人,大多可以意識到這些問題。」菲費爾說。他認為,通過使用如流行病學、統計學和機器學習等已經存在的技術,可能可以幫助解決這些難題。當然,在其它的一些情況下,為了處理和分析資訊中的偏見問題,科學家們還需要開發一些新的技術。

 

 

【101創業大小事/整理報導】

 

 

免責聲明:

部分圖片、觀點,來源於網際網路及其他網路平台,主要目的在於分享訊息,讓更多人獲得需要的資訊,其版權歸原作者所有。如涉及侵權請告知,我們會在24小時內刪除相關內容。

 

 

 

客服信箱:[email protected]

手機版 Copyright © 101多媒體科技事業群 All Rights Reserved.