91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

當廉價勞動力成為機器的感官,AI企業(yè)如何管理“認知勞工”

2022-12-01

勞動形式和狀況正在發(fā)生劃時代的改變。

 

01 有多少智能,就有多少人工

 

1970年,奧地利宮廷中,發(fā)明家Wolfgang von Kempelen為取悅瑪麗亞·特蕾莎女大公,宣稱將表演一場史無前例的魔術。魔術內(nèi)容是一種可以自動下棋的機器裝置,被稱作「The Turk」(土耳其行棋傀儡)。這臺機器被雕刻為人形,身著土耳其長袍,坐在一個帶有棋盤的木制櫥柜之后,仿佛真的具有人類的智慧與生命。

 

Kempelen宣稱這臺機器可以打敗任何皇室成員,一位宮廷謀士應戰(zhàn),果然不到30分鐘就被擊敗。而后的十年,Kempelen帶著「The Turk」游離整個歐洲并取得了驚人的戰(zhàn)績,據(jù)傳說他的手下敗將甚至包括本杰明·富蘭克林(Benjamin Franklin)和拿破侖。直到1857年,《國際象棋月刊》才發(fā)文揭露,贏過所有人的并非這臺機器,而是藏在櫥柜中的象棋高手。

 

「The Turk」橫截面示意圖/圖片來源:維基百科詞條—土耳其行棋傀儡

 

2005年,亞馬遜推出平臺Amazon Mechanical Turk。彼時,亞馬遜正在將CD碟片引入自家的產(chǎn)品線。亞馬遜希望通過該平臺,借助小額的經(jīng)濟激勵招募網(wǎng)友為其工作,幫助檢查上架的CD專輯名是否正確,并審核封面是否適合未成年人瀏覽。這種借助人的認知能力作為生產(chǎn)工具的方式,如今正在成為一項超過千億規(guī)模的商業(yè)模式。

 

2022年,中國人工智能核心產(chǎn)業(yè)規(guī)模超過4000億,企業(yè)數(shù)量超過3000家,從事數(shù)據(jù)標注的勞動人口超過千萬。數(shù)據(jù)標注員就是這個時代,藏在AI背后的“象棋高手”。

 

02 Easy on Humans,Hard on Bots

 

(對人來說簡單,對機器卻困難)

 

隨著時間的推移,大眾對于機器越來越“智能”的現(xiàn)實早已習以為常。但對于機器是如何借助人的“智能”被設計、被訓練與被驅(qū)動卻知之甚少。

 

“人工智能”即機器模仿人的方式進行認知,這種認知訓練需要依靠大量可被機器識別的數(shù)據(jù)不斷地進行“喂養(yǎng)“。例如,人工智能并不能天然識別出圖片上出現(xiàn)的人臉,只有當人臉的關鍵點位被按照機器程序設定的方式標注出來之后,計算機才能建立起對人臉的認知。數(shù)據(jù)標注師的工作,就是按照特定的方式及規(guī)范在原始數(shù)據(jù)上標注出需要被機器學習的數(shù)據(jù)內(nèi)容。

 

依據(jù)算法應用途徑的不同,數(shù)據(jù)標注工作的類型也是多種多樣的。常見的類型有分類標注(從既定的標簽中選擇數(shù)據(jù)應當對應的類型)、標框標注(在圖片中框選出特定目標的位置)、區(qū)域標注(標注圖片中某個特殊區(qū)域)、描點標注(如人臉中的關鍵點位標注)和判斷類標注(如判斷語音素材的表意是否一致等)。而這些工作都無一例外會應用到我們作為人的“默會知識”。

 

標框標注 圖片來源:Quora

 

描點標注 圖片來源:網(wǎng)絡

 

默會知識的概念由英國哲學家波蘭尼(Michael Polanyi)于1958年在《個體知識》一書中提出。默會知識指一種通過實踐、經(jīng)驗而獲得的知識,難以用語言、文字或數(shù)字進行表達。其本質(zhì)是一種理解力、領悟力和判斷力的結(jié)合,即人的認知。

 

例如,人類擅長從模糊的照片中挑選出特定的物體,因為人類有一種方法可以將事物與其存在的背景進行區(qū)分。這種能力被應用于區(qū)分人和機器的“驗證碼”,雖然看起來都是極為簡單的問題,但卻需要調(diào)動人的“默會知識”,而這一點對機器來說卻非常困難,這也是驗證碼體系成立的前提。

 

為數(shù)據(jù)打上標簽是一種只需培訓很短時間就可以上手的簡單勞動(一般半天-1天,訪談中最多的為2天),標注員不需要掌握任何ICT(Information and Communication Technology)專業(yè)知識。在作者進行田野調(diào)研的團隊中,標注員常常自嘲“這個工作小學生都可以做”。某種程度而言,數(shù)據(jù)標注員在勞動過程中的作用與流水線工人、麥當勞服務員是相似的。

 

區(qū)別在于,勞動者不再是機械化流水線的一環(huán),而是成為幫助機器分辨和接受外界信息的感覺器官。

 

03 管控認知勞動的三個步驟:標準化、反饋與認知加速

 

在工廠生產(chǎn)中,提升勞動率的核心主要集中在提升人工的機械勞動效率,以獲得與機器更高的配合速率,因此標準化的勞動規(guī)范與管理能最大程度實現(xiàn)這一效果。但是,當人的智能成為成產(chǎn)工具,傳統(tǒng)的管理方法則日漸失效,因為人類的認知方式千差萬別。

 

具體到數(shù)據(jù)標注工作,正因為計算機無法識別現(xiàn)實的復雜可能性,才需要勞動者調(diào)動“默會知識”來補充機器認知的不足,所以對標準化的過分強調(diào)甚至可能會阻礙勞動者對認知的充分發(fā)揮。

 

作者及研究團隊在進行田野調(diào)查中發(fā)現(xiàn),認知勞動管理的核心在于推動勞動者認知模式的轉(zhuǎn)換——從人類的自然認知模式轉(zhuǎn)化為計算機需要的產(chǎn)生式認知模式。因此,盡管數(shù)據(jù)標注工作的難度并不高,但提升勞動效率卻遠比想象中困難。

 

從田野調(diào)查的實踐來看,推動認知模式的轉(zhuǎn)變,需要經(jīng)歷以下幾個步驟:

 

(一)認知標準化:從規(guī)則制定到實踐練習

 

未經(jīng)訓練的數(shù)據(jù)標注員,頭腦中持有的都是關于外在世界的自然認知,并呈現(xiàn)出模糊、含混、雜亂等特征。以哆啦A夢的圖片為例,可能會產(chǎn)生貓、機器人、機器貓等不同判斷,難以滿足算法模型需要的“標準數(shù)據(jù)”。因而,推動標注員認知模式轉(zhuǎn)化的首要環(huán)節(jié)就是認知標準化。

 

管理方通過兩種不同方式來完成,首先是用書面文件約定《標注細則》,設定一定的認知標尺。通過事無巨細的流程標注來指導標注員們的具體勞動。但文件不能窮盡現(xiàn)實中的所有情況,而針對文字內(nèi)容的理解本身也存在不小的認知差異?;诖?,管理方又進行了標注培訓。通過標注示例的演示,來統(tǒng)一認知。但管理方對培訓卻并未報有過高的期待,單次、單純的講解培訓并不能使標注員完全消化和掌握細則,還需要在實踐中逐步練習。

 

(二)認知反饋:多重反饋機制的建立

 

當標注員們領會了管理方的要求后,他們就要開始在實踐中調(diào)整自己的認知模式。但這并非是由意愿能決定的活動,因而及時的反饋(調(diào)研顯示,一般為培訓后的3-4天內(nèi))就變得重要。管理方不僅要求標注員在工作中及時反思,發(fā)現(xiàn)認知偏誤,還鼓勵其隨時與管理方進行溝通,反饋出現(xiàn)的問題。

 

此外,管理方也鼓勵標注員同事之間就工作中的問題提出討論。在及時反饋與討論中,標注員們的認知行為逐漸走向統(tǒng)一。而在勞動中,對于標注員的錯誤,管理方也會以略帶懲罰性的公示或批評等形式警示犯錯者的同時,也一同提醒并修正其他標注員們的認知。

 

基于反饋與溝通在推動認知改變過程中的重要意義,被調(diào)研團隊的管理方也提到了在招聘標注員時,善于溝通和表達的候選者往往更受歡迎。

 

(三)認知加速的雙重策略:遏制主觀認知與重復操作

 

認知勞動的推進是個繁復、波折的過程。在認知標準化和認知反饋的過程之后,還需要認知加速來推動標注員最大程度提升認知系統(tǒng)的轉(zhuǎn)化。在作者進行調(diào)研的團隊中,認知加速主要依賴以下幾個策略。

 

第一,是標注員全面遏制自身主觀認知,拋棄對標注細則和計算機邏輯的所有猶疑。有標注員在訪談中提到,在這一階段,當面對自己不能非常理解的矛盾時,她會立刻進行自我遏制:“不要想那么多!”,有經(jīng)驗的標注員也會給出建議“你不要總想著自己在圖片上看到了什么,要根據(jù)規(guī)則去想機器能識別到什么”。

 

第二個策略是標注員通過持久而快速的重復操作,加快自身的認知反應?!斑^一段時間就會發(fā)現(xiàn),它就是一個簡單的重復性勞動,一定要耐得住性子,不要想太多?!眻F隊中速度最快的標注員這樣總結(jié)自己的心得。在認知心理學理論中,認知行為的不斷重復能夠有效刺激動物的認知反應速度,強化學習行為,并將一系列原本需要思考才能實現(xiàn)的知識與技能轉(zhuǎn)變?yōu)閼T性下的無意識操作。該策略與這一理論不謀而合。此外,管理方還通過漸進地增加標注額度等辦法,促進提升團隊的整體速度。

 

在人工智能數(shù)據(jù)工作的場景下,管理者從對勞動者身體層面的物理控制,過渡為推動認知層面的思維轉(zhuǎn)變。對管理者而言,一方面要借助人類的自有認知,讓其發(fā)揮“默會知識”,另一方面又要規(guī)范勞動者的認知,使其按照機器需要的方式進行。因為管理方需要在這兩者間尋求平衡,所以認知勞動者所面對的勞動管理與控制也不再僵硬、刻板,而愈加呈現(xiàn)出靈活、深入的特征。

 

04 勞動異化與隱蔽的對抗

 

在日復一日的機械重復和相對廉價的經(jīng)濟收獲中,大多數(shù)進行簡單勞動的數(shù)據(jù)標注員都或多或少產(chǎn)生了獲得感的缺失(作者所調(diào)研的標注團隊中,56%為外包員工,工資4000~5000/月;30%為實習生,酬金100~200/天)。

 

“做這個是學不到任何技術的,每天都做一樣的活兒,長期這樣不動腦,腦子會生銹的?!边@是一種典型的感受,在這種情況下,勞動者們往往會把這份工作當作特定時期的過渡,而不愿投入過多熱情。同時,他們也會采取偷懶、“摸魚”等方式來爭取更多自由的空間,以對抗一種作為“機器感覺器官”的異化體驗。

 

而面對管理方嚴苛的定額要求時,他們也會采取聯(lián)合限制產(chǎn)量等更加隱蔽、柔和的對抗方式。而來自產(chǎn)品經(jīng)理、算法程序員、標注組長的三方共同管理模式,也在一定程度上會對標注員們的工作帶來困擾。高流動率是數(shù)據(jù)標注行業(yè)人員管理所面臨的另一個重要難題。管理者雖然能在短期內(nèi)獲取盡可能多的剩余勞動,但很難從長期角度阻止勞動者的主動逃離。

 

為應對這些問題,我們可以看到近年來數(shù)據(jù)標注行業(yè)雇傭的勞動力群體正在從一二線城市向經(jīng)濟欠發(fā)達地區(qū)轉(zhuǎn)移。雖然可以一定程度上依靠經(jīng)濟利益吸引一部分較為穩(wěn)定的勞動力,但勞動者群體普遍教育背景的降低也會帶來認知轉(zhuǎn)化管理難度的增加。

 

人類學家瑪麗·L.格雷(Mary L. Gray)和計算機科學家西達爾特·蘇里(Siddharth Suri)在《銷聲匿跡:數(shù)字化工作的真正未來》一書中提到了這樣的觀點:自動化的最大悖論在于,使人類免于勞動的愿望總是給人類帶來新的任務。而在技術走向自動化的漫長歷史中,很關鍵的一點是對臨時勞動力的依賴。

 

今天的人工智能數(shù)據(jù)標注員群體,就是當下發(fā)展中臨時勞動力的最新迭代。在這一前沿,臨時工的高峰和低谷不斷轉(zhuǎn)換,這重新定義了人類和機器的關系。而在人與機器的動態(tài)關系中,如何掌握身為人的主動權(quán),對抗機器異化是每一個勞動者時刻面對的現(xiàn)實,也是管理者應當在各方平衡中需要謹慎面對的問題。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com