| 群眾外包 ── AI 開發及準備資料集最有效的方法 「群眾外包」:請廣大網民幫忙完成工作! 所謂群眾外包 (crowdsourcing),是由 crowd (群眾) 及 sourcing (找出特定資源、業務委託) 組合而成的新詞,也就是將業務對外委託給非特定的多數人。而群眾外包公司 (或平台) 則是指透過網路,在委託人及被委託人之間建立起配對或仲介的關係。和以往企業常見的外包業務相比 (如外聘法律顧問、外發會計記帳等),群眾外包委託的對象非常廣泛,包含學生或是自由工作者,企業可以依需求來徵求各種人力。 例如,透過群眾外包的方式來設計公司 LOGO,委託方 (公司) 可以選擇喜歡的設計,再向製作者 (被委託者) 購買。此外,需要大量輸入資料的事務性工作也會使用群眾外包來節省內部人力。 利用群眾外包來協助 AI 的開發 在準備 AI 訓練用的資料集時,經常會使用群眾外包。例如,要開發讀取影像後自動識別出商品名稱的 AI,就需要準備大量的商品影像,而且每張影像都要有對應的商品名稱作為標籤 (答案)。 如果既有的影像沒有用商品名稱做管理,就必須找人來做標記,這時群眾外包就能發揮作用。透過群眾外包,可以委託很多人同時進行作業並在短時間內完成,而且不會耗費公司內部的人力,因此可以讓寶貴的工程師進行更重要的工作。 知名的群眾外包案例:ImageNet 美國的 ImageNet,就是一個透過群眾外包建立大型影像資料庫的知名案例。這是一個對成千上萬影像進行標記的專案,該專案在 2009 年時就已經展開,為日後的 AI 影像辨識研究奠定了重要的基礎。 透過群眾外包,ImageNet 已經有超過 1,400 萬張加上標籤的影像,這些精心標記的影像資料集,也被應用在 2010 年開始的影像辨識競賽 ILSVRC (ImageNet Large Scale Visual Recognition Challenge),對現在的 AI 技術發展有很大的貢獻。 在 ImageNet 專案中,透過群眾外包標記影像時,針對工作流程做了一個特別的設計。工作者在標記影像時,並非一一回答影像的內容為何,而是透過二選一的選項來作答,這樣比較不容易發生輸入錯誤。為了確保最終的資料集品質,每個人都要透過這樣的流程來完成標記。 本文節錄自AI 大局:鳥瞰人工智慧技術全貌,重塑 AI 時代的領導力一書。 |
