人工智能模型訓練數據引發不良內容及知識產權爭議｜財經

新聞/財經

熱門

即時

本地

兩岸

國際

財經

體育

立法會道一號

交通消息

來源：Pixabay

人工智能模型訓練數據引發不良內容及知識產權爭議

財經

發佈時間 2023-04-20 11:09 最後更新時間 2023-04-20 11:09

類似ChatGPT的人工智能大模型每日都引起新話題，最新引起關注的是訓練這些大模型的海量數據，大部份是互聯網上取得的，一方面這些數據可能涉及大量偏見、歧視、有害，以及侵犯名譽和隱私的內容，一方面亦觸及知識產權問題。

《華盛頓郵報》發表了與艾倫人工智能研究院合作進行的調查，他們拆解了Google的C4數據集，研究資料來自哪些網站。C4是許多知名英語AI大模型的訓練材料，包括Google的T5和Facebook的LLaMA，由於數據集中有三分之一的網站已經不存在，所以實際統計的數據大約為1000萬個網站。

結果顯示，提供數據頭三位的，是囊括全球專利信息的Google專利網、維基百科和訂閱制數字圖書館scribd。但之後出現意外的名字，包括被美國司法部查封的盜版電子書網站b-ok.org，位列190，以及其他至少二十多個因為侵犯版權被美國查封的網站。

另外，《魔獸世界》玩家論壇wowhead高居第181位，《赫芬頓郵報》創辦人阿里安娜·赫芬頓創立的行為轉變課程網站thriveglobal位居175位。創意產品眾籌網站kickstarter位列25，令人質疑AI向用戶提供的創意和市場營銷方案，很有可能本身就是現成的產品。超過50萬的個人博客亦收錄到C4訓練集中，作者顯然無得到任何報酬。

每日產生大量經審校內容的媒體，都是訓練集的最愛，紐約時報、洛杉磯時報、衛報、福布斯和赫芬頓郵報，都高居數據庫的頭10位。由於美國媒體的特性，所以訓練集中也能找到以極右翼、白人至上主義內容為主的網站，當中找到至少7.2萬個納粹的標誌性符號。

而社交網站Twitter的行政總裁馬斯克，就威脅控告微軟，指微軟非法使用Twitter的數據來訓練人工智能大模型。之前有報道指微軟會將Twitter移除出旗下的廣告營運平台。

微軟去年對開發ChatGPT的OpenAI投資100億美元，本身亦有開發自己的大型語言模型。利用社交網站數據訓練大模型十分重要，原因是當中包括一些非正式和互動的對話。但當這些人工智能模型由實驗室走進商業世界，數據的擁有人就提出知識產權的要求。

社交網站Reddit表示，會向利用Reddit內容訓練AI的軟件收費；環球音樂集團亦都指利用人工智能合成或模仿歌曲或藝人，是違反版權法例，以及集團和藝人間的合約。照片庫Getty Images亦都控告利用人工智能合成圖像的公司Stable Diffusion，指他們抄襲內容，訓練旗下的圖像生成模型。

上一篇：內媒指中移動否認尋求收購香港寬頻

下一篇：內地股市半日偏軟

更多新聞

廣州南沙全面撤銷限購　首個一線城市響應調整

財經 2024-09-28

在中共中央政治局會議明確要促進房地產市場止跌回穩，包括要調整住房限購政策後，廣州南沙區宣布，今日起調整房地產政策，購買商品住房不再審核資格，是新政策下首個全面開放限購的一線城市。南沙區住房和城鄉建設局發布通知，除商品住房外，符合條件的車位和車庫亦全面放開限購。當局指，措施是為更好滿足居民剛性住房需求，以及多樣化改善性住房需求，促進房地產市場平穩健康發展。

陳茂波訪問倫敦與金融界交流　冀加強合作

財經 2024-09-28

財政司司長陳茂波繼續在英國倫敦訪問，出席由商界組織圓桌會議，與當地20多名金融界領袖交流。陳茂波在會上介紹香港的經濟情況，指香港的金融市場不斷改革創新，在股票市場、資產管理、離岸人民幣業務、綠色金融和金融科技等方面，都取得不錯的進展。他又指，特區政府正積極鞏固和提升香港國際金融中心的地位，期待與英國的金融界加強合作，推動互惠發展。陳茂波其後出席英國香港工商協會舉辦的午餐會，指香港經濟穩步向前發...

美8月PCE指數按年升幅放緩至2.2%

財經 2024-09-28

美國8月個人消費支出物價指數（PCE）按年升幅放緩至2.2%，低於市場預期的升2.3%，亦是自2021年2月以來最低；按月升幅放緩至0.1%，符合預期。剔除食品和能源價格的核心PCE指數，按年升2.7%，符合市場預期，但高於7月份的2.6%；按月升0.1%，低於預期和前值的升0.2%。

人行下調常備借貸便利利率20個基點

財經 2024-09-28

人民銀行下調常備借貸便利(SLF)利率20個基點。隔夜利率調整為2.35厘，7天和1個月利率分別調整為2.5厘和2.85厘。

美股個別發展　道指上升137點

財經 2024-09-28

紐約股巿個別發展。科技股偏軟。道瓊斯工業平均指數再創新高，收巿報42313點，上升137點。納斯達克指數收巿報18119點，下跌70點。標普五百指數收巿報5738點，下跌7點。總計整個星期，納指上升1%。道指及標指上升0.6%。

紐約期油本周下跌5.2%

財經 2024-09-28

油價造好。紐約期油收巿報68.18美元，上升51美仙。總計整個星期下跌5.2%。

歐洲股巿上升

財經 2024-09-28

歐洲股巿上升。英國股巿收巿報8320點，上升35點。法國股巿收巿報7791點，上升49點。德國股巿收巿報19473點，上升235點。

美股初段靠穩

財經 2024-09-27

美股初段靠穩。道瓊斯工業平均指數報42479點，升204點。納斯達克指數報18208點，升18點。標普五百指數報5750點，升5點。

金管局報告：外圍因素續對本港銀行業構成挑戰

財經 2024-09-27

金管局發表貨幣與金融穩定情況半年度報告，指美國聯儲局今個月減降息50點子，香港的外匯及銀行同業市場交易繼續暢順有序。隨着2月下旬政府放寬相關政策，住宅物業市場一度改善，但其後回軟。展望未來，美國貨幣政策利率走向存在不確定因素，加上地緣經濟碎片化，將繼續對本港銀行業構成挑戰。銀行在管理這些風險因素對貸款組合的資產質素的潛在影響時，須保持警惕，並繼續保持充足的撥備額。報告說，本港經濟今年上半年保持...

深成指全日升逾6%　上交所股票競價交易一度異常

財經 2024-09-27

中央指明支撐經濟方向，人行減息降準今日實施，內地股市全日向好，深證成分指數升逾6%，收報9514點，升598點。上證綜合指數收報3087點，升86點，升近3%。兩市成交額14460億人民幣。創業板指升10%。上交所就股票競價交易一度出現異常致歉上海證券交易所早上開盤後，股票競價交易出現成交確認緩慢的異常情況，導致交易受到影響。經處理後，股票競價交易於11點13分起逐步恢復。上交所對今次異...