大模型與AI標(biāo)注工具幫助電商平臺(tái)文字生成標(biāo)注、圖上文案摳圖、AI視頻打標(biāo),商品素材生成效率較人工提升千倍,內(nèi)容制作成本降低超30%,破解了電商行業(yè)商品識(shí)別效率低、倉(cāng)儲(chǔ)分揀自動(dòng)化不足、個(gè)性化推薦精準(zhǔn)度差等痛點(diǎn)……
在人工智能產(chǎn)業(yè)風(fēng)起云涌之際,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也乘風(fēng)起航,不斷加速創(chuàng)新發(fā)展。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)進(jìn)入快速發(fā)展期
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、分類(lèi)、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)對(duì)于提升數(shù)據(jù)供給質(zhì)量,推動(dòng)人工智能創(chuàng)新發(fā)展具有重要支撐作用。
去年年末,國(guó)家發(fā)展改革委等部門(mén)發(fā)布《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見(jiàn)》,提出到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專(zhuān)業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長(zhǎng)率超過(guò)20%。
目前,我國(guó)已建成四川成都、遼寧沈陽(yáng)、安徽合肥、湖南長(zhǎng)沙、海南??凇⒑颖北6ê蜕轿鞔笸?個(gè)數(shù)據(jù)標(biāo)注基地,7個(gè)數(shù)據(jù)標(biāo)注基地?cái)?shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè),賦能121個(gè)國(guó)產(chǎn)人工智能大模型研發(fā),引進(jìn)和培育標(biāo)注企業(yè)223家,標(biāo)注從業(yè)人員達(dá)5.8萬(wàn)人,帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過(guò)83億元。
日前在2025數(shù)據(jù)安全發(fā)展大會(huì)上發(fā)布的《2025高質(zhì)量數(shù)據(jù)集研究報(bào)告》顯示,隨著人工智能、大模型技術(shù)迭代,我國(guó)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)產(chǎn)值已突破80億元,高質(zhì)量數(shù)據(jù)建設(shè)進(jìn)入規(guī)?;?、規(guī)范化發(fā)展新階段。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)賦能效應(yīng)顯現(xiàn)
近日,國(guó)家數(shù)據(jù)局發(fā)布了一批數(shù)據(jù)標(biāo)注優(yōu)秀案例集,從助力人工智能、低空經(jīng)濟(jì)等新興產(chǎn)業(yè)加快發(fā)展,到推動(dòng)油氣勘探、礦山巡檢智能化轉(zhuǎn)型,再到賦能基層治理和信息無(wú)障礙建設(shè),數(shù)據(jù)標(biāo)注產(chǎn)業(yè)正加速賦能千行百業(yè)轉(zhuǎn)型發(fā)展。
為解決傳統(tǒng)標(biāo)注精度低、效率低、成本高、復(fù)雜目標(biāo)識(shí)別難等問(wèn)題,無(wú)人機(jī)影像數(shù)據(jù)標(biāo)注采用深度學(xué)習(xí)算法、3D點(diǎn)云等標(biāo)注技術(shù),有效提升無(wú)人機(jī)數(shù)據(jù)標(biāo)注的準(zhǔn)確性、一致性與可用性,目前已用于近20個(gè)低空經(jīng)濟(jì)場(chǎng)景,年均標(biāo)注數(shù)據(jù)近1萬(wàn)條,標(biāo)注效率提升90%,成本下降60%,有效推動(dòng)低空數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展。
針對(duì)礦山行業(yè)數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)缺失、多模態(tài)數(shù)據(jù)標(biāo)注成本高、海量數(shù)據(jù)價(jià)值釋放困難等困境,通過(guò)構(gòu)建礦山行業(yè)知識(shí)標(biāo)簽體系、多模態(tài)數(shù)據(jù)生成算法與合規(guī)校驗(yàn)?zāi)P偷?,?shí)現(xiàn)標(biāo)注效率提升30%,跨模態(tài)語(yǔ)義一致性提升20%,高質(zhì)量數(shù)據(jù)復(fù)用率提升50%,將行業(yè)人工智能應(yīng)用研發(fā)周期由3個(gè)月縮短至3周,賦能礦山行業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展。
通過(guò)對(duì)各級(jí)各類(lèi)訴求渠道數(shù)據(jù)的歸口化管理,引入“數(shù)據(jù)清洗車(chē)間”“因果森林”等技術(shù),解決傳統(tǒng)數(shù)據(jù)標(biāo)注效率低、精準(zhǔn)性差等問(wèn)題。打造人機(jī)協(xié)同的訓(xùn)練體系,日均處理數(shù)據(jù)6萬(wàn)余條,標(biāo)注準(zhǔn)確率達(dá)90%以上,人力成本降低30%,提升了基層治理的效率。
智能數(shù)據(jù)標(biāo)注成為產(chǎn)業(yè)發(fā)展未來(lái)方向
人工智能作為新一輪科技革命和產(chǎn)業(yè)革命的核心驅(qū)動(dòng)力,具有強(qiáng)大的“頭雁”效應(yīng),而高質(zhì)量的數(shù)據(jù)集是人工智能發(fā)展的基石,數(shù)據(jù)標(biāo)注則是構(gòu)建高質(zhì)量數(shù)據(jù)集的關(guān)鍵環(huán)節(jié)。
近年來(lái),隨著人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)標(biāo)注的需求也在不斷增長(zhǎng),從圖像到文本,從語(yǔ)音到視頻,數(shù)據(jù)標(biāo)注的類(lèi)型和任務(wù)劃分日益多樣化,對(duì)數(shù)據(jù)標(biāo)注的質(zhì)量和規(guī)模的要求也不斷提升。與此同時(shí),數(shù)據(jù)存量小產(chǎn)量低、數(shù)據(jù)集質(zhì)量良莠不齊、缺乏主流高價(jià)值數(shù)據(jù)引領(lǐng)、數(shù)據(jù)利用效率低等問(wèn)題仍然存在。
日前,由清華大學(xué)數(shù)字政府與治理研究院聯(lián)合江蘇省數(shù)字化協(xié)會(huì)發(fā)布的《智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展觀察報(bào)告》(以下簡(jiǎn)稱(chēng)“報(bào)告”)指出,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)涵蓋了從數(shù)據(jù)采集、標(biāo)注到應(yīng)用的全過(guò)程,數(shù)據(jù)標(biāo)注是人工智能模型訓(xùn)練的基礎(chǔ),數(shù)據(jù)標(biāo)注產(chǎn)業(yè)不僅關(guān)乎人工智能技術(shù)的進(jìn)步,更對(duì)數(shù)字經(jīng)濟(jì)、產(chǎn)業(yè)升級(jí)乃至社會(huì)生活的智能化轉(zhuǎn)型具有深遠(yuǎn)意義。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)通過(guò)標(biāo)準(zhǔn)化的數(shù)據(jù)處理流程,將原始數(shù)據(jù)轉(zhuǎn)換為可供機(jī)器學(xué)習(xí)的高質(zhì)量訓(xùn)練數(shù)據(jù),其核心參與者包括數(shù)據(jù)標(biāo)注企業(yè)、專(zhuān)業(yè)技術(shù)團(tuán)隊(duì)以及經(jīng)過(guò)系統(tǒng)培訓(xùn)的標(biāo)注人員,而人工智能技術(shù)的快速發(fā)展,讓數(shù)據(jù)標(biāo)注產(chǎn)業(yè)逐步從勞動(dòng)密集型向技術(shù)密集型轉(zhuǎn)型,人工標(biāo)注與人工智能標(biāo)注正在深度融合。
報(bào)告指出,隨著人工智能技術(shù)的不斷發(fā)展,智能標(biāo)注將成為未來(lái)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的重要發(fā)展方向。它不僅能夠滿足大模型數(shù)據(jù)標(biāo)注的需求,還能為復(fù)雜的人工智能模型提供高質(zhì)量的數(shù)據(jù)支持,推動(dòng)人工智能技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用和深度發(fā)展。
上一篇:數(shù)字適老助殘典型案例推薦工作啟動(dòng)
下一篇:最后一頁(yè)
凡本網(wǎng)注明“XXX(非汪清新聞網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
1、成都作詞:趙雷作曲:趙雷編曲:趙雷,喜子演唱:趙雷讓我掉下眼淚的
2023-09-09 15:28
永琰小楷書(shū)《御制詠文房四事詩(shī)》,清宮舊藏。此卷永琰書(shū)《文房四事
2023-09-09 13:15
點(diǎn)擊藍(lán)字關(guān)注我們2023年9月9日至10日高校迎新期間,新鄉(xiāng)東站北側(cè)P1停車(chē)
2023-09-09 11:25
邁凱輪GT的4 0升雙渦輪V8發(fā)動(dòng)機(jī)確實(shí)非常特別。憑借612bhp的功率和465lb
2023-09-09 10:00
領(lǐng)克08,終于上市了。不出所料,領(lǐng)克延續(xù)了「預(yù)售價(jià)即煙霧彈」的車(chē)圈定
2023-09-09 08:21
9月8日,在財(cái)政部指導(dǎo)下,中國(guó)資產(chǎn)評(píng)估協(xié)會(huì)印發(fā)《數(shù)據(jù)資產(chǎn)評(píng)估指導(dǎo)意見(jiàn)
2023-09-09 06:00
同花順(300033)金融研究中心9月8日訊,有投資者向威爾高提問(wèn),您好董
2023-09-08 23:59
9月8日,貴州省第十屆慈善項(xiàng)目推介會(huì)在六盤(pán)水舉行。推介會(huì)以“新思想引
2023-09-08 21:38
證券時(shí)報(bào)e公司訊,電科數(shù)字(600850)9月8日晚間發(fā)布異動(dòng)公告,2022年公
2023-09-08 20:34
@氣象北京消息,北京市氣象臺(tái)發(fā)布8日4時(shí)至19時(shí)降水量(毫米):全市平
2023-09-08 20:02