国产精品免费一区二区三区四区-精品无码AV一区二区三区不卡-国产麻豆剧传媒精品国产av-国产WW久久久久久久久久

數(shù)字報
小程序
公眾號
《工業(yè)高質(zhì)量數(shù)據(jù)集研究報告》正式發(fā)布
2025-09-09 15:41:08
來源:新華網(wǎng) 

9月6日,中國工業(yè)互聯(lián)網(wǎng)研究院院長魯春叢在2025全球工業(yè)互聯(lián)網(wǎng)大會開幕式上發(fā)布《工業(yè)高質(zhì)量數(shù)據(jù)集研究報告》,對工業(yè)高質(zhì)量數(shù)據(jù)集的理論體系、建設(shè)路徑、評估體系、流通應(yīng)用進行總結(jié)歸納。

數(shù)據(jù)作為新型生產(chǎn)要素,是實體經(jīng)濟數(shù)智化進程中的基礎(chǔ)資源,是培育壯大智能產(chǎn)業(yè)的關(guān)鍵驅(qū)動力量。我國是工業(yè)大國,門類齊全、體系完整、場景豐富,近年來,企業(yè)數(shù)字化轉(zhuǎn)型進程加速推進,為工業(yè)數(shù)據(jù)的匯聚與應(yīng)用奠定了良好基礎(chǔ)。工業(yè)高質(zhì)量數(shù)據(jù)集是從研發(fā)、生產(chǎn)、供應(yīng)、銷售、服務(wù)等全生命周期各環(huán)節(jié)產(chǎn)生和采集,經(jīng)過清洗、標(biāo)注等專業(yè)化處理,用于分析、建模、訓(xùn)練的數(shù)據(jù)集合。加快建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,是將我國龐大的數(shù)據(jù)資源優(yōu)勢和完備的產(chǎn)業(yè)體系優(yōu)勢,轉(zhuǎn)化為賦能新型工業(yè)化核心競爭力的關(guān)鍵舉措。

當(dāng)前,人工智能對產(chǎn)業(yè)變革的賦能正從試驗探索邁向?qū)嶋H應(yīng)用。以工業(yè)智能體為例,部分頭部工業(yè)企業(yè)已經(jīng)在產(chǎn)線質(zhì)檢、車間注塑、工廠運營等環(huán)節(jié)廣泛部署智能體應(yīng)用,極大提升了生產(chǎn)制造效率,而高質(zhì)量數(shù)據(jù)集正是實現(xiàn)這一切的重要前提。可以說,“沒有工業(yè)數(shù)據(jù),就沒有工業(yè)智能;沒有工業(yè)高質(zhì)量數(shù)據(jù)集,就沒有高水平工業(yè)智能”。許多智能化改造項目中,數(shù)據(jù)工程的投入占比高達50%~60%,這說明數(shù)據(jù)要素報酬遞增、低成本復(fù)用的特點已成為業(yè)界的廣泛共識。我們認(rèn)為,應(yīng)按照“分類分級、標(biāo)準(zhǔn)引導(dǎo)、集中管理、分布部署”的思路,加快建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,為人工智能賦能新型工業(yè)化夯實數(shù)據(jù)根基。

一、工業(yè)高質(zhì)量數(shù)據(jù)集的理論體系

建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,需要一套科學(xué)、系統(tǒng)的理論體系作為指引。核心在于把握工業(yè)數(shù)據(jù)集的多元、分級、融合三大特征,推動工業(yè)數(shù)據(jù)在“更廣范圍”“更深程度”和“更高水平”上實現(xiàn)價值創(chuàng)造。

(一)把握工業(yè)數(shù)據(jù)集的多元特征。工業(yè)數(shù)據(jù)的復(fù)雜性與多元化,集中體現(xiàn)在工業(yè)行業(yè)繁多、業(yè)務(wù)環(huán)節(jié)復(fù)雜、數(shù)據(jù)模態(tài)多樣等方面,要求數(shù)據(jù)集建設(shè)要在“更廣范圍”上拓展邊界。工業(yè)門類多元,我國工業(yè)門類齊全,涵蓋41個工業(yè)大類、207個中類、666個小類,不同行業(yè)的數(shù)據(jù)蘊含著獨特的工藝機理與知識。數(shù)據(jù)集建設(shè)在深耕本行業(yè)專業(yè)性的同時,也為跨領(lǐng)域知識遷移與價值創(chuàng)造提供可能。業(yè)務(wù)環(huán)節(jié)多元,工業(yè)數(shù)據(jù)貫穿研發(fā)設(shè)計、生產(chǎn)制造、運維服務(wù)等產(chǎn)品全生命周期,并縱向延伸至產(chǎn)業(yè)鏈上下游。數(shù)據(jù)集建設(shè)需要打通過去散落在不同業(yè)務(wù)系統(tǒng)的“數(shù)據(jù)孤島”,實現(xiàn)業(yè)務(wù)協(xié)同。數(shù)據(jù)模態(tài)多元,工業(yè)現(xiàn)場存在大量結(jié)構(gòu)化與非結(jié)構(gòu)化、時序與非時序等形態(tài)屬性交織的原始數(shù)據(jù)。數(shù)據(jù)集建設(shè)要具備強大的異構(gòu)數(shù)據(jù)融合和處理能力,形成貼合場景的高價值數(shù)據(jù),構(gòu)建完整的數(shù)字畫像,實現(xiàn)深度賦能。

(二)把握工業(yè)數(shù)據(jù)集的分級特征。工業(yè)場景存在從“設(shè)備、產(chǎn)線、工廠、企業(yè)”到“產(chǎn)業(yè)生態(tài)”的多重層級。不同層級的數(shù)據(jù),其融合程度與決策價值各不相同,尤其當(dāng)數(shù)據(jù)應(yīng)用需要打通產(chǎn)業(yè)鏈上下游、實現(xiàn)跨主體協(xié)同時,會面臨數(shù)據(jù)共享意愿低、權(quán)屬不清、信任缺失等現(xiàn)實挑戰(zhàn)。這要求數(shù)據(jù)集建設(shè)需遵循分級分類的原則,在“更深程度”上逐級深化。基礎(chǔ)層(設(shè)備與產(chǎn)線級),從業(yè)務(wù)執(zhí)行的最小單元出發(fā),匯聚設(shè)備運行、工藝參數(shù)等高質(zhì)量數(shù)據(jù),實現(xiàn)故障診斷、能耗優(yōu)化等局部效率提升,為數(shù)字化轉(zhuǎn)型奠定堅實的數(shù)據(jù)基石。核心層(工廠與企業(yè)級),聚合生產(chǎn)計劃、成本投入、經(jīng)營管理等數(shù)據(jù),驅(qū)動生產(chǎn)調(diào)度、資源配置等核心業(yè)務(wù)流程的系統(tǒng)性優(yōu)化,提升企業(yè)整體運營水平。生態(tài)層(產(chǎn)業(yè)生態(tài)級),通過聚合跨主體、跨領(lǐng)域的數(shù)據(jù),賦能供應(yīng)鏈柔性與韌性、產(chǎn)品全生命周期綠色低碳、產(chǎn)業(yè)風(fēng)險監(jiān)測預(yù)警等應(yīng)用,創(chuàng)造生態(tài)協(xié)同的增量價值。這種分級推進的數(shù)據(jù)集開發(fā)與利用路徑,為企業(yè)在不同發(fā)展階段深化數(shù)據(jù)應(yīng)用、獲取數(shù)據(jù)價值提供了清晰的指引。

(三)把握工業(yè)數(shù)據(jù)集的融合特征。工業(yè)數(shù)據(jù)必須與工業(yè)機理、專家知識、先進算法深度融合,才能發(fā)揮應(yīng)用價值。這決定了數(shù)據(jù)集建設(shè)要從單純的數(shù)據(jù)積累轉(zhuǎn)向“知識資產(chǎn)”的沉淀,在“更高水平”上融合應(yīng)用。面向“工業(yè)生產(chǎn)控制”,實現(xiàn)實時的工藝優(yōu)化、閉環(huán)控制與異常處置,其所需的數(shù)據(jù)集具有高頻、實時、參數(shù)聚焦的特點。這種融合將數(shù)據(jù)與控制算法結(jié)合,使物理設(shè)備和生產(chǎn)過程變得更加智能、更具智慧,提升整體運行效率。面向“工業(yè)知識傳承”,將專家的隱性知識進行顯性化、模型化與軟件化復(fù)用,加速信息技術(shù)(IT)、通信技術(shù)(CT)、控制技術(shù)(OT)和數(shù)字技術(shù)(DT)的“4T融合”。工業(yè)知識所需的數(shù)據(jù)集呈現(xiàn)出多模態(tài)、大跨度、知識密集的特點,不僅包含運行數(shù)據(jù),還需融合設(shè)計圖紙、工藝文件、操作規(guī)程、維修記錄等非結(jié)構(gòu)文本與圖像數(shù)據(jù)。這種融合將數(shù)據(jù)與行業(yè)知識結(jié)合,使組織和個人的經(jīng)驗得以傳承和放大。

二、工業(yè)高質(zhì)量數(shù)據(jù)集的建設(shè)路徑

中國工業(yè)互聯(lián)網(wǎng)研究院聯(lián)合行業(yè)龍頭與“專精特新”企業(yè),在實踐中探索出一套從需求規(guī)劃到應(yīng)用驗證全鏈條的工業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)方法論,通過系統(tǒng)化工程,將分散無序的原始數(shù)據(jù)重塑為驅(qū)動業(yè)務(wù)增長的“戰(zhàn)略資產(chǎn)”。

一是需求規(guī)劃。需求規(guī)劃是數(shù)據(jù)集建設(shè)的首要環(huán)節(jié),核心任務(wù)是從復(fù)雜的業(yè)務(wù)問題中,精準(zhǔn)識別并錨定能產(chǎn)生最大回報的核心價值場景,明確所需的數(shù)據(jù)類型、來源和規(guī)模,以制定出具備前瞻性和可執(zhí)行性的技術(shù)方案。如,某鋼鐵企業(yè)在中厚板生產(chǎn)中,面臨傳統(tǒng)機理模型預(yù)測精度不足(僅84%)、非穩(wěn)態(tài)工況下失準(zhǔn)率高(20%)的痛點。通過需求規(guī)劃,將目標(biāo)設(shè)定為研發(fā)“融合冶金知識的自主高精度軋制力預(yù)測模型”,提出構(gòu)建覆蓋全工序鏈的高質(zhì)量數(shù)據(jù)集。通過對技術(shù)方案和預(yù)期效益的綜合研判,預(yù)計該數(shù)據(jù)集完成后,可將軋制力預(yù)測準(zhǔn)確率提升至95%以上,非計劃停機率降低3%,板材成材率提升0.2%。

二是數(shù)據(jù)采集。數(shù)據(jù)采集是確保數(shù)據(jù)集質(zhì)量的源頭環(huán)節(jié)。該環(huán)節(jié)依據(jù)需求規(guī)劃,運用機器視覺、傳感器、工業(yè)總線、MES系統(tǒng)等多重手段,系統(tǒng)性地獲取“高保真、高信噪比”的原始數(shù)據(jù)。數(shù)據(jù)采集的廣度、精度和同步性,直接影響后續(xù)分析與建模的質(zhì)量。如,某企業(yè)在構(gòu)建礦山全場景要素數(shù)據(jù)集時,為破解安全預(yù)警滯后的難題,深入350多座煤礦的一線場景進行數(shù)據(jù)采集。采集范圍不僅覆蓋了人員、車輛、設(shè)備、環(huán)境四大要素的57個場景,更特別針對煙霧、黑暗、粉塵等11類極端工況進行了專項采集。

三是數(shù)據(jù)處理。數(shù)據(jù)處理是提升數(shù)據(jù)質(zhì)量、挖掘數(shù)據(jù)價值的關(guān)鍵一步,通過清洗、對齊、降噪、歸一化等手段,解決工業(yè)原始數(shù)據(jù)普遍存在的缺失、異常、冗余和不一致等問題。如,某風(fēng)電裝備龍頭企業(yè)在風(fēng)機葉片上安裝了上千個傳感器數(shù)據(jù)點,通過數(shù)據(jù)清洗、對齊和特征降維等技術(shù)手段,解決了原始數(shù)據(jù)25%缺失、10%異常的問題,并將上千個特征簡化至300個核心特征,使數(shù)據(jù)有效性從70%提升至99%以上,缺陷預(yù)測準(zhǔn)確率達到97%。

四是數(shù)據(jù)標(biāo)注。數(shù)據(jù)標(biāo)注是為數(shù)據(jù)注入“監(jiān)督信息”和“工業(yè)知識”的核心環(huán)節(jié),也是構(gòu)建高精度模型訓(xùn)練標(biāo)簽體系的關(guān)鍵。工業(yè)場景的標(biāo)注任務(wù)專業(yè)壁壘高,必須深度結(jié)合專家知識,建立清晰的標(biāo)注規(guī)范和嚴(yán)格的質(zhì)檢流程。如,某企業(yè)對圖像進行數(shù)據(jù)標(biāo)注時,采用了“預(yù)標(biāo)注—人工校驗—模型迭代”的智能輔助標(biāo)注流程,基于自研智能標(biāo)注平臺先進行預(yù)標(biāo)注,再結(jié)合人工交叉復(fù)核,精準(zhǔn)標(biāo)注了53個子類目標(biāo)標(biāo)簽,保證標(biāo)注一致性波動≤5%,分割掩碼誤差<2%。

五是數(shù)據(jù)合成。數(shù)據(jù)合成與增強是破解工業(yè)場景中“關(guān)鍵樣本稀缺”這一痛點的重要手段。通過幾何變換、生成對抗網(wǎng)絡(luò)、三維仿真等技術(shù),可在不改變語義標(biāo)簽前提下,低成本、高效率地擴充數(shù)據(jù)集規(guī)模、拓展數(shù)據(jù)集多樣性。如,某汽車發(fā)動機缸體、輪轂等零部件表面缺陷數(shù)據(jù)集,其原始樣本圖片3000張,缺陷樣本僅600張,類別嚴(yán)重不均衡。通過幾何變換、顏色變換、噪聲添加等數(shù)據(jù)變換增強技術(shù),并利用生成對抗網(wǎng)絡(luò)(GAN)來合成1500張高質(zhì)量缺陷樣本圖片,提升了稀缺樣本數(shù)量,使判別器準(zhǔn)確率提升至85%。

六是應(yīng)用驗證。應(yīng)用驗證是檢驗數(shù)據(jù)集最終價值和驅(qū)動數(shù)據(jù)集持續(xù)優(yōu)化的關(guān)鍵環(huán)節(jié)。通過模型在真實工業(yè)場景中的表現(xiàn),反向評估數(shù)據(jù)集的覆蓋度、平衡性和泛化能力,識別數(shù)據(jù)短板,形成“應(yīng)用—評估—優(yōu)化—再應(yīng)用”迭代閉環(huán)。如,基于某航空發(fā)動機運行狀態(tài)數(shù)據(jù)集,利用行業(yè)大模型遷移學(xué)習(xí)來訓(xùn)練關(guān)鍵部件剩余壽命小模型,實驗調(diào)測準(zhǔn)確率92%,但實際裝機測試準(zhǔn)確率下降至85%。在應(yīng)用驗證環(huán)節(jié)發(fā)現(xiàn),數(shù)據(jù)集稀疏樣本覆蓋度與平衡性存在嚴(yán)重不足,通過對數(shù)據(jù)進行增強處理、重新標(biāo)注和訓(xùn)練驗證,模型準(zhǔn)確率穩(wěn)定提升至98%,誤報率降低70%。

三、工業(yè)高質(zhì)量數(shù)據(jù)集的評估體系

工業(yè)高質(zhì)量數(shù)據(jù)集的評估不能照搬通用標(biāo)準(zhǔn),中國工業(yè)互聯(lián)網(wǎng)研究院緊密圍繞工業(yè)場景的獨特性,結(jié)合實際場景實踐經(jīng)驗,提出七大核心指標(biāo)。

規(guī)范性:指數(shù)據(jù)集符合數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型、業(yè)務(wù)規(guī)則、元數(shù)據(jù)或權(quán)威參考數(shù)據(jù)的程度,包括數(shù)據(jù)集的格式、標(biāo)注、單位和元數(shù)據(jù)的規(guī)范性等方面。特別是在化工、核電、航空航天等領(lǐng)域,存在高溫、高壓或易燃易爆等場景,數(shù)據(jù)規(guī)范性直接決定“產(chǎn)線是否正常運行、風(fēng)險是否及時預(yù)警”,任何偏差都可能引發(fā)爆炸、泄漏、設(shè)備損毀等重大安全事故。

完整性:指數(shù)據(jù)集按照建設(shè)規(guī)則要求,應(yīng)采集的數(shù)據(jù)元素被有效獲取和記錄的程度,包括特征完整性、分布完整性、標(biāo)注完整性、文檔完整性與樣本數(shù)據(jù)充足性等方面。例如,在壓縮機預(yù)測性維護場景中,一個同時覆蓋振動、溫度、電流、轉(zhuǎn)速等多維參數(shù),并囊括啟停、滿負(fù)荷、部分負(fù)荷等所有工況的數(shù)據(jù)集,才能訓(xùn)練出具備較強泛化能力的模型。

準(zhǔn)確性:指數(shù)據(jù)集包含的信息真實、精確地反映其所描述的物理實體或?qū)嶋H狀態(tài)的程度,包括數(shù)據(jù)集的內(nèi)容、精度、誤差、標(biāo)注信息、文檔描述等方面。基于工業(yè)設(shè)備的運行參數(shù)數(shù)據(jù)集、生產(chǎn)過程中的工藝指標(biāo)數(shù)據(jù)集所形成的機理模型,會因數(shù)據(jù)的微小偏差導(dǎo)致預(yù)測失準(zhǔn),進而對產(chǎn)品質(zhì)量、生產(chǎn)安全產(chǎn)生決定性影響。

一致性:指數(shù)據(jù)集內(nèi)部及與其他數(shù)據(jù)源之間的統(tǒng)一程度,包括數(shù)據(jù)單位與格式的一致性,數(shù)據(jù)集樣本分布與真實世界數(shù)據(jù)分布的一致性,不同樣本間數(shù)據(jù)標(biāo)注基準(zhǔn)的一致性等方面。若不同標(biāo)注人員對相同類型產(chǎn)品缺陷的判定標(biāo)準(zhǔn)不一致,將導(dǎo)致標(biāo)簽歧義,影響模型訓(xùn)練的穩(wěn)定性與預(yù)測精度。

時效性:指數(shù)據(jù)集能夠反映當(dāng)前或指定時間窗口內(nèi)的真實狀態(tài)程度,包括是否涵蓋所需的時效區(qū)間、是否包含過時信息等方面。在預(yù)測風(fēng)機發(fā)電量時,十年前的環(huán)境數(shù)據(jù)與當(dāng)前相比已出現(xiàn)明顯差異,使用過時數(shù)據(jù)構(gòu)建模型可能導(dǎo)致預(yù)測結(jié)果與實際不符。

專業(yè)性:指數(shù)據(jù)集涵蓋的信息內(nèi)容和工業(yè)場景的匹配程度,包括知識的專業(yè)性、業(yè)務(wù)流程的適配性、工業(yè)機理的關(guān)聯(lián)性等方面。例如,在晶圓缺陷識別場景中,若數(shù)據(jù)集僅標(biāo)注缺陷圖像的表面特征,而未關(guān)聯(lián)對應(yīng)的工藝環(huán)節(jié)、工序類型,模型則難以區(qū)分光刻工序的“邊緣劃傷”與刻蝕工序的“側(cè)壁損傷”,導(dǎo)致缺陷識別準(zhǔn)確率低,且無法支撐根因分析與工藝優(yōu)化。

均衡性:指數(shù)據(jù)集中各類別樣本和數(shù)據(jù)來源分布的合理性、均勻性,包括數(shù)據(jù)類別均衡性和數(shù)據(jù)來源均衡性等方面。例如,在鋼鐵表面質(zhì)量檢測中,若數(shù)據(jù)集以大量無缺陷或常見劃痕樣本為主,“裂紋”“夾雜”等關(guān)鍵缺陷樣本數(shù)量過少,模型在訓(xùn)練后將難以有效識別高風(fēng)險缺陷,影響產(chǎn)品質(zhì)量控制和產(chǎn)線安全。

四、工業(yè)高質(zhì)量數(shù)據(jù)集的流通應(yīng)用

工業(yè)高質(zhì)量數(shù)據(jù)集的最終價值必須通過流通與應(yīng)用得以實現(xiàn)。中國工業(yè)互聯(lián)網(wǎng)研究院正在推進構(gòu)建從數(shù)據(jù)登記、可信流通到應(yīng)用服務(wù)的業(yè)務(wù)閉環(huán),破解工業(yè)數(shù)據(jù)共享難題,培育多方共贏的數(shù)據(jù)服務(wù)生態(tài)。

(一)構(gòu)建工業(yè)可信數(shù)據(jù)空間。依托國家工業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)中心,構(gòu)建工業(yè)可信數(shù)據(jù)空間,促進工業(yè)高質(zhì)量數(shù)據(jù)集的有序流通、安全共享與高效利用。一是技術(shù)賦能可信流通。基于隱私計算、安全沙箱、身份可信認(rèn)證、數(shù)據(jù)使用控制及全鏈路追溯等核心技術(shù),構(gòu)建“數(shù)據(jù)集可用不可見、用途可控可追溯”的信任機制,打通數(shù)據(jù)集供給方、需求方及服務(wù)方協(xié)同鏈路,在“數(shù)據(jù)集物理不出域”前提下,通過“可用不可見”模式滿足多主體的數(shù)據(jù)集使用需求,實現(xiàn)數(shù)據(jù)集主權(quán)不轉(zhuǎn)移、價值可流轉(zhuǎn)。二是構(gòu)建三級聯(lián)動架構(gòu)。通過“國家—產(chǎn)業(yè)集群—企業(yè)”三級互聯(lián)部署架構(gòu),形成規(guī)模化覆蓋、層級化運營的可信數(shù)據(jù)空間管理體系。企業(yè)層面,通過鏈接生產(chǎn)制造、設(shè)備運維等數(shù)據(jù)源頭,利用數(shù)據(jù)采集、清洗及標(biāo)注等技術(shù)手段,構(gòu)建高質(zhì)量“數(shù)據(jù)集原材料”;產(chǎn)業(yè)集群層面,聚焦先進制造業(yè)產(chǎn)業(yè)集群,通過數(shù)據(jù)可信流通與協(xié)作,整合優(yōu)化企業(yè)級數(shù)據(jù)集,形成具備產(chǎn)業(yè)特色或行業(yè)共性的數(shù)據(jù)集;國家層面,構(gòu)建全國工業(yè)高質(zhì)量數(shù)據(jù)集目錄體系,實現(xiàn)數(shù)據(jù)集資源的有序整合與優(yōu)化配置。三是促進數(shù)據(jù)集供需匹配。支撐設(shè)備、產(chǎn)線、生態(tài)等全層級工業(yè)高質(zhì)量數(shù)據(jù)集產(chǎn)品的注冊、審核、上架及安全可信共享,通過需求側(cè)畫像與供給側(cè)標(biāo)簽的精準(zhǔn)匹配,滿足不同層級工業(yè)模型對數(shù)據(jù)集的差異化需求,推動數(shù)據(jù)集價值從單點應(yīng)用向全局賦能延伸。

(二)開展數(shù)據(jù)確權(quán)登記。厘清企業(yè)數(shù)據(jù)底數(shù)、明確權(quán)屬關(guān)系,是推動工業(yè)數(shù)據(jù)流通與應(yīng)用的首要環(huán)節(jié)。通過建立“國家—產(chǎn)業(yè)集群—企業(yè)”三級工業(yè)數(shù)據(jù)登記體系,幫助企業(yè)梳理數(shù)據(jù)并完成登記,積累工業(yè)數(shù)據(jù)目錄,提升工業(yè)數(shù)據(jù)供給能力。一是企業(yè)級,幫助企業(yè)梳理數(shù)據(jù)資產(chǎn)。企業(yè)通過部署輕量化登記工具,能夠在數(shù)據(jù)不出企業(yè)數(shù)據(jù)庫的前提下,生成標(biāo)準(zhǔn)化數(shù)據(jù)目錄,并獲得登記證書;二是集群級,繪制產(chǎn)業(yè)數(shù)據(jù)資源地圖。產(chǎn)業(yè)集群、園區(qū)或地方政府聚合其轄區(qū)內(nèi)企業(yè)數(shù)據(jù)目錄,形成區(qū)域性的數(shù)據(jù)資源地圖;三是國家級,匯聚企業(yè)和集群數(shù)據(jù)目錄,構(gòu)建覆蓋全國的工業(yè)數(shù)據(jù)資源地圖。以紡織行業(yè)為例,企業(yè)在本地部署可信登記軟件,自主選擇織機運行參數(shù)、原材料消耗、庫存等數(shù)據(jù)進行登記,相關(guān)信息上傳至確權(quán)平臺。平臺審核通過后,為企業(yè)頒發(fā)登記證書。不同區(qū)域的紡織企業(yè)數(shù)據(jù)登記不斷積累,將最終形成全國紡織行業(yè)數(shù)據(jù)目錄。截至2025年8月,中國工業(yè)互聯(lián)網(wǎng)研究院工業(yè)數(shù)據(jù)資產(chǎn)登記平臺已在蘇州、北京、沈陽等地試點,累計注冊企業(yè)2200余家,發(fā)放登記證書超1700張,為高質(zhì)量數(shù)據(jù)集建設(shè)提供了有效支撐。

(三)推進工業(yè)數(shù)據(jù)應(yīng)用。基于工業(yè)高質(zhì)量數(shù)據(jù)集的應(yīng)用探索正加速演進,逐漸形成三類商業(yè)化服務(wù)模式:一是工業(yè)場景訓(xùn)練語料服務(wù)。數(shù)據(jù)服務(wù)商通過平臺化訂閱或私有化定制,向模型廠商提供精加工的工業(yè)場景數(shù)據(jù)集,提升其模型在細(xì)分領(lǐng)域的專業(yè)精度。如,某數(shù)據(jù)服務(wù)商為頭部模型廠商提供的定制化工業(yè)語料服務(wù),單個項目金額可達近千萬元,體現(xiàn)了高質(zhì)量工業(yè)語料作為“AI燃料”的巨大商業(yè)價值。二是AI一體機定制化服務(wù)。數(shù)據(jù)服務(wù)商結(jié)合數(shù)據(jù)集、模型、算力以一體機部署方式為工業(yè)應(yīng)用企業(yè)提供安全、高性價比的智能服務(wù)。如,某龍頭企業(yè)打造的工業(yè)AI一體機,極大降低了AI技術(shù)在工業(yè)現(xiàn)場的應(yīng)用門檻,實現(xiàn)了數(shù)千萬元的產(chǎn)品服務(wù)收入。三是數(shù)據(jù)處理工具應(yīng)用服務(wù)。數(shù)據(jù)服務(wù)商以云化API或定制化服務(wù)等方式為人工智能應(yīng)用企業(yè)提供數(shù)據(jù)“采、洗、標(biāo)、測、用”等一站式數(shù)據(jù)處理服務(wù)。如某企業(yè)自研的數(shù)據(jù)標(biāo)注平臺,最高可提升6倍標(biāo)注效率,平均降低數(shù)據(jù)處理40%成本。隨著高質(zhì)量數(shù)據(jù)集與人工智能在各垂直細(xì)分行業(yè)的深入應(yīng)用,將催生出更多高效、自適應(yīng)、智能的工業(yè)數(shù)據(jù)應(yīng)用新模式,加速產(chǎn)業(yè)智能化轉(zhuǎn)型升級。

中國工業(yè)互聯(lián)網(wǎng)研究院將聚焦工業(yè)高質(zhì)量數(shù)據(jù)集的建設(shè)與應(yīng)用,在技術(shù)研發(fā)、設(shè)施布局、標(biāo)準(zhǔn)研制、應(yīng)用推廣和生態(tài)培育等方面持續(xù)發(fā)力。遼寧是我國工業(yè)的搖籃和重要基地,中國工業(yè)互聯(lián)網(wǎng)研究院將在遼寧率先試點,依托遼寧四大先進制造業(yè)集群,加速推動工業(yè)高質(zhì)量數(shù)據(jù)集的規(guī)模化供給與高水平應(yīng)用,加快推進人工智能賦能新型工業(yè)化。

編輯:韓夢晨
相關(guān)閱讀:
高新視頻 更多
高新熱榜 全部本月
編輯推薦 更多

友情鏈接: 政府 高新園區(qū)合作媒體

Copyright 1999-2025 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5

電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責(zé)任公司