該標準規定了電力人工智能平臺樣本規范的相關內容,規范了人工智能圖像視頻、語音、文本類樣本的樣本基本要求、樣本標注要求和樣本標注流程,解決為提高樣本標注質量、統一樣本標注規范等問題。
起草單位為國網信息通信產業集團有限公司、福建億榕信息技術有限公司、北京國網信通埃森哲信息技術有限公司、安徽繼遠軟件有限公司、國網重慶市電力公司電力科學研究院、四川大學、四川中電啟明星信息技術有限公司、國網重慶市電力公司、中國電力科學研究院有限公司、國網四川省電力公司、國家電網有限公司大數據中心
主要起草人為李強、邱鎮、趙峰、劉迪、廖逍、李炳森、黃曉光、劉永清、向輝、許中平、蘇少春、楊迎春、周孔均、王曉東、鐘加勇、彭艦、王秋琳、黃飛虎、王金策、田鵬、呂小紅、厲仄平、蘇江文、費長順、宋衛平、趙燦燦、張琳瑜、崔迎寶、劉璟、盧大偉、劉園園、宮曉輝、尹玉、周偉、王蓓、梁翀、李溫靜、王衛衛、伍臣周、王曉輝、陳振宇、郭慶、浦正國
人工智能技術成為推動能源互聯網創新發展的關鍵核心技術,為公司電網調度、運維檢修及分析決策等提供智能分析支持,在電網生產、經營管理和優質服務三大領域日益廣泛應用。樣本標注是人工智能模型訓練中至關重要的一環,為提高樣本標注質量、統一樣本標注規范,開展人工智能樣本標注規范研究。明確樣本基本要求、樣本標注要求和樣本標注流程,為公司人工智能樣本標注工作開展提供指導規范。
從內容上來看,該標準主要包含以下幾個部分:
(1)范圍
包括規定了人工智能樣本的基本要求、標注要求、標注流程,其中人工智能樣本類型包括圖像視頻、語音和文本。適用于人工智能平臺樣本庫的規劃、設計、開發、建設和運維。
(2)規范性引用文件
(3)術語和定義
包括人工智能基本概念與專家系統、人工智能面向機器學習的數據標注規程、信息處理用現代漢語分詞規范、人工智能語音識別與合成的定義。
(4)縮略語
(5)樣本基本要求
包括規范了人工智能圖像(含視頻)、語音、文本類樣本數據基本要求、樣本標注要求和樣本標注流程,樣本標注后匯總到電力人工智能平臺中進行管理。
(6)樣本標注流程
包括樣本標注流程有:樣本檢查、標注工具選擇、標注任務開展、標注結果收集和標注結果檢查等環節。
該標準規范了電力人工智能平臺樣本規范要求,該標準效益主要體現在:
(1)提高樣本標注質量、統一樣本標注規范。規定了電力人工智能平臺樣本規范的相關內容,規范了人工智能圖像視頻、語音、文本類樣本的樣本基本要求、樣本標注要求和樣本標注流程,解決為提高樣本標注質量、統一樣本標注規范等問題。
(2)推動算法模型研發、共享。電力行業人工智能樣本規范將具備更具針對性的評價應用,可以推動電力行業人工智能算法模型的規范化研發、共享。形成更加高效、安全的電力人工智能樣本體系。促進電力行業人工智能技術深化應用于發展。