我國電力行業(yè)發(fā)展迅速,電表作為測電設(shè)備經(jīng)歷了普通電表、預(yù)付費電表和智能電表三個階段得發(fā)展。在產(chǎn)業(yè)場景中,表得種類多達十幾種,過去依賴人工抄表,成本很高。如果能夠采集到大量電表支持,借助人工智能技術(shù)批量檢測和識別,將會大幅提升效率。
本次飛槳產(chǎn)業(yè)實踐范例庫開源電表讀數(shù)識別場景應(yīng)用,提供了從數(shù)據(jù)準備、技術(shù)方案、模型訓(xùn)練優(yōu)化,到模型部署得全流程可復(fù)用方案,降低產(chǎn)業(yè)落地門檻。
?項目鏈接?
感謝分享github感謝原創(chuàng)分享者/PaddlePaddle/awesome-DeepLearning
所有源碼及教程均已開源,歡迎大家使用,star 鼓勵~
基于深度學(xué)習(xí)技術(shù)
實現(xiàn)電表讀數(shù)識別
本場景要解決多類別電表識別任務(wù),從技術(shù)上需要對多種類別得電表表數(shù)和表號進行檢測再識別,從數(shù)據(jù)到模型面臨著多重問題。
項目難點:
本項目將一一解決這些難點。
項目方案:
基于上述難點,飛槳開發(fā)者技術(shù)可能不斷進行嘗試,最終選用了飛槳文字識別套件 PaddleOCR 中得 PP-OCR 模型進行了微調(diào)與優(yōu)化,其檢測部分基于 DB 得分割方法實現(xiàn),直接解決了電表數(shù)據(jù)中得傾斜問題,通過再造數(shù)據(jù)集來擴充識別數(shù)據(jù)集,訓(xùn)練識別模型。PP-OCR 模型經(jīng)過大量實驗,其泛化性也足以支撐復(fù)雜垂類場景下得效果。
在數(shù)據(jù)標(biāo)注工具上,使用 PPOCRLabel 實現(xiàn)半自動標(biāo)注,內(nèi)嵌 PP-OCR 模型,一鍵實現(xiàn)機器自動標(biāo)注,且具有便捷得修改體驗。支持四點框、矩形框標(biāo)注模式,導(dǎo)出格式可直接用于 PaddleOCR 訓(xùn)練,標(biāo)注效率顯著提升。
方案優(yōu)化:
在優(yōu)化方面,首先對 PP-OCR 模型得檢測部分進行初步微調(diào),然后通過對數(shù)據(jù)得進一步分析,發(fā)現(xiàn)原始圖像分辨率較大,進而調(diào)整 EastRandomCropData 得尺寸,放大輸入模型前得圖像尺度。通過 CopyPaste 數(shù)據(jù)增強解決數(shù)據(jù)量小得問題,并且根據(jù)實際情況調(diào)小學(xué)習(xí)率。
項目效果:
最終在評測數(shù)據(jù)集上從原先得 Hmeans=0.3 優(yōu)化到0.85。除此之外,本項目也嘗試了一部分目標(biāo)檢測算法。具體得優(yōu)化過程和詳細解釋,歡迎大家感謝對創(chuàng)作者的支持感謝閱讀本文!!
微調(diào)前后對比
部署方面使用飛槳原生推理庫 Paddle Inference 完成,滿足用戶批量預(yù)測、數(shù)據(jù)安全性高、延遲低得需求,快速在本地完成部署方案。
產(chǎn)業(yè)實踐范例教程
助力企業(yè)跨越 AI 落地鴻溝
飛槳產(chǎn)業(yè)實踐范例,致力于加速 AI 在產(chǎn)業(yè)落地得前進路徑,減少理論技術(shù)與產(chǎn)業(yè)應(yīng)用得差距。范例近日于產(chǎn)業(yè)真實業(yè)務(wù)場景,通過完整得代碼實現(xiàn),提供從數(shù)據(jù)準備到模型部署得方案過程解析,堪稱產(chǎn)業(yè)落地得“自動導(dǎo)航”。