時(shí)間:2022-08-26
隨著計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)的普及,人工智能(AI)開始快速應(yīng)用到各個(gè)行業(yè)。世紀(jì)安圖作為深耕電子政務(wù)領(lǐng)域二十年的高新技術(shù)企業(yè),一直不斷地探索如何為政府部門提供高效可靠的政務(wù)服務(wù)軟件平臺(tái)。近期我公司研發(fā)的人工智能平臺(tái),引入深度學(xué)習(xí)技術(shù),與傳統(tǒng)的OCR技術(shù)相結(jié)合,解決了傳統(tǒng)OCR識(shí)別準(zhǔn)率低的問題,讓政務(wù)智能審批真正落地,極大提升行政效能。
智能化政務(wù)審批,主要是需識(shí)別大量掃描圖片的內(nèi)容,與其它渠道獲取的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行比對(duì),然后自動(dòng)判斷申請(qǐng)材料是否正確、真實(shí),大幅減少人工比對(duì)的工作量,提高審核效率。然而受掃描或拍攝設(shè)備及周邊環(huán)境的影響,掃描圖片并不是特別規(guī)范,存在傾斜、褶皺、拼湊、邊緣模糊等情況。文字內(nèi)容很多時(shí)候并不規(guī)范,存在換行、部分遮擋等情況。傳統(tǒng)的OCR技術(shù)識(shí)別文檔,一般是基于行掃描,將文字逐行識(shí)別出來。如果不對(duì)圖像預(yù)先定位和糾正,識(shí)別的性能會(huì)很低,而且所期望結(jié)果的準(zhǔn)確率也會(huì)比較低。計(jì)算機(jī)深度學(xué)習(xí)在目標(biāo)檢測(cè)上的優(yōu)勢(shì),正好填補(bǔ)了OCR的不足,兩者結(jié)合可以大大提高識(shí)別效率和準(zhǔn)確率。

注:圖片來源于網(wǎng)絡(luò)
以身份證識(shí)別為例,市場(chǎng)上的身份證識(shí)別產(chǎn)品很多,但絕大多數(shù)是識(shí)別規(guī)范拍攝的身份證。而在政務(wù)審批的實(shí)際應(yīng)用場(chǎng)景中,申請(qǐng)人提交的很可能是這樣的掃描件:

我們利用計(jì)算機(jī)深度學(xué)習(xí)技術(shù),通過采集樣本進(jìn)行針對(duì)性的訓(xùn)練,可以讓計(jì)算機(jī)“認(rèn)識(shí)”圖片里哪一部分是身份證正面,哪一部分是身份證反面,然后將身份證部分裁剪出來,通過糾偏、遮罩等圖像處理,再用OCR去識(shí)別我們想要文字。

兩種技術(shù)結(jié)合,每張圖片識(shí)別速度在0.5秒以內(nèi),識(shí)別準(zhǔn)確率達(dá)到90%以上。針對(duì)政務(wù)智能審核場(chǎng)景,對(duì)于大多數(shù)業(yè)務(wù)而言,只要提交的材料沒有遺漏和嚴(yán)重污損,計(jì)算機(jī)比對(duì)成功的會(huì)自動(dòng)審核通過,這樣可節(jié)省90%的人工核對(duì)工作量,實(shí)現(xiàn)真正的“秒批”。
深度學(xué)習(xí)技術(shù)在政務(wù)服務(wù)、違法預(yù)警、執(zhí)法舉證等很多方面都有適合的應(yīng)用場(chǎng)景。目前應(yīng)用的難點(diǎn)主要在于技術(shù)參數(shù)的調(diào)優(yōu)以及樣本獲取,我們將持續(xù)投入研發(fā)力量,并與客戶持續(xù)合作共同推進(jìn)人工智能在各個(gè)領(lǐng)域內(nèi)的深入應(yīng)用。
供稿:研發(fā)中心? 陳東
編輯:譚琳