OCR識(shí)別接口需要具備哪些核心技術(shù)發(fā)表時(shí)間:2021-10-15 14:01 圖片壓縮算法 平臺(tái)在接入OCR識(shí)別接口時(shí),會(huì)要求把需要識(shí)別的圖片上傳,但如果原圖上傳質(zhì)量過(guò)高的圖片,會(huì)對(duì)服務(wù)器造成很大的負(fù)擔(dān),圖片壓縮算法可以將大體積的圖片壓縮成合適的尺寸,同時(shí)還不會(huì)影響識(shí)別的清晰度,既減輕了服務(wù)器成本又提高了上傳速度。 波浪紋消除 部分用戶在使用ocr識(shí)別過(guò)程中,會(huì)上傳用手機(jī)拍攝的圖片,這類圖片上通常會(huì)出現(xiàn)一串串波浪紋,看起來(lái)不太影響圖片的質(zhì)量,但對(duì)OCR識(shí)別造成了一定的干擾,這就要求在OCR技術(shù)開(kāi)發(fā)過(guò)程中,需要考慮能消除此類波浪紋的算法,提升OCR識(shí)別的精準(zhǔn)性。 無(wú)效背景要素消除 識(shí)別目標(biāo)圖片過(guò)程中,會(huì)遇到各種各樣雜亂無(wú)章的背景,這些會(huì)和主體內(nèi)容融合在一起,干擾OCR的精準(zhǔn)識(shí)別,比如掃描圖書(shū),就會(huì)受到背面文字印跡的干涉,還有被識(shí)別圖片存在臟污、破壞、不完整等情況,這些都是需要ocr識(shí)別技術(shù)能消除雜亂背景,完成精準(zhǔn)識(shí)別。 自動(dòng)分段和選區(qū) 假如設(shè)別目標(biāo)是一張報(bào)紙后者圖片,那么會(huì)遇到兩個(gè)問(wèn)題,一個(gè)是每篇文章都會(huì)有很多段落,但OCR一般都是一行行的識(shí)別返回內(nèi)容,這就需要ocr能夠?qū)崿F(xiàn)自動(dòng)分段排版的技術(shù),方便后續(xù)工作人員的錄入編輯工作;另一個(gè)是報(bào)紙每個(gè)版面都會(huì)有各種各樣的排版,不同的文章都是小方塊的形式展現(xiàn),這就需要ocr能夠?qū)崿F(xiàn)自動(dòng)選區(qū)功能,把需要識(shí)別的文章小方塊單獨(dú)識(shí)別出來(lái)。 |