互億無(wú)線 · 文檔中心

OCR識(shí)別 - 常見(jiàn)問(wèn)題


什么是OCR?
OCR(Optical Character Recognition),即光學(xué)字符識(shí)別,是一項(xiàng)先進(jìn)技術(shù)。它通過(guò)掃描等光學(xué)手段,將各類票據(jù)、報(bào)刊、書(shū)籍、文稿以及其他印刷品中的文字轉(zhuǎn)換為圖像信息。隨后,利用文字識(shí)別技術(shù),這些圖像信息被轉(zhuǎn)化為可以電子化處理的格式,方便計(jì)算機(jī)輸入和使用。

文字識(shí)別功能能識(shí)別哪些內(nèi)容?
基于深度學(xué)習(xí)技術(shù)的文字識(shí)別(OCR)可以智能地將圖片中的文字內(nèi)容轉(zhuǎn)換為可編輯的文本格式。此技術(shù)支持多種場(chǎng)景下的通用文字、卡證文字、票據(jù)單據(jù)等印刷體和手寫體文字的識(shí)別。此外,它還包括票據(jù)核驗(yàn)功能,有效替代傳統(tǒng)的人工錄入方式,極大提升工作效率。

接入文字識(shí)別OCR服務(wù),需要開(kāi)發(fā)編程能力嗎?
接入文字識(shí)別OCR服務(wù)需要一定的編程開(kāi)發(fā)能力。用戶需進(jìn)行二次開(kāi)發(fā)對(duì)接,并通過(guò)調(diào)用API接口,實(shí)現(xiàn)從圖片或掃描件中提取文字并轉(zhuǎn)換為可編輯文本的功能。識(shí)別提取后的結(jié)果需通過(guò)編程技術(shù)與用戶的業(yè)務(wù)系統(tǒng)相結(jié)合,或保存為TXT、Excel等文件格式。

我購(gòu)買了通用印刷體識(shí)別資源包,各版本接口都可以使用嗎?
不可以。通用印刷體識(shí)別、通用印刷體識(shí)別(高速版)和通用印刷體識(shí)別(高精度版)是三個(gè)獨(dú)立的接口,各自的資源包不能混用。若您購(gòu)買的是通用印刷體識(shí)別資源包,則僅限于該接口的使用。

文字識(shí)別OCR有哪些應(yīng)用場(chǎng)景?
OCR技術(shù)廣泛應(yīng)用于多個(gè)領(lǐng)域:它能自動(dòng)識(shí)別圖片或視頻幀中的關(guān)鍵文字信息,使信息搜索與審核更加迅速和精準(zhǔn),極大地提升信息分發(fā)與管理水平。同時(shí),OCR技術(shù)還可用于文檔電子化,如辦公文件、合同文檔、法律卷宗等,通過(guò)識(shí)別這些紙質(zhì)文檔中的文字信息,便于文件的保存、分類和檢索。

怎么提高識(shí)別的準(zhǔn)確率和識(shí)別速度?
提高文字識(shí)別的準(zhǔn)確率和速度,需注意以下幾點(diǎn):確保拍攝光照、背景和清晰度適宜。建議上傳JPG格式的圖片,且文件大小不超過(guò)1M。在采集圖片時(shí),盡可能放大要識(shí)別的文字區(qū)域,保證文字清晰可辨。適當(dāng)壓縮圖片大小,也能有效縮短識(shí)別時(shí)間。

文字識(shí)別是否支持方向旋轉(zhuǎn)/不同朝向的圖片文字識(shí)別?
大多數(shù)文字識(shí)別能力已經(jīng)支持圖像方向的自動(dòng)校正,可以正確識(shí)別旋轉(zhuǎn)的圖片中的文字。

文字識(shí)別是否可以批量識(shí)別?
目前,文字識(shí)別技術(shù)不支持批量識(shí)別。每次調(diào)用只能識(shí)別單張圖片,但您可以在QPS允許的范圍內(nèi)進(jìn)行多線程調(diào)用。

可以識(shí)別PDF、Word、Excel等格式文件嗎?
目前支持JPG、JPEG、BMP、TIF、WebP等圖片格式及PDF文檔的識(shí)別,但暫不支持Word、Excel等格式。如需識(shí)別這些格式的文本,可先將其轉(zhuǎn)換為圖片或PDF格式后再進(jìn)行上傳。

為什么文字識(shí)別結(jié)果不準(zhǔn)確?
文字識(shí)別結(jié)果不準(zhǔn)確可能有多種原因:圖片尺寸過(guò)小,低于15px;圖片畫(huà)質(zhì)差,如過(guò)暗、內(nèi)容不清晰;文字內(nèi)容被水印、印章或褶皺等遮擋;圖片樣式與接口支持類型不符,如身份證識(shí)別僅支持二代居民身份證。如遇錯(cuò)誤碼,請(qǐng)參考相應(yīng)的錯(cuò)誤碼進(jìn)行問(wèn)題排查。

身份證OCR是如何收費(fèi)的?
身份證OCR的收費(fèi)是按照調(diào)用接口的次數(shù)計(jì)算的。例如,若識(shí)別身份證的正反面各一次,則計(jì)費(fèi)為兩次。具體價(jià)格詳情,請(qǐng)參閱我們的產(chǎn)品定價(jià)信息。

文字識(shí)別返回的文字類型和存儲(chǔ)方式是什么?
識(shí)別完成后,返回的結(jié)果是JSON格式的字符串。用戶可以根據(jù)需要選擇不同的存儲(chǔ)方式。

現(xiàn)在注冊(cè),即享新用戶禮包!

在線咨詢
電話咨詢

服務(wù)熱線:

4008 808 898

服務(wù)熱線(工作時(shí)間):

4008 808 898

業(yè)務(wù)咨詢(非工作時(shí)間):

售后咨詢(非工作時(shí)間):

驗(yàn)證碼已發(fā)送到您的手機(jī),請(qǐng)查收!

輸入驗(yàn)證碼后,點(diǎn)擊“開(kāi)通體驗(yàn)賬戶”按鈕可立即開(kāi)通體驗(yàn)賬戶。

收不到短信驗(yàn)證碼?
互億無(wú)線不提供接碼服務(wù),接碼用戶請(qǐng)勿點(diǎn)擊開(kāi)通按鈕。
×