" />
這是tesseract-ocr-setup-3.02.02.exe 官方綠色版下載,是款功能非常強大的圖像識別類庫;這款軟件一開始是由惠普進行開發(fā)的,畫面成為了Open source,而且軟件推出之后,成績一直都是相當?shù)睦硐,不過由于時間的不斷增加,軟件也就越來越顯得力不從心,不過軟件的許多的功能還是相當?shù)牟诲e的,而且擁有的一些技術(shù)也是相當?shù)某埃顾恢钡亩荚诓粩嗟谋3种偁幜?軟件的操作簡單,運行穩(wěn)定,需要的朋友千萬不要錯過!
光學(xué)字符識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術(shù)非常專業(yè),一般多是印刷、打印行業(yè)的從業(yè)人員使用,可以快速的將紙質(zhì)資料轉(zhuǎn)換為電子資料。目前國內(nèi)水平較高的中文ocr有清華文通、漢王、尚書等,其產(chǎn)品各有千秋,價格不菲。國外OCR發(fā)展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產(chǎn)品,但是他們的研發(fā)團隊早已掌握核心技術(shù),將OCR功能植入了自身的軟件系統(tǒng)。對于一般的程序員來說,一般用不到那么高級的,主要在開發(fā)中能夠集成基本的OCR功能就可以了。
Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) (VC2005運行庫下載)安裝在未安裝 Visual C++ 2005 SP1 的計算機上運行使用 Visual C++ 開發(fā)的應(yīng)用程序所需的 Visual C++ 庫的運行時組件。
VC2005運行庫安裝 C Runtime (CRT)、Standard C++、ATL、MFC、OpenMP 和 MSDIA 庫的運行時組件。對于支持并行部署模式的庫(CRT、SCL、ATL、MFC 和 OpenMP),這些運行時組件安裝在支持并行程序集的 Windows 操作系統(tǒng)版本的本機程序集緩存中,這一緩存也稱為 WinSxS 文件夾。
托管所有代碼
存儲庫幫助您將代碼保存在一個位置,即使您使用SVN或使用Git LFS處理大文件也是如此。
由于所有GitHub計劃都包含無限的私有存儲庫,您可以根據(jù)需要創(chuàng)建或?qū)肴我鈹?shù)量的項目。自信地進行更改
以精確的提交更改代碼,以便您可以快速搜索修訂歷史記錄中的每個提交消息以查找更改。
使用blame視圖來跟蹤更改,并發(fā)現(xiàn)您的文件和您的代碼基礎(chǔ)是如何演變的。包和發(fā)布代碼
當您準備好分享時,您可以將最近關(guān)閉的里程碑或完成的項目的更改打包到新版本中。
草擬和發(fā)布發(fā)行說明,發(fā)布預(yù)發(fā)布版本,附件,并直接鏈接到最新的下載。
數(shù)年以后,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟件業(yè),讓其重煥新生--2005年,Tesseract由美國內(nèi)華達州信息技術(shù)研究所獲得,并求諸于Google對Tesseract進行改進、消除Bug、優(yōu)化工作。
Tesseract目前已作為開源項目發(fā)布在Google Project,其項目主頁在這里查看,其最新版本3.0已經(jīng)支持中文OCR,并提供了一個命令行工具。
不像其他OCR引擎(例如美國郵政業(yè)用于分類郵件的),Tesseract不能識別手寫,而且只能識別一共大約64中字體的文本。
Tesseract需要一些處理來改善OCR結(jié)果,圖像需要被放縮,圖像有非常多的差異,另外還有水平排布的文字。
最后,Tesseract僅僅支持Liuux,Windows,Mac OS X。