文字識別技術,書頁由此轉化為文字檔案怎麼搞

2022-04-17 20:20:04 字數 520 閱讀 6919

1樓:世界因你er精彩

office在2003版中增加了document imaging工具,用它可以檢視、管理、讀取和識別影象文件和傳真文字。其實,利用它的這個功能,我們還可以把網頁或電子書中的文字給「摳」出來。

在「開始」選單的「microsoft office工具」中開啟microsoft office document imaging,在左側視窗中單擊滑鼠右鍵,選擇「貼上頁面」,把複製的**貼上到document imaging中,在「工具」中選擇「使用ocr識別文字」,document imaging的ocr識別程式就會對**進行識別,完成後選擇「工具」中的「將文字傳送到word」,程式會自動開啟word文件,展現在你面前的就是從**中「摳」出來的文字

2樓:方括號

用掃瞄器將書按頁掃瞄成黑白**存放在電腦裡(用數位相機拍照也可以,但效果沒有掃瞄器好),然後用ocr類軟體(比如漢王文字王)對**進行文字識別,儲存為word文件或者txt檔案就可以了。

具體的操作其實並不很複雜。

java讀取整個文字檔案

file f new file z pri bad.pri filereader r new filereader f bufferedreader b new bufferedreader r string s while s b.readline null b.close r.close 讀取某...

什麼是超文字檔案什麼叫超文字

超文字 超文字 hypertext 是一些特殊的文字,當在這些文字上按下滑鼠,就會通過鏈結跳轉到其佘的頁面。而這個頁面可能在本機上,也可能在其它的機器上。html 所有在瀏覽器中使用的檔案都是用一種叫html的語言與的。它的全稱是超文字標記語言 hyper text markup language ...

批量替換不同的文字檔案裡面的文字

放到word裡面 按ctrl f,選擇替換 然後就可以把要替換的字自己打上去就行了 1 對於內容相似的文字 先用 快速選擇 選中這些文字,然後滑鼠右鍵 特性 文字內容 統一改為相同的英文。2 對於內容完全的文字 可直接用選單 編輯 查詢 文字替換,進行修改。補充 快速選擇的使用方法如下 以選中文字 ...