這是org.apache.poi.xwpf.converter下載,WORD07轉(zhuǎn)HTML所需JAR包,org.apache.poi.xwpf.converter,入口類是HWPFDocument,當(dāng)前(3.10)版本中參考了org.apache.poi.hwpf.model和org.apache.poi.hwpf.usermodel包中的接口,后期版本中可能會(huì)不同的接口。
org.apache.poi.xwpf.converter是XWPFDocument,從這個(gè)類中可以獲取段落、圖片、表格、標(biāo)題等信息。
下載包中的示例比較少,分別在examples下的HWPF和XWPF中;另外,可以從SVN上獲取部分測(cè)試示例代碼(HWPF和XWPF)。
基礎(chǔ)信息讀取 使用org.apache.poi.hwpf.extractor.WordExtractor類,其接受input Stream或者HWPFDocument作為實(shí)例化參數(shù),使用getText()方法獲取全部paragraphs,或者使用getParagraphText()獲取每個(gè)paragraph中的文字信息
特定信息讀取 為獲取特定的文字或元素,首先需要?jiǎng)?chuàng)建org.apahce.poi.hwpf.HWPFDocument實(shí)例,通過getRange()方法獲取所有range,然后從中獲取所有paragraphs,以及更小的元素信息。
頁眉頁腳信息 獲取文檔的頁眉頁腳信息,首先需要?jiǎng)?chuàng)建org.apahce.poi.hwpf.HWPFDocument實(shí)例,然后創(chuàng)建org.apache.poi.hwpf.usermodel.HeaderStores實(shí)例,并將HWPFDocument實(shí)例作為參數(shù)傳入。通過HeaderStores實(shí)例可以獲取頁眉、頁腳、首頁、奇數(shù)頁、偶數(shù)頁等信息。另外,HeaderStores可以移除頁眉頁腳中的宏命令。
修改文本信息 使用(Range、Paragraph、CharacterRun中的)insertBefore()和insertAfter()方法可以修改相應(yīng)文本信息。
其他一些測(cè)試示例,見SVN。
基礎(chǔ)信息讀取 通過org.apache.poi.xwpf.extractor.XWPFWordExtractor進(jìn)行基礎(chǔ)信息讀取,其接受input steam或XWPFDocument作為實(shí)例化參數(shù)。調(diào)用其getText()方法可以獲取所有paragraphs、tables以及headers等中的信息。
特定信息讀取 為獲取特定文字或元素,首先需要?jiǎng)?chuàng)建org.apache.poi.xwpf.XWPFDocument實(shí)例,利用實(shí)例選擇感興趣的IBodyElement要素(Table, Paragraph等),然后獲得一個(gè)XWPFRun,最后從XWPFRun中獲取文本或?qū)傩孕畔ⅰ?span style="display:none">W35紅軟基地
頁眉頁腳信息 獲取文檔的頁眉頁腳信息,首先需要?jiǎng)?chuàng)建org.apache.poi.xwpf.XWPFDocument實(shí)例,然后創(chuàng)建org.apache.poi.xwpf.usermodel.XWPFHeaderFooter實(shí)例,并將HWPFDocument實(shí)例作為參數(shù)傳入。通過XWPFHeaderFooter實(shí)例可以獲取頁眉、頁腳、首頁、奇數(shù)頁、偶數(shù)頁等信息。
修改文本信息 從XWPFParagraph中,可以獲取組成文本信息的XWPFRun要素。如果要添加新文本,調(diào)用createRun()方法或者文本末端添加一個(gè)XWPFRun要素,insertNewRun(int)可以paragraph的指定位置添加一個(gè)XWPFRun要素。一旦有了XWPFRun,可以調(diào)用其setText(String)方法修改文本內(nèi)容,如果想增加一個(gè)空白要素,如tabs或則line breaks,需要調(diào)用addTab()和addCarriageReturn()方法。