Apache POI
简介
Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。
Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。
结构
HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
HWPF - 提供读写Microsoft Word DOC格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读Microsoft Visio格式档案的功能。
HPBF - 提供读Microsoft Publisher格式档案的功能。
HSMF - 提供读Microsoft Outlook格式档案的功能。
版本
稳定版
最新的稳定版是Version 3.5-final (2009-09-28)
最新版
最新的版是 Version 3.8-beta4 (2011-??-??)还在不断的完善
更新历史
Version 3.8-beta4 (2011-??-??)
Version 3.8-beta3 (2011-06-06)
Version 3.8-beta2 (2011-04-08)
Version 3.8-beta1 (2011-03-07)
Version 3.7 (2010-10-29)
Version 3.7-beta3 (2010-09-24)
Version 3.7-beta2 (2010-08-09)
Version 3.7-beta1 (2010-06-20)
Version 3.6 (2009-12-14)
Version 3.5-final (2009-09-28)
Version 3.5-beta6 (2009-06-22)
Version 3.5-beta5 (2009-02-19)
Version 3.5-beta4 (2008-11-29)
Version 3.5-beta3 (2008-09-26)
Version 3.5-beta2 (2008-08-20)
Version 3.5-beta1 (2008-07-18)
Version 3.2-FINAL (2008-10-19)
Version 3.1-final (2008-06-29)
Version 3.1-beta2 (2008-05-26)
Version 3.1-beta1 (2008-04-28)
Version 3.0.2-FINAL (2008-02-04)
Version 3.0.2-BETA2 (2008-01-12)
Version 3.0.2-BETA1 (2007-12-04)
Version 3.0.1-FINAL (2007-07-05)
Version 3.0-FINAL (2007-05-18)
Version 3.0-alpha3 (2006-12-12)
Version 3.0-alpha2 (2006-06-16)
Version 3.0-alpha1 (2005-06-04)
Version 2.5.1-FINAL (2004-02-29)
Version 2.5-FINAL (2004-02-29)
Version 2.0-FINAL (2004-01-26)
Version 2.0-RC2 (2004-01-11)
Version (2003-11-02)
Version 2.0-pre3 (2003-07-29)
Version 2.0-pre2 (2003-07-06)
Version 2.0-pre1 (2003-05-17)
Version 1.10-dev (2003-02-19)
Version 1.8-dev (2002-09-20)
Version 1.7-dev (Release date not recorded)
Version 1.5.1 (2002-06-16)
Version 1.5 (2002-05-06)
Version 1.2.0 (2002-01-19)
Version 1.1.0 (2002-01-04)
Version 1.0.2 (2002-01-11)
Version 1.0.1 (2002-01-04)
Version 1.0.0 (2001-12-30)
Version 0.14.0 (2001-12-22)
Version 0.13.0 (2001-12-16)
Version 0.12.0 (2001-12-12)
Version 0.11.0 (2001-12-08)
Version 0.10.0 (2001-12-02)
Version 0.7 (and interim releases) (2001-11-17)
Version 0.6 (2001-11-11)
Version 0.5 (2001-11-05)
Version 0.4 (2001-10-31)
Version 0.3 (2001-10-26)
Version 0.2 (2001-09-24)
Version 0.1 (2001-08-28)
代码示例
创建Excel 文档
示例1将演示如何利用Jakarta POI API 创建Excel 文档。
示例1程序如下:
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFCell;
import javaioFileOutputStream;
public class CreateXL {
public static String outputFile="D:\\\\test.xls";
public static void main(String argv[]){
try{
// 创建新的Excel 工作簿
HSSFWorkbook workbook = new HSSFWorkbook();
// 在Excel工作簿中建一工作表,其名为缺省值
// 如要新建一名为"效益指标"的工作表,其语句为:
// HSSFSheet sheet = workbook.createSheet("效益指标");
HSSFSheet sheet = workbook.createSheet();
// 在索引0的位置创建行(最顶端的行)
HSSFRow row = sheet.createRow((short)0);
//在索引0的位置创建单元格(左上端)
HSSFCell cell = row.createCell((short) 0);
// 定义单元格为字符串类型
cell.setCellType(HSSFCell.CELL_TYPE_STRING);
// 在单元格中输入一些内容
cell.setCellValue("增加值");
// 新建一输出文件流
FileOutputStream fOut = new FileOutputStream(outputFile);
// 把相应的Excel 工作簿存盘
workbook.write(fOut);
fOut.flush();
// 操作结束,关闭文件
fOut.close();
System.out.println("文件生成...");
}catch(Exception e) {
System.out.println("已运行 xlCreate() : " + e );
}
}
}
读取Excel文档中的数据
示例2将演示如何读取Excel文档中的数据。假定在D盘JTest目录下有一个文件名为test1.xls的Excel文件。
示例2程序如下:
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFCell;
import javaioFileOutputStream;
public class ReadXL {
public static String fileToBeRead="D:\\\\test1.xls";
public static void main(String argv[]){
try{
// 创建对Excel工作簿文件的引用
HSSFWorkbook workbook = new HSSFWorkbook(newFileInputStream(fileToBeRead));
// 创建对工作表的引用。
// 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
HSSFSheet sheet = workbook.getSheet("Sheet1");
// 也可用getSheetAt(int index)按索引引用,
// 在Excel文档中,第一张工作表的缺省索引是0,
// 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
// 读取左上端单元
HSSFRow row = sheet.getRow(0);
HSSFCell cell = row.getCell((short)0);
// 输出单元内容,cell.getStringCellValue()就是取所在单元的值
System.out.println("左上端单元是: " + cell.getStringCellValue());
}catch(Exception e) {
System.out.println("已运行xlRead() : " + e );
}
}
}
设置单元格格式
在这里,我们将只介绍一些和格式设置有关的语句,我们假定workbook就是对一个工作簿的引用。在Java中,第一步要做的就是创建和设置字体和单元格的格式,然后再应用这些格式:
1、创建字体,设置其为红色、粗体:
HSSFFont font = workbook.createFont();
font.setColor(HSSFFont.COLOR_RED);
font.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD);
2、创建格式
HSSFCellStyle cellStyle= workbook.createCellStyle();
cellStyle.setFont(font);
3、应用格式
HSSFCell cell = row.createCell((short) 0);
cell.setCellStyle(cellStyle);
cell.setCellType(HSSFCell.CELL_TYPE_STRING);
cell.setCellValue("标题 ");
处理WORD文档
import javaio*;
import org.textmining.text.extraction.WordExtractor;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFCell;
public class TestPoi {
public TestPoi() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("D:\\\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
//System.out.println("the result length is"+str.length());
System.out.println(str);
}
}