Java如何读取Word批注中的文本和图片

互联网 19-11-28
本文将介绍读取Word批注的方法,包括读取Word批注中的文本及图片。下面将通过Java代码来演示如何读取批注。

工具使用:Word类库(Free Spire.Doc for Java 免费版)

Jar文件获取:可通过官网下载,下载后解压文件,并将lib文件夹下的Spire.Doc.jar文件导入java程序;也可以通过Maven仓库安装导入。,具体路径配置及导入方法可以参考教程https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html。

(推荐学习:Java视频教程

测试文档如下:批注中包含文本和图片

【示例1】读取批注中的文本

import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.TextRange;  public class ReadComment {     public static void main(String[] args) {         //加载测试文档         Document doc = new Document();         doc.loadFromFile("sample.docx");          //实例化String类型变量         String text = "";          //遍历所有批注         for(int i = 0;i< doc.getComments().getCount();i++){             Comment comment = doc.getComments().get(i);             //遍历所有批注中的段落             for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {                 Paragraph paragraph = comment.getBody().getParagraphs().get(j);                 //遍历段落中的对象                 for (Object object : paragraph.getChildObjects()) {                     //读取文本                     if (object instanceof TextRange) {                         TextRange textRange = (TextRange) object;                         text = text + textRange.getText();                     }                 }             }         }         //输入文本内容         System.out.println(text);     } }

批注文本读取结果:

【示例2】读取批注中的图片

import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.DocPicture;  import javax.imageio.ImageIO; import java.awt.image.RenderedImage; import java.io.File; import java.io.IOException; import java.util.ArrayList;   public class ExtractImgsInComment {     public static void main(String[] args) throws IOException{         //加载测试文档         Document doc = new Document();         doc.loadFromFile("sample.docx");          //创建ArrayList数组对象         ArrayList images = new ArrayList();          //遍历所有批注         for(int i = 0;i< doc.getComments().getCount();i++){             Comment comment = doc.getComments().get(i);             //遍历所有批注中的段落             for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {                 Paragraph paragraph = comment.getBody().getParagraphs().get(j);                 //遍历段落中的对象                 for (Object object : paragraph.getChildObjects()) {                     //获取图片对象                     if(object instanceof DocPicture){                         DocPicture picture = (DocPicture) object;                         images.add(picture.getImage());                     }                 }             }         }         //提取图片,并指定图片格式         for (int z = 0; z< images.size(); z++) {             File file = new File(String.format("图片-%d.png", z));             ImageIO.write((RenderedImage) images.get(z), "PNG", file);         }     } }

批注图片读取结果:

本文来自php中文网,java教程栏目,欢迎学习!

以上就是Java如何读取Word批注中的文本和图片的详细内容,更多内容请关注技术你好其它相关文章!

来源链接:
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
标签: 读取word
上一篇:php获取远程图片并下载保存到本地的方法分析 下一篇:java弱引用的理解与使用

相关资讯