如何将WEB页转换为PDF格式

kuaidi.ping-jia.net  作者:佚名   更新日期:2024-07-02
如何将web格式转换成pdf格式

建议你是用acrobat 或者abbyy 这个 两款软件进行转换编辑



Adobe公司推出的PDF格式是一种全新的电子文档格式。借助 Acrobat ,您几乎可以用便携式文档格



adobe-acrobat-x



式 (Portable Document Format,简称 PDF) 出版所有的文档。 PDF 格式的文档能如实保留原来的面貌和内容,以及字体和图像。这类文档可通过电子邮件发送,也可将它们存储在WWW 、企业内部网、文件系统或CD-ROM上,来供其他用户在 Microsoft Windows , Mac OS和 LINUX 等平台上进行查看。由于该格式使用Adobe公司开发的PostScript页面描述语言,使得页面中的文字和图形的质量得到质的飞跃。无论您是使用PDF文档进行网上阅读,还是打印、印刷出版,Adobe Acrobat都能给你最好效果。



ABBYY 是一家俄罗斯软件公司,在文档识别,数据捕获和语言技术的开发中居世界领先地位。其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可管理的电子数据,可以大大节省您的时间和精力。

一、iText介绍
  iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。
  iText的安装非常方便,在http://www.lowagie.com/iText/download.html - download 网站上下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。
  二、建立第一个PDF文档
  用iText生成PDF文档需要5个步骤:
  ①建立com.lowagie.text.Document对象的实例。
  Document document = new Document();
  ②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。
  PDFWriter.getInstance(document, new FileOutputStream("Helloworld.PDF"));
  ③打开文档。
  document.open();
  ④向文档中添加内容。
  document.add(new Paragraph("Hello World"));
  ⑤关闭文档。
  document.close();
  通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"Hello World"。
  建立com.lowagie.text.Document对象的实例
  com.lowagie.text.Document对象的构建函数有三个,分别是:
  public Document();
  public Document(Rectangle pageSize);
  public Document(Rectangle pageSize,
  int marginLeft,
  int marginRight,
  int marginTop,
  int marginBottom);
  构建函数的参数pageSize是文档页面的大小,对于第一个构建函数,页面的大小为A4,同Document(PageSize.A4)的效果一样;对于第三个构建函数,参数marginLeft、marginRight、marginTop、marginBottom分别为左、右、上、下的页边距。
  通过参数pageSize可以设定页面大小、面背景色、以及页面横向/纵向等属性。iText定义了A0-A10、AL、LETTER、 HALFLETTER、_11x17、LEDGER、NOTE、B0-B5、ARCH_A-ARCH_E、FLSA 和FLSE等纸张类型,也可以通过Rectangle pageSize = new Rectangle(144, 720);自定义纸张。通过Rectangle方法rotate()可以将页面设置成横向。
  书写器(Writer)对象
  一旦文档(document)对象建立好之后,需要建立一个或多个书写器(Writer)对象与之关联。通过书写器(Writer)对象可以将具体文档存盘成需要的格式,如com.lowagie.text.PDF.PDFWriter可以将文档存成PDF文件, com.lowagie.text.html.HtmlWriter可以将文档存成html文件。
  设定文档属性
  在文档打开之前,可以设定文档的标题、主题、作者、关键字、装订方式、创建者、生产者、创建日期等属性,调用的方法分别是:
  public boolean addTitle(String title)
  public boolean addSubject(String subject)
  public boolean addKeywords(String keywords)
  public boolean addAuthor(String author)
  public boolean addCreator(String creator)
  public boolean addProducer()
  public boolean addCreationDate()
  public boolean addHeader(String name, String content)
  其中方法addHeader对于PDF文档无效,addHeader仅对html文档有效,用于添加文档的头信息。
  当新的页面产生之前,可以设定页面的大小、书签、脚注(HeaderFooter)等信息,调用的方法是:
  public boolean setPageSize(Rectangle pageSize)
  public boolean add(Watermark watermark)
  public void removeWatermark()
  public void setHeader(HeaderFooter header)
  public void resetHeader()
  public void setFooter(HeaderFooter footer)
  public void resetFooter()
  public void resetPageCount()
  public void setPageCount(int pageN)
  如果要设定第一页的页面属性,这些方法必须在文档打开之前调用。
  对于PDF文档,iText还提供了文档的显示属性,通过调用书写器的setViewerPreferences方法可以控制文档打开时Acrobat Reader的显示属性,如是否单页显示、是否全屏显示、是否隐藏状态条等属性。
  另外,iText也提供了对PDF文件的安全保护,通过书写器(Writer)的setEncryption方法,可以设定文档的用户口令、只读、可打印等属性。
  添加文档内容
  所有向文档添加的内容都是以对象为单位的,如Phrase、Paragraph、Table、Graphic对象等。比较常用的是段落(Paragraph)对象,用于向文档中添加一段文字。
  三、文本处理
  iText中用文本块(Chunk)、短语(Phrase)和段落(paragraph)处理文本。
  文本块(Chunk)是处理文本的最小单位,有一串带格式(包括字体、颜色、大小)的字符串组成。如以下代码就是产生一个字体为HELVETICA、大小为10、带下划线的字符串:
  Chunk chunk1 = new Chunk("This text is underlined", FontFactory.getFont(FontFactory.HELVETICA, 12, Font.UNDERLINE));
  短语(Phrase)由一个或多个文本块(Chunk)组成,短语(Phrase)也可以设定字体,但对于其中以设定过字体的文本块 (Chunk)无效。通过短语(Phrase)成员函数add可以将一个文本块(Chunk)加到短语(Phrase)中,如:phrase6.add(chunk);
  段落(paragraph)由一个或多个文本块(Chunk)或短语(Phrase)组成,相当于WORD文档中的段落概念,同样可以设定段落的字体大小、颜色等属性。另外也可以设定段落的首行缩进、对齐方式(左对齐、右对齐、居中对齐)。通过函数setAlignment可以设定段落的对齐方式, setAlignment的参数1为居中对齐、2为右对齐、3为左对齐,默认为左对齐。
  四、表格处理
  iText中处理表格的类为:com.lowagie.text.Table和com.lowagie.text.PDF.PDFPTable,对于比较简单的表格处理可以用com.lowagie.text.Table,但是如果要处理复杂的表格,这就需要 com.lowagie.text.PDF.PDFPTable进行处理。这里就类com.lowagie.text.Table进行说明。
  类com.lowagie.text.Table的构造函数有三个:
  ①Table (int columns)
  ②Table(int columns, int rows)
  ③Table(Properties attributes)
  参数columns、rows、attributes分别为表格的列数、行数、表格属性。创建表格时必须指定表格的列数,而对于行数可以不用指定。
  建立表格之后,可以设定表格的属性,如:边框宽度、边框颜色、衬距(padding space 即单元格之间的间距)大小等属性。下面通过一个简单的例子说明如何使用表格,代码如下:
  1:Table table = new Table(3);
  2:table.setBorderWidth(1);
  3:table.setBorderColor(new Color(0, 0, 255));
  4:table.setPadding(5);
  5:table.setSpacing(5);
  6:Cell cell = new Cell("header");
  7:cell.setHeader(true);
  8:cell.setColspan(3);
  9:table.addCell(cell);
  10:table.endHeaders();
  11:cell = new Cell("example cell with colspan 1 and rowspan 2");
  12:cell.setRowspan(2);
  13:cell.setBorderColor(new Color(255, 0, 0));
  14:table.addCell(cell);
  15:table.addCell("1.1");
  16:table.addCell("2.1");
  17:table.addCell("1.2");
  18:table.addCell("2.2");
  19:table.addCell("cell test1");
  20:cell = new Cell("big cell");
  21:cell.setRowspan(2);
  22:cell.setColspan(2);
  23:table.addCell(cell);
  24:table.addCell("cell test2");
  运行结果如下:
  header
  example cell with colspan 1 and rowspan 2 1.1 2.1
  1.2 2.2
  cell test1 big cell
  cell test2
  代码1-5行用于新建一个表格,如代码所示,建立了一个列数为3的表格,并将边框宽度设为1,颜色为蓝色,衬距为5。
  代码6-10行用于设定表格的表头,第7行cell.setHeader(true);是将该单元格作为表头信息显示;第8行 cell.setColspan(3);指定了该单元格占3列;为表格添加表头信息时,要注意的是一旦表头信息添加完了之后,必须调用 endHeaders()方法,如第10行,否则当表格跨页后,表头信息不会再显示。
  代码11-14行是向表格中添加一个宽度占一列,长度占二行的单元格。
  往表格中添加单元格(cell)时,按自左向右、从上而下的次序添加。如执行完11行代码后,表格的右下方出现2行2列的空白,这是再往表格添加单元格时,先填满这个空白,然后再另起一行,15-24行代码说明了这种添加顺序。
  五、图像处理
  iText中处理表格的类为com.lowagie.text.Image,目前iText支持的图像格式有:GIF, Jpeg, PNG, wmf等格式,对于不同的图像格式,iText用同样的构造函数自动识别图像格式。通过下面的代码分别获得gif、jpg、png图像的实例。
  Image gif = Image.getInstance("vonnegut.gif");
  Image jpeg = Image.getInstance("myKids.jpg");
  Image png = Image.getInstance("hitchcock.png");
  图像的位置
  图像的位置主要是指图像在文档中的对齐方式、图像和文本的位置关系。IText中通过函数public void setAlignment(int alignment)进行处理,参数alignment为Image.RIGHT、Image.MIDDLE、Image.LEFT分别指右对齐、居中、左对齐;当参数alignment为Image.TEXTWRAP、Image.UNDERLYING分别指文字绕图形显示、图形作为文字的背景显示。这两种参数可以结合以达到预期的效果,如setAlignment(Image.RIGHT|Image.TEXTWRAP)显示的效果为图像右对齐,文字围绕图像显示。
  图像的尺寸和旋转
  如果图像在文档中不按原尺寸显示,可以通过下面的函数进行设定:
  public void scaleAbsolute(int newWidth, int newHeight)
  public void scalePercent(int percent)
  public void scalePercent(int percentX, int percentY)
  函数public void scaleAbsolute(int newWidth, int newHeight)直接设定显示尺寸;函数public void scalePercent(int percent)设定显示比例,如scalePercent(50)表示显示的大小为原尺寸的50%;而函数scalePercent(int percentX, int percentY)则图像高宽的显示比例。
  如果图像需要旋转一定角度之后在文档中显示,可以通过函数public void setRotation(double r)设定,参数r为弧度,如果旋转角度为30度,则参数r= Math.PI / 6。
  六、中文处理
  默认的iText字体设置不支持中文字体,需要下载远东字体包iTextAsian.jar,否则不能往PDF文档中输出中文字体。通过下面的代码就可以在文档中使用中文了:
  BaseFont bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
  com.lowagie.text.Font FontChinese = new com.lowagie.text.Font(bfChinese, 12, com.lowagie.text.Font.NORMAL);
  Paragraph pragraph=new Paragraph("你好", FontChinese);

  小结
  iText还有很多高级的功能,这里就不一一介绍了,具体开发时可参考发布的文档。总的来说,iText是一套java环境下不错的制作PDF的组件。因为iText支持jsp/javabean下的开发,这使得B/S应用中的报表问题能得到很好的解决。由于iText毕竟不是专门为制作报表设计,所有报表中的内容、格式都需要通过写代码实现,相对于那些专业的支持可视化设计的报表软件来说,编程的工作量就有一定程度的增加。

你可以用Acrobat将网页从Internet上下载并将其转换成PDF。你可以定义版面编排,为字型及其他可视成份设定显示选项,并且为转换成PDF的网页建立书签。

由于所获的网页是PDF,你可以方便地保存,分发,以及打印它们,以便共享及作为今后之用。Acrobat使你能够将远程的,最小化格式的文件转换成为本地的充分格式化的FPD文件,你在任何时候都可以存取。

确定你的Internet或代理服务器的设置。

在你用网络截获之前,你必须设置你的Internet或代理服务器以使你进入全球资讯网。

选File->Preferences->InternetSettings.
在以下中选做一项:

在Windows中,在InernetProperties对话窗中点击Connection版,并为你的设置提供必要的信息。你的系统管理员或ISP将提供给你所需要的信息。

在Mac操作系统中,选择UseanHTTPProxyServer,然后在文本窗中输入你的代理服务器URL和端口号。

在Windows中,如果你不用InternetSettings来设置你的Internet,就必须安装InternetExplorer并且在InternetProperties对话窗中设置好,以便获准进入全球资讯网。特殊情况下,如果你从企业环境中通过防火墙进入网络,联接版中的代理服务器窗口就必须有一个有效的代理服务器的地址。一旦安装并配置好InternetExplorer,你可以任何浏览器作为你的默认浏览器。如果你的InternetExplorer版本没有InternetProperties的对话窗,你必须更新至当前版本的InternetExplorer(在Microsoft网址中可以找到).

为转换网页设置选项
在你下载网页前,需为截获网页设置选项。在这里,你将为所获得网页设置有关结构和外观的选项。

1、选择File->OpenWebPage.

注:若File菜单内没有显示OpenWebPage的指令,选File->Preferences->WebCapture,并放弃选择最上行菜单中的ConsolidateMenuItems项。当选择了这一选项后,所有关于网页截获的指令都在一个单独的网页菜单下出现。

2、点击ConversionSettings。

3、在ConversionSettings的对话窗中,点击General版。

4、在GeneralSettingsforGeneratedPDF下,选择以下的选项:

CreateBookmarkstoNewContent用网页的HTML主题标签作为书签名为每个下载的网页建立构架书签。构架书签帮助你组织和浏览你所截获的网页。
AddPDFStructure储存PDF文件内的与原始网页的HTML结构相当的构架。
PutHeadersandFootersonNewPage(Windows)或PutHeadersandFootersonNewContent(Mac操作系统)用网页的主题作为标头,用网页的URL,下载文件的页码,及日期和时间作为标尾,SaveRefreshCommands(Windows)或SaveUpdateCommands(Mac操作系统)为更新网页而在PDF文件中储存所有URL。

如何将MicrosoftWord文档转换为PDF文件?
开启MicrosoftWord格式的文本

请按在工具栏里的CreateAdobePDF按钮,或选择File>CreateAdobePDF。

在AcrobatPDFMaker4.0forMicrosoftWord对话框按Create。
当你按Create按钮时,PDF文本就会制造出来,并储存在与原文本相同的文件夹内,以后可在Acrobat中开启。

如何从MicrosoftExcel,制造一个PDF文件
开启MicrosoftExcel格式的文本
请按在工具栏里的CreateAdobePDF按钮,或选择File>CreateAdobePDF。
当你按Create时,PDF文本就会制造出来,并储存在与原文本相同的文件夹内,而后在Acrobat中被打开。

如何从MicrosoftPowerPoint,制造一个PDF文件
开启MicrosoftPowerPoint格式的文本
请按CreateAdobePDF按钮在工具栏里。
当你按CreateAdobePDF按钮时,SavePDFFileAs对话框就会显示出来:选择一个储存文件夹,并为PDF文本指定文件名,然后再按"Save"。PDF文本就会制造出来,以后可在Acrobat中打开。

如何从MicrosoftPublisher,制造一个PDF文件
开启MicrosoftPublisher格式的文本
选择File>Print
在Print对话框中,在PrinterName(打印机名称)选择AcrobatDistiller。
请按“OK”关闭对话框,转换成PDF文本。
当你按OK按钮时,SavePDFFileAs对话框就会显示。选择一个储存文件夹,并为PDF文本指定文件名,然后按Save。PDF文本就会制造出来,以后可在Acrobat中开启。

如何从AdobePageMaker制作PDF文档?
PageMaker提供了二种制造PDF格式的方式,你能够:
请按在工具栏里的AdobePDF按钮。
选择File>Export>AdobePDF
以下解释的是第一种方法,比较简便,迅速。而第二种方法使你对所制造的格式有更多的控制。(有关使用ExportAdobePDF命令的进一步信息,请参照PageMakerPlus用户手册。)

从AdobePageMakerPlus,制造一个PDF文件:
开启AdobePageMakerPlus格式的格式。
请按CreateAdobePDF按钮在工具栏里。
在ExportPDFFileTo对话框中,选择一个储存文件夹,并为这个PDF格式指定名称。请确定在SaveAsType中选择了PDF格式(*.pdf)。
请按Save。
当你按Save按钮时,AdobePDF就会格式制造出来,然后会自动在Acrobat中开启。

雪莹DocConvert虚拟打印机,能输出多种格式(其中包括你要的格式 ),还能输出高清图片格式



你发给我,我帮你转

  • 用asp将一个网页生成另一个pdf格式的网页,可以让用户在网上下载电子书或...
    答:2、用编辑工具编辑后再保存虚拟打印机文件或者直接保存问合适的网页文件或者pdf之类的易传播和打印的文件 3、用wps或者word这样的文档编辑工具。全选你所打印网页的内容,复制到工具中,调整、重新排版。保存为doc文件。这样就不存在问题吧!至于如果复制到word中我就不多讲了,不会可以百度去 4、截图。
  • 如何解决Mac上Safari无法导出pdf格式的问题
    答:因为不是所有的页面都支持pdf格式,一般的页面只能导出为html格式或者web archive格式,只有页面是PDF格式或者支持PDF格式的才能导出为PDF格式。你要是想把网页导出为PDF格式,可以这样做:打开Safari中你要导出的网页,选择文件->打印,在左下角PDF选项中,选择保存为PDF,这样就把网页保存为PDF了。
  • word2003转换成pdf怎么转
    答:由于word2003没有直接输出为pdf格式的功能,所以采用的方法是借助第三方转换工具:1. 首先打开pdf格式转换工具,选择要转的格式;2. 接着将要转换的文件添加进来,点击添加文件按钮,找到文件选中打开就行;3. 接着设置文件的保存路径,可以自定义;4. 最后点击开始转换就行了。如图:...
  • webcomplier怎么转换成pdf格式的呀?
    答:用转换pdf工具。。。
  • 5个格式转换网站学生党来看
    答:功能基本上都是围绕PDF文件进行的一些格式转换,如果仅仅是对PDF文档进行处理,建议优先选择这个PDF的功能还是挺全面的。除了转换,还能对PDF文档进行压缩转换、合并、编辑等一系列操作 Free Converter 功能非常强大,支持视频、音频、图像和文档等格式转换网站,其中视频支持将60多种格式转换为流行的视频拓展例如MP4/MKV/WebM...
  • word2003怎么把文档转换成pdf
    答:在日常工作学习有时会需要将word文档转换成pdf格式进行保存,而有不少人仍然使用的是word2003,不同于word2007及其以上版本可以较方便的进行pdf格式的转换,今天小编就教大家word2003转换成pdf格式的详细方法。office2003:http://www.cr173.com/soft/3420.html 1、下载doPDF虚拟打印机 下载到自己通常...
  • Word2007中无法将文件另存为PDF或发布XPS的处理方法
    答:★ word如何另存为pdf ★ 怎样将Word2007文档保存为PDF文件 ★ Word中2007版本进行转换成pdf格式的操作方法 ★ 解决office2007不能保存的方法步骤 ★ word2007怎么转换成pdf格式的方法 ★ word2007将word保存为pdf的技巧 var _hmt = _hmt || []; (function() { var hm = document....
  • pdf是什么格式,用什么打开
    答:PDF可以通过WPS、PS软件、OFFICE等方法打开。如果有转换、编辑等相关方面需求的可以使用嗨格式PDF转换器,这种第三方软件。嗨格式PDF转换器只需几秒钟,即可给你的PDF文件添加图片或文字水印、设置加密,以确保敏感数据的机密性。集合各种文件格式互转,图片提取,文件添加水印,PDF文件合并、拆分、压缩、加密...
  • CorelDRAWX7怎样把文档发布为PDF文件
    答:在CorelDRAWX7中将文档发布为PDF文件,可以保存原始文档的字体、图像、图形及格式。PDF文件也可以上载到企业内部网或Web,还可以将个别选定部分或整个文档导出到PDF文件中。小编将给大家介绍用CorelDRAWX7将文档发布为PDF文件的方法,希望对你有帮助!CorelDRAWX7将文档发布为PDF文件的方法1.执行“文件”“发布...
  • wordpress pdf插件哪个好用
    答:2. WP Advanced PDF:此款插件让你的用户可以以PDF格式下载你网站的帖子和网页。你可以设置所有用户或仅注册用户能以PDF格式下载内容。你能在你的PDF文件上使用自定义字体、标识,甚至加上水印。3. PDF & Print by BestWebSoft:顾名思义,此款插件为你的WordPress帖子、页面和自定义帖子类型增加了一...