学院首页>冲浪宝典>网管知识>巧将各种文档转换后进行Web发布

巧将各种文档转换后进行Web发布

作者:刘瑞荣 来源:赛迪网 添加时间:2006-5-21 15:00:01
你可能会有大量的商务材料要在Web上发布:案例和图表、行业技巧、说明书、公司电话目录、年度报告等等。当然,在企业内部的Web网中包含的信息可能会更多,问题在于怎样把不同格式的电子文件转成Web格式。 

如果你的文档已经是电子格式,那你已经成功一半了。我们将介绍一些小技巧,把这些桌面上的文档转换成适合在Web上发布的文件格式。 

什么样的文档适合Web 

首先,你可能会问,我可以把Microsoft Word文档放在Web上吗?嗯,这是可以的,但是不通用,因为Web浏览器不知道怎样显示这些内容。 

任何软件都能显示它自己创建的文档,这一点都不稀奇。但是,大多数电脑的文档格式都是专用的,是有所有权的。也就是说,这些文档是以一种他人程序无法显示的方式进行编码的。举个例子,要在电脑上打开一个这个电脑没有安装的软件所创建的文档,基于上述原因,就必须要进行格式转化。这样做的结果是,你可能会丢失一些格式(间距、字体、加粗文本)。在不同平台的电脑之间,如Macintosh到PC之间,转换文件会产生更大的不同。 

Web文档最大的好处是在很大范围内这些文档可以通用。所有电脑平台上的所有浏览器都能解释执行。在PC上建立的网页,Macintosh或UNIX的浏览器也都能浏览。 

根据HTML定义,Web语言HTML(超文本标记语言)不是某种软件语言,而是一个文本标记系统。当你用字处理软件插入不透明、不可见代码来显示加粗、倾斜的文本,HTML编写程序就会插入透明或可见的代码,也即标记。这些标准标记不仅告诉浏览器怎样显示粗体和斜体文本,同时也描述了文档的结构(如:段落),并标记了放置图片和超链接等对象的位置。 

如果你想查看Web文档的HTML源文件,可以单击Web浏览器的查看(View)选单中的源文件(Source)选单项。 

转换方法 

1.手工转换 

把文档转为HTML文件的一个方法是手工重新创建。你可以在Web编写程序中打开一个空文件,把原文档的文本拷贝粘贴到新HTML文件中。如果只有几个文档要转换,这种方法还可以。但是许多人都没有时间去学习新软件的使用方法,尤其是当他们需要立即从Web上获取文件的时候。 

2.自动转换 

令人高兴的是,现在最流行的软件都提供HTML转换功能(自动转换)。只是这类转换都不太令人满意。可以达到什么样的满意程度要看源文件的复杂程度。 

例如,字处理软件中输入的字母和备忘录一般都是非常简单的文档。格式一般包括段落、粗体或斜体文本、标题、列表。这类文档都能很好地转成HTML。 

另一方面,新闻、说明和表单常常都包含有分栏文本、固定的间距、五颜六色的对话框以及精确定位的图片。很明显,这些格式不能完全转换过去,因为它们不能作为结构化布局的内容。 

当然,转换生成的HTML文档也存在浏览器的兼容性问题。以前曾提到过,HTML文档大都通用,但是当你用字处理软件的自动转换功能转换文档之前,你要弄清楚你的用户是什么人、喜欢用什么浏览器。 

转换实例 

1.Word 2000 

可以直接在Word 2000里转换文档。从“文件(File)”选单选择“保存为网页(Save As Web Page)”。接着可以给文档输入一个新标题,也就是显示在浏览器标题栏里的内容。你也可以给这个文件重新命名,不过要注意扩展名一定是HTM或HTML,然后单击“保存(Save)”。 

Word自己创建的Web页中插入了许多它自身的代码,即使你先把这个文件存成纯文本文件,也会产生这些垃圾代码。对于简单的文档你可以不去管这些不相干的代码。有经验的Web编写人员喜欢删掉它们,因为这些垃圾代码让整个文档显得很乱。实际上,一些Web编写程序还提供专门的命令来清除Word建立HTML文档时产生的垃圾代码。 


在Word中实现文本转换只是一个简单的另存命令(Save as)。 

转换Word文档的时候,一定要先保存源文档,转换文件的过程中,Word会关闭源文件而不进行保存,所以你做的任何改动都会丢失掉。 

2.Excel 2000 

把Excel文档转换成HTML,跟转换Word文档类似,单击“文件(File)”选单的“保存为网页(Save As Web Page)”命令。但是Excel还有更多有趣的功能。一方面,你可以选择保存单个个人工作表,或是整个工作簿,这对转换一批文件很有帮助;另一方面,你可以单击“添加交互性(Add Interactivity)”对话框。 

交互式Web文档真正可以让用户修改电子数据表。这种Web文档与真的Excel文档看上去非常相似,它甚至还有Excel用户熟悉的附加标记(+)型光标。你不仅可以输入/删除数据,使用Pared-down选单,你还可以剪切、粘贴、排序、自动求和、自动过滤,并把更新后的电子数据表导出为XLS文件,你还可以选择文档的某部分进行转换。使用属性工具箱你可以修改电子数据表的格式。Web用户不能修改Web文档,因此你也不必担心会有什么人删掉你的原始公式。 

不过,经过Excel 2000转换生成的这些交互式的文档在应用上有些局限性,只有Microsoft的IE 4.01或以上版本的浏览器能够浏览这些交互式的网上Excel文档。尽管我们认为升级浏览器是值得的,不过绝大多数Web浏览者可能不这样认为。换句话说,对你的Web文档应用这些新功能是要多加小心。 

在桌面上浏览转换过的Excel文档,要先打开一个浏览器,用“文件(File)”选单中的“打开(Open)”选项选择你硬盘上的文档,或者单击发布(Publish)按钮,在“发布为网页(Publish As Web Page)”对话框的下部将“在浏览器打开发布的网页(Open Published Web Page In Browser)”选项置为选中状态。 

没有交互性的Excel 电子数据表,很明显,没多大用处。要想打印数据表,就需要先调整一下,如重新调整一下列宽、加粗标题、添加边框。如果还想知道Excel工作簿在HTML(无交互性)里是个什么样子,可以单击“文件(File)”选单里的“网页预览(Web Page Preview)”选单项预览一下。 

同样,Excel转换HTML时也添加了很多无关代码,因为在HTML中再次生成数据表需要插入HTML表格标记代码。这是用于建立行和列的一组特定标记,如果工作表中单元格数为奇数,Excel的转换可能会出问题。 

3.PageMaker 6.5 

如果你的公司定期设计并且打印说明书和其他一些广告,就有可能使用像Adobe PageMaker这样的页面排版软件来创建文档,用这个软件进行文件格式转换相当合适,如果第一次转换不太满意,它还提供多种方式修改文件。 

首先,单击“文件(File)”→“导出(Export)”→HTML,在其后弹出的对话框中有很多设置选项。先单击“新建(New)”建立转换设置,然后在对话框里输入文档标题,并单击你想转换的文档元素,可以设置整个页面,也可以分开来做;接着单击“完成(Done)”。 

接下来单击“选项(Options)”按钮,看看你想保持原来PageMaker的布局,是用多列,还是决定以无列的形式来保存文档,这是HTML文档的典型界面。保持原格式,在Approximate Layout框中设置选中标记。跟Excel类似,PageMaker使用HTML表格标记重新建立列,其中,文本可能不在原来的列,因此建议开始的时候先试试,看看会发生什么,以免丢失格式。 

在选项框里,你可以为文件的某部分指定格式,并说明你想让PageMaker把你的图片转成什么格式。笔者建议你使用缺省设置。试过几次之后,你就会清楚你是否需要进行重新设置。 
最后,单击“文档(Document)”按钮。在硬盘上选择新HTML文档的存放路径。如果你的文档里有图片,而且还想把它们放在另一个文件夹里,单击“图形(Graphics)”按钮,告诉PageMaker应该存在哪儿,然后单击“导出为HTML(Export HTML)”按钮。 

要查看转换结果,只需要打开Web浏览器,单击“文件(File)”→“打开(Open)”选单项,打开硬盘上存放的那个文档。可能大多数PageMaker文档以HTML的格式来看会有很大差别,例如,某项内容没有转换。PageMaker不转换它自己绘制的图片、变形的物体(倾斜的、旋转过的、移动过的)、盖住的物体(被其他形状遮住了一部分)。 

4.修补PageMaker转换 

要尽可能地使HTML文件输出比较理想,你可能需要编辑一下你的PageMaker文档。用“另存为(Save As)”选单项重新命名,以免丢失源文档的格式。因为PageMaker不能输出盖住的物体,所以转换之前尽量不要让物体被遮住。为了保持变形图片的样子,使用图片编辑器对图片进行加工,并重新导出到文档。 

如你所知,转换页面布局较为复杂的文档要有多次尝试、不怕出错的心态,这对培养HTML编写人员解决小问题的技巧很有帮助。用HTML编辑工具,或者简单的文本编辑器(如Windows写字板或记事本),可以缩放文本或者删除排版古怪的内容,但是别希望能好好编辑PageMaker建立的HTML文件。为了在布局上更接近一些,PageMaker必须要插入一些特别的HTML编码,即使是一个熟练的HTML编写人员也会因为要尝试很多次以修补文档而失去信心。 

但是,如果你不能在HTML中保持源文档的格式,一定要记住,你可以让PageMaker忽略那种格式,并把文本和图形转换到一个大的列中,再到“选项(Options)”中去掉“Approximate Format”复选框中的选中标记。即使你丢失了一些格式,单一的列格式反而更容易在Web上显示出来。 

5.PageMaker To PDF 

如果你的源文件在PageMaker中,最佳发布程序是Adobe的PDF,这是一种保持文档原始外观的格式,容易在Web上发布。把PageMaker文档转换成PDF的功能内建于PageMaker 6.5。PDF文档的唯一不足之处在于,Web用户必须在他们的电脑上安装Acrobat Reader软件才能浏览文档。 

如果你的PC机上安装了PageMaker,那你就很有可能安装了Reader,如果没有,你可以从Adobe的网站http://www.adobe.com/products/ acrobat/readstep/html下载最新版本。 

要把PageMaker文档转换成PDF,单击“文件(File)”→“导出(Export)”→PDF。如果你想看看新文件生成后是什么样,将对话框中的View PDF Using选项置为选中,并确定程序字段里已经选了Reader。然后,确认“跳过提炼器的工作”选项没有置为选中状态,再在单击“导出(Export)”弹出的对话框中选择你想保存PDF文件的磁盘路径,然后单击保存。 

为了使文档字体转换完后的效果最佳,我们建议你在创建PageMaker文件的同一台电脑上建立PDF文件,最后一步是在HTML文档中插入你的PDF文件,就像一个标准的超链接。代码如下:<a href= " newletter25.pdf " >Our Newletter, vol. 2, no 5 </a> 

以这种多功能格式建立的文档可以包含超链接和其他的交互特色,你甚至可以用它创建Web表单。 

后续工作 

1.给新网页命名 

为获得最佳的浏览器访问效果,在给新转换过来的网页命名时请遵循如下这些规则:命名要直观,如果有许多连续文档,给它们定个规矩,比如卷号、期号,或者在后面附上创建的年份;不要在文件名中用空格,如果你想起两个单词的名字,就用下划线替代空格(例如:Valentines_day.html);坚持用小写字母。 

2.以后的转换 

尽管转换文档很费时间,但很值得。现在,要尽可能地提供在线信息,因此提前做计划会让事情变得简单些。在这里给出一些建议: 

· 发布公司的下一个计划时,先预算出把PDF文件转换成HTML的时间(或财力)。 

· 调查你的用户,弄清楚他们想要的信息。为什么花了力气把文档转成Web格式结果却没一个人阅读? 

· 计划转换的时候,要考虑文档多长时间需要更新。如果经常需要更新,就要让文档简单些。 

3.先转换最重要的文档 

可能的话,把发布出来的那部分保存一份纯文本拷贝,这样放在多重电子格式中容易些。 

考虑一下,你的文档是否适合于只转成Web格式发布。为了使工作流简化,转换所有的文档尽量用一种方式。 

把使用的图片存为电子图片,以备Web文档中再次使用。 

4.原样发布 

在Web上原模原样发布Word文件并不是一件可笑的事情。尽管人们不能用浏览器浏览文档,但可以用浏览器下载(拷贝到硬盘或磁盘上),然后只要他们有合适的软件,就可以在桌面上打开文件。至少你知道人们有软件来打开那些文档,而且还能很好地打印出来。如果你要马上传播重要详细的信息,这也是一个选择,建立一个超链接,给网页增加一个文档,代码如下: 

<a href=" flu_shot.doc"> Click here for the flu shot release form. </a> 

这种方法提供文档,给出如何下载,打开文档的一些指导是很明智的。 

5.用TableMaker转换表格 

在Web格式的转换中最棘手的问题之一就是表格,建立所有的表格、输入数据、正确安排行和列。如果要手工完成这些工作,对于一些高手来说,也会是一场恶梦。这也是我们喜爱TableMaker(http://www.bagism.com/table maker)的原因。它简化了表格的转换过程,只需拷贝以tab或逗号分隔的表格或电子数据表,然后粘贴到TableMaker的数据字段。确认数据是以tab还是以逗号分隔,然后单击“建立表格(Make Table)”。它的准确性非常好,即使是不规则单元格里的数据,它也能转换得很好。 

TableMaker可以让你查看新表格以及HTML源代码。把代码简单地拷贝粘贴到Web页中,你甚至可以编辑表格,再建立一个表格,而且全部都是在线完成的。 

使用简单的程序可以设置表格边框、单元格填充的程度、位置,甚至还可以给表格建一个标题。 
站内搜索