印刷新闻 印刷技术 印刷展会 印刷词典 院校社团 印刷企业 印刷杂志 电子书库

台湾传播科技研讨会(04)——XML文件结构与应用

师范大学资讯教育系 叶耀明教授 更新日期:2003-05-23

XML语言是目前资讯界很重要的一个发展,许多人都认为它会是电子商务发展最佳的一个平台,我们这就来看看XML对将来会带来什么样的冲击。

网路的发展大约是从80年代开
,第一个网路语言是1985年开发出的HTML语言,在提出这个语言之成立了一个组织叫W3C,这个组织是目前全世界主导WWW发展的一个重要组织。96年以后这个组织认为有必要再开发下一的语言,於是在98年提出了XML语言这个架构,我把它定位为第二代的WWW,这第二代的WWW会产生一个重要的时期,也就是一个资讯全自动化的时代。为什么是一个资讯全自动化的时代?因为在过去HTML的时代,要在网路上找资讯,需要人工处理,而XML则可以让网页的资讯利用电脑自动处理,就好像过去工业革命以机器代替人工,现在XML语言的开发才是资讯革命的完成。

XML基本上是一种电子文件语言并非程式语言,和电子书有点类似。文件语言的用途有两种:一是文书处理,包括Tex、Doc、PDF等;一是资料交换,如SGML、HTML、XML。我认为XML很有可能统一所有文件语言,例如现在的Office2000,如果要将Word或Power
Point文件转换网页时,都已经开始支援XML语言。

XML的全名是eXtensible Markup
Language, Markup Language意思是指电脑语言中标示语言,类似我们一般标点符号的功能,作用是方便阅读、印刷、资讯交换。

XML虽然是HTML语言的第二代,但它的特性与HTML有很大的差异,基本上它是延伸自SGML(Standard
Generalized Markup Language),SGML是指ISO电子文件语言,而SGML又是来自1969年IBM所研发出来的GML语言。

这张投影片是SGML格式的e-mail原始码

这是一张以XML所写的网页和上一张来比较就可以发现,利用XML就可以用个人的习惯来制作适合自己使用的标签。

这是另个例子,电脑发展到现在,一直没有属於中文的语言出现,可是到了XML语言出现,就可以发展出属於中文的文件语言来,其中中文部份只要使用Unicoad
国际标准码,那不只是繁体中文,在简体中文、日文、韩文等,双位元字码的国家,也可使用XML来建立自己的文件语言格式。

在目前的HTML网页的格式中,有许多限制:
. HTML是只有提资料表述。
. 浏览器的标准太过牵强。

搜寻引擎在回传讯号时,会受到相当多的冲撞,影响传输速率。
. 外挂功能困难。
. 无法明确叙述所联结的相关网页。
. 只能作单向联结。
. 网路上的资源只有在网路上可以使用。

XML的优点:
. 采用开放式平台。

可以依照使用者工作领域定义自己的文件语言控制标签。
. 任何应用程式都可以阅读网页内容。

XML与浏览器的关系

.XML改变了浏览器的内部结构在目前的IE5.0已可读取XML文件,


.XML使”Hypertext”网页变成”Application”网页将来会让所有的应用程式都变成浏览
内的应用程式。也就是在XML语言中的浏览器中,可以读到像World、Excel等程式的文件。

目前的浏览器只有两个作用,一个是翻译HTML文件,一是将网页显示出来。

新的浏览器在XML文件进来之后会有一个先期作业,如果使用自己定义的XML标签就需要用到另一种程式,这些程式的写法有两种,一是用JAVA,一是ASP。

这是浏览器内部的结构。在开启一个XML档案的同时,会读入另一个XML的档案,之后两个档案作结合,结合后才会产生我们在浏览器上看见的画面。

以往的Web的管理是File System
的管理方式,未来在XML的架构中,就会是一种资料库的管理。另外一个重要的功能,就是增加网页阅读的族群,也就是说,在过去网页是人在阅读,在XML发展之后就会增加一个族群叫「Machine
Reader」,就是让机器来读网页内容。

阅读网页,在目前和未来XML架构中的不同,就是XML多了一个Agents帮人看网页。另外在后端资料库上,也会产生一个新的资料库结构,就是Hierarchical
Data的结构。过去的资料库只容纳在一个公司中,而Hierarchical
Data的结构可以容纳全世界的资料。

XML与E-Commerce的关系

XML提供电子商务最佳平台


.XML提供了同一种应用在各企业之间的统一文件格式


.XML提供了电脑不同应用之间的统一资料格式,如Office软体中Word和Excel等程式,可以建立一个共同的格式让彼此可以阅读文件。


.XML提供了资讯全自动化的Solution

XML在电子商务的运用方面,对B2B和C2C而言绝对是最佳平台。而B2C领域上,其实使用HTML或XML语言都可以,但是在后端如果牵涉到物流、仓储时就是属於B2B范围,需使用XML语言。