DjVu是由美国AT&T实验室于1996年开发成功的一项新的图片压缩技术。
DjVu的主要技术是将图像分为背景层(纸的纹理和图片)和前景层(文本和线条)。通过将文字和背景分离开来,DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。使用DjVu格式,用户首先会很快得到页面的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质量不断提高(这一点与JPEG格式的逐级提高精度的方法有类似之处)。
值得注意的是,虽然DjVu的原始专利归AT&T所有,但是LizardTech公司已经获得了相关专利的广泛授权,可以把这些专利无矛盾地应用于GPL许可证中(LizardTech关于DjVu开放源码许可方式的声明)。现在DjVuLibre实际上就是由它支持的一个GPL开放源码软件项目。
当今世界,超过90%的资料仍然是以纸张的形式保存,而无法在网络上下载或存放于光盘中。由于这些资料多半是极具价值的历史文件或是重要的记录报告,因此往住必须花费许多的金钱与人力来加以保存。
造成许多纸张资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度,则档案将会变得极大;但如果降低分辨率以达到较小的档案及较快的下载速度,也就意味着必须丧失图像的品质及清晰度。
一般常见的JPEG、PDF、TIFF压缩技术都无法同时达成高分辨率及较小的图像档案。
但DjVu的压缩技术则可以完全解决这些问题。
1000:1高压缩比
使用DjVu将没有任何延迟的等待时间。若比较PDF格式及DjVu格式的下载时间,对同一份50页的彩色文件而言,当DjVu下载完成后,PDF格式仅下载了一页文件。DjVu下载后的图像直接储存在计算机的内存中,并且可以在浏览器上快速地对文件进行实时的移动、缩放。换句话说,DjVu能使人们只花很少的时间来扫描、储存及下载大量文件。
各类图像格式与传输速度比较表
以一份110页、全彩300dpi高分辨率的商业演示文稿为测试,DjVu能以电子书的完整形式呈现,并可直接通过网络快速下载,清晰打印,并能针对扫描后的图像做实时的文件图像识别。
2.5GB TIFF 155MB PDF 128MB JPEG 3MB DjVu |
: : : : |
采用突破性的专利技术,产生不可思议的图像品质
DjVu能达到如此惊人的图像品质,是因为它的专利技术能够将扫描文件的图像分离。它能分辨出文字及图片的部分,并且分别储存在不同层,再分别对每一层图像以最佳化的方式进行压缩,因此能产生最好的图像品质及最小的档案。这种技术将能得到清晰的文件图像而又能保持原始文件的图像品质。
扫描的文件可上网快速下载
DjVu让您可以轻易地将大量的文件以清晰、且令人难以置信的档案大小放置在网络上,供任何人观赏。
--压缩后的图像档案比起TIFF、JPEG及PDF要小得多
--浏览器插件极小(例如PDF为5.6MB,但是DjVu只有1.6MB)
--图像品质极高且文字清晰
--可对观赏中的文件图像进行缩放、平移、分离及打印
--含有缩略图功能,能先预览所有的图像画面
可以将任何的文件放置在网页上浏览
DjVu拥有图像超级链接的功能,只要利用鼠标点选就可以轻易地建立超级链接,将所选定的区块连接至其它网站,或开启另一份新的文件。使用者的界面也极简便易学,您可以直接将扫描文件转成DjVu格式,也可以建立各种样式的超级链接。另外,DjVu提供免费下载的插件,让任何人都可以在浏览器之下观赏DjVu的文件。由于DjVu压缩后的档案相当小,您甚至可以将文件以E-mail附件的形式进行传送。
电子书功能
若您的一份文件有数百页之多,DjVu可以将其压缩成单一档案,也就是变成一本电子书的形式。您可以直接从工具栏中选取欲观看的页数或是使用上下键来观赏数百页的文件。数百页的图像能压缩成极小的档案、快速地呈现、清晰地观赏及打印,使得DjVu成为最棒的Scan-to-Web工具。另外,DjVu还可以针对扫描后图像的文字部分做实时的图像识别(PDF仅能对由文本文件转换成图像格式后的文字进行识别)。
————————————————————————————————————
与pdf比较
从技术上讲,DjVu在将书面文档转换成电子文档方面要优于PDF,关于这一点勿庸置疑,文件小、质量高、成本低。实际上,一些用PDF不可行的项目已经由DjVu圆满完成。但是DjVu是否适合您的项目呢?
让我们来看看如果一个项目有什么特点时使用PDF比较好。如果有以下特点,您应该使用PDF:
您的文件内容并不受人关注。DjVu必须跨越的一个巨大障碍就是PDF插件程序非常普遍,几乎每个人都有。很可能您的客户为了您的材料需要暂时取得DjVu浏览插件,如果您的材料对他们来讲并不重要,那么他们是不会愿意这样做的。
文件大小无关紧要。最近我们完成了一个10张CD的DjVu项目,如果我们用PDF的话,也许会需要40张CD。我们同那位美术作品的作者--一位绘画大师开玩笑说,如果我们用PDF做的话,那么他的CD架就该换成一个手提箱了。如果您的项目比较小,并且用PDF加工的文件正好适合您需要的CD目标容量,或者您的网络比较通畅,并且您的文件比较小,那么就选择PDF.
您的文档是黑白线性图。当您处理照片、彩色和复杂图形的时候,DjVu会发挥它的真正作用。如果你的项目不是很大并且文件大小不是至关紧要的,那么这种项目PDF比较适合。
您有较高的预算。将扫描文件制作成较小、高品质的PDF文件是可能的,但是工作量非常大,因而花费较高。尽管如此,有些项目还是值得的。
如果一个项目有以上方面的相反特点时用DjVu比较好。
如果有以下特点,您应该使用DjVu:
您的文件有照片和/或者彩色和/或者其他复杂图形。
文件大小非常重要。比如:一套CD或者拨号上网的用户要从忙碌的网络上下载您的文件。
您有一个大项目但预算很少。另外,通过扫描得到小PDF文件的成本非常高,尤其当它们不仅仅是黑白文件的时候。
您的文件内容受人关注。如果您放置了一些对访问者来讲比较重要的信息在网上,那么他们将会愿意容忍取得DjVu插件这个小麻烦的。
或许两者兼而有之? PDF转换可能贵也可能不贵,这取决于材料的特点以及得到目标结果需要付出的劳动量。
幸好,DjVu一直是比较便宜的选择。在DjVu项目成本中,最大的组成部分就是扫描。由于这样增加的成本最少,因此对很多项目来说,给客户同时提供两种形式的文件是可行的。
————————————————————————————————————
DjVu 的原理
DjVu 格式背后的一项主要技术是将图像分为背景层 ( 纸的纹理和图片 ) 和前景层 ( 文本和线条 ) 。传统的图像压缩格式对于简单的图片来说,还可以接受,但对于强对比色彩区域之间的色彩反差的表现则大打折扣,这也是为什么它们对于文字的还原难以令人满意的原因。一般来说,要确保文字和线条的清晰度需要较高的分辨率 ( 通常为 300dpi) ,而反映连续色彩图像和纸张的背景机理则不需要那么高的分辨率 ( 通常为 100dpi) 。因此,要提高清晰度,最好的方法就是将这些元素分为不同的层来进行处理。通过将文字和背景分离开来, DjVu 可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性,同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。
使用 DjVu 格式,用户首先会很快得到页面的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质量不断提高。例如,一张普通杂志页面上的文字在 56Kbps 调制解调器的连接下只须 3 秒钟就可出现。在其后的 1 ~ 2 秒内,背景图片的初级版本也将出现,再过几秒钟,最后的完整页面就可全部出现了。
通过 DjVu 压缩格式,以 300dpi 的分辨率扫描的彩色页面可以从 25 MB 缩小到 30 KB 至 80 KB ,而且图像质量十分优秀。对于同时包括文字和图像的彩色文件来说, DjVu 文件在同等质量下通常比 JPEG 文件小 5 ~ 10 倍。对于黑白页面来说, DjVu 文件通常比 JPEG 文件小 10 ~ 20 倍,比 GIF 文件小 5 倍。对于那些由扫描文件制作而成的黑白 PDF 图像来说, DjVu 文件也要比它们小 3 ~ 8 倍。
除了扫描文件之外, DjVu 也可用于电子生成的文件,如阿杜比的 PostScript 文件或 PDF 文件。以这些文件为对象压缩而成的 DjVu 文件,在 300dpi 的分辨率下其每页大小通常在 15KB 到 20KB 之间。
这使得高质量的彩色扫描页面的大小直逼普通的 HTML 页面 ( 平均 50KB) 。通过插件, DjVu 页面可以在浏览器窗口中任意放大和缩小,而无须占用 25MB 的内存来对图像进行全解码。通过将解码的图像部分存储在一种只占 2MB 内存的数据结构中,实际显示在屏幕上的像素是在传输过程中被解码的。这就使得图片下载的功效得到大幅度提高。
同时,由于采用分层显示,而不是等到整幅图片都被解码之后才显示,也使得图片显示的速度大大提高,用户在两三秒之内就能够迅速看到文字,其他的图像信息也会在几秒钟之内陆续显示出来。这种网上高质量图像发布的体验在传统压缩格式上是无法实现的。
DjVu 的另一个优点是,它是一个公开标准。其解码程序和部分编码程序可在网上免费获得。 DjVu 网络浏览器插件,也即 DjVu 文件的解码软件,可直接在 LizardTech 公司的主页上下载 http://www.lizardtech.com/download.html ,而且有针对 Linux, Windows 95/98/NT, Mac, 和各种 UNIX 操作系统的不同版本可供选择
_____________________________
相关软件
一、DJVU文件制作与识别:
1、DjVu Solo 3.1 ,比较古老,免费版,非商用。下载地址http://www.planetdjvu.com/resources.htm
2、DocumentExpress 4.1 Pro ,比较好用,商用,可识别西文。下载地址http://www.planet.com.sg/down.htm,波兰网站,破解补丁,http://lib.homelinux.org/DjVu%20software/Windows/DjVu_Editor_4.0_(Pro)_crack.rar,或者,ftp://oper.asu.ru/pub/BOOKS/DjVu%20software/Windows/DjVu_Editor_4.0_(Pro)_crack.rar。或者,注册机http://www.dstu2204.narod.ru/djvu/DjVuPro4_1PRO.rar。
3、Document Express Editor v5.0.0 Build 16 ,比较好用,商用,可识别。下载地址http://djvu.com.pl/download.php,注册码:
201-018-7275-037-552
156-011-9132-054-380
213-151-1836-111-317
254-113-8711-005-110
4、Document Express Editor v6.0.1 Build 1320 ,好用,商用,完全版下载地址http://www.lizardtech.co.jp/download/djvu/EditorDownload.htm,注意是日本网站,
下完后解压密码:editoreval,安装时注册码:
301-060-1174-217-755
642-060-2688-112-511
301-042-2144-611-107
274-043-2255-329-907
565-061-7311-119-080
简化汉化版下载:http://www.hanzify.org/index.php?Go=Show::List&ID=10330
5、Document Express Enterprise with DjVu v5.1 build 973(with Asian OCR),大批量制作DJVU,商用,可识别中西文。下载地址:http://www.lizardtech.com/products/doc/trial.php,填写一些信息后就可以下载,注册码:305-050-1364-138-860
179-050-2714-511-463
911-050-5355-888-225
286-050-1224-355-918
6、JRAPublish 2.000,商用,没用过,防盗版措施太严,那位试试。下载地址:http://www.planetdjvu.com/applications.htm。
7、PDF-to-DjVu Command Line Encoder,没用过,那位试试。参见下载页面:http://www.dstu2204.narod.ru/djvu/pdftodjvu_3_6.htm。
8、超星PDG文件转成DjVu。chiputao大侠的经典作品,参见:http://www.readfree.net/bbs/read.php?tid=70315&keyword=djvu。
二、DJVU阅读
1、WinDjView-0.4.1汉化绿色,用起来不错,免费。下载地址:http://www.hanzify.org/index.php?Go=Show::List&ID=10238,下面gustar书友已提供另一个下载地址。除此以外,特别推荐RAOGY书友修改的WinDjview 0.3.5 Modified by RAOGY,详见http://www.readfree.net/bbs/read.php?tid=84636&keyword=WinDjView。还有作者地址:http://sourceforge.net/projects/windjview。
2、DjVuReader v2.0.0.26,免费,用起来还行,英语、俄语版。下载地址:http://opendjvu.webhost.ru/index_en.html,要注意英语网页与俄语网页上文件版本不同。
3、DjVu Browser plugin v6.0.1 build 1233,最新蜥蜴科技阅读器插件,免费,用起来我感觉不顺当。下载地址:http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win。
4、DjVu Fancy Viewer ,免费,用起来还行。韩国人作品。官方网页:http://demo.celartem.co.kr/,这有一个可下载版,地址:http://www.dstu2204.narod.ru/djvu/djvu_fancy_viewer_1_5.rar,版本为:DjVu Fancy Viewer v1.5 Build 33-1。
三、相关网站和论坛
1、PlanetDjVu Forum,见地址: http://www.planetdjvu.com/messages.htm。
2、WinDjView论坛:地址:http://sourceforge.net/forum/forum.php?forum_id=392867。
3、Djvu,地址:http://www.djvuzone.org/home.html。
4、Djvu Library,地址:http://djvu-lib.narod.ru/dev/djvu.html,俄语的,那位俄语行。
5、Any2DjVu Server,可帮你把许多文件免费转换成DJVU格式,地址:http://any2djvu.djvuzone.org/。