DjVu DjVu文件格式通常使用扩展名.djvu,并在1996年被开发为Adobe PDF格式的替代品。由于先进的压缩算法 DjVu 针对扫描文档进行了优化包含图片和文字。在大多数情况下,DjVu文件比类似的PDF更紧凑.
这是你问题的简短答案。然而,最近你最近碰到这个页面,因为你最近遇到了一个DjVu文件,想知道如何打开它。因此,本文的第一部分将为您提供打开DjVu文件的所有工具和策略。而且,如果您正在深入了解DjVu的信息,那么您将位于正确的位置:本文的第二部分将为您提供有关此有趣文件格式的历史和技术背景信息,敬请期待敬请关注.!

如何打开DjVu文件?

DjVu 规范
文件名扩展名 .djvu, .djv
开发 type image/vnd.djvu, image/x-djvu
Developed by AT&T Labs – Research
Initial release 1998; 19 years ago (1998)
Latest release
Version 26
(June 2006; 11 years ago (2006-06))
GNU GPLv2
原则上有两种访问DjVu文件的方法。如果您正在寻找一个快速而肮脏的解决方案,您只需将其转换为PDF,并使用您喜爱的PDF查看器喜欢Acrobat reader: 为了转换您的DjVu,我们建议您使用在线转换器。安装离线转换器是不值得的努力,因为您可以直接切换到DjVu查看器,而您可以享受DjVu的所有优势。事实上有几个很好的理由选择第二个选项。也许文章的其余部分会说服这样做.

DjVu文件格式来自哪里?

DjVu格式是1998年在 AT&T实验室 中替代PDF格式的,其中一些突破性的像晶体管这样的发明就完成了。 DjVu的发展的主要贡献者是Yann LeCun,LéonBottou,Patrick Haffner和Paul G. Howard,DjVu开发背后的主要思想是创建一个文件格式,该文件格式针对包含图片和文字的扫描文档进行了优化。这里的一个关键要求是,新的文件格式对于这种文档的性能要优于PDF。 DjVu的一个主要优点是DjVu文件的文件大小有限。因此,它经常用于在网络上分发扫描的文档。与PDF相比,它是一种开放的文件格式,这意味着它可以由开源软件和专有软件使用,无需任何费用。 DjVu格式通常使用扩展名 .djvu ,有时也仅使用.djv.

为什么DjVu文件特别?

DjVu文件采用先进的压缩技术,比JPEG和Tiff高出约5到10倍。文件大小为25 MB的扫描页面(分辨率为300 DPI)可以使用DjVu轻松压缩到只有100 kB(!)。所有DjVus都可以配备一个文本图层,使其可搜索。这些可搜索的DjVus行为与PDF文档非常相.

实现这种优良压缩的关键是所谓的多尺度双色聚类,其允许比标准文本/图像分割更通用的前景/背景掩模分离。随着一套软模式匹配算法,DjVu使用的JBIG2压缩节拍了JBIG1压缩,这已经是双层图像长期以来的两倍。 JBIG2编码背后的原理如下:首先,该方法识别页面上几乎相同的形状,例如给定字体,样式和大小中特定字符的多次出现。然后分别压缩每个独特形状的位图,然后对每个形状在页面上显示的位置进行编码。像类似的形状只能压缩一次,而不是多次,这解释了文件大小DjVu文件通常显示的优势.
DjVu使用的压缩技术的其他关键组件是多尺度连续投影算法和所谓的ZP编码器.

具有隐藏OCR层的DjVu文件

到现在为止可以想到一个DjVu文件视为松散的rastered图像集合,它们不包含任何可搜索的文本信息,因此显得难以处理。所以我们必须习惯这样一个事实:PDF是没有讨论的更帅的格式?当然不是! DjVu的作者很聪明,可以在这里找到一个明智的解决方案:为了使DjVu文件可搜索,因此与PDF非常相似,他们在文件格式的定义中添加了一个隐藏的OCR图层。这是一种以可搜索的方式提供文本信息的一种非常经济的方式,并且保持文档的视觉外观与读者可以搜索的内容之间的严格分离。在Web中循环的大多数DjVu文件都包含这样一个文本层。 DjVu和PDF之间的主要区别在于DjVu格式是光栅图像格式,PDF格式是可扩展的矢量文件格式。这个技巧甚至允许从任何具有这样一层的DjVu中轻松地复制和粘贴文本,就像处理PDF一样使用的.

该DjVu的授权和适应

DjVu首先作为一个名为“DjVuLibre”的开源实现,并使用GNU通用公共许可证。然而,多年来,编码软件的商业开发的版权已经转移到了几家不同的公司,包括AT&T公司,LizardTech,Celartem等。尽管有些专家认为,由于出色的压缩算法,DjVu实际上是文件的格式,DjVu的使用频率高于DjVu,但由于这种开源许可,DjVu的接受度相当高。 >

由于DjVu是数字化时代的高峰期,许多书被扫描,网络上仍有许多扫描文档和书籍都使用DjVu。此外,2002年,提供数百万扫描公共领域图书的百万册项目的互联网档案也决定支持DjVu以及PDF.

该DjVu的技术文件规格

DjVu最初源于基于分层组织的块的交换文件格式(IFF)。就像IFF的情况一样,其结构之前是一个4字节的AT&T魔术数字。该标识符之后是一个标记,指示是否分别与单页(DJVU)或多页文档(DJVM)有关。这里有更多的细节肯定超出了本文的范围。然而,另一个重要的规范是DjVu的互联网mime类型,其中image / vnd.djvu或image / x-djvu。当前版本的DjVu是二10多年前发布的第26版.

DjVu的未来

虽然DjVu在过去几年的发展并没有多少进展,但是DjVus的数量一直在增长。这可能是由于DjVu文件最引人注目的强度,即它们非常紧凑的文件大小。在万维网越来越多的时候,移动设备和带宽仍然是使用DjVu的优越压缩的成本因素,可能有助于节省时间和金钱。同时,还有可以用于显示DjVus的应用程序智能手机和平板电脑。当然这是纯粹的猜测,但也许DjVu的未来可能比过去更光明。事实上,DjVu的名字实际上是一些隐藏的信息,因为它受到法国表达式DjVu [deʒavy]的启发,这意味着像“已经看到的”一样。既然你现在熟悉DjVu,你可以非常确定,只要你在网络世界中移动,你将很快再次看到它 只要你在网络世界中移动就很快.




Testimonials (Avg: 4.9 / 5) of 42