您的位置: 网站首页 > 公共课 > 新编计算机文化基础 > 第4章 多媒体技术 > 【4.5 图形与图像】

4.5 图形与图像

 

4.5  图形与图像

图像和图形是可以被显示、打印出来的非文本信息,但图像与图形有着本质的不同,前者是从现实世界中通过扫描仪、数码相机等设备获取的图像,主要以光栅(位图)方式描述,被称为点阵图像或位图图像,简称图像;后者是使用计算机合成(制作)的图像,主要以矢量方式描述为主,被称为矢量图形或向量图形,简称图形。下面将先介绍图像,再介绍计算机图形。

4.5.1  图像的颜色模型

颜色是人的视觉系统对可见光的感知结果。可见光指波长在380nm780nm范围内的电磁波,研究表明,我们所见的大多数光是由许多不同波长的光组合而成,而不是一种波长的光。

任何一种颜色都具有色相、饱和度和亮度三个基本属性。

色相也称为色调,指色彩的相貌,是不同波长的色光被感觉的结果,这是颜色最显著的特征。光谱中有红、橙、黄、绿、蓝、紫6种基本色光,人的眼睛可以分辨出约180种不同色相的颜色。

饱和度也称为纯度,指颜色的鲜艳程度。光谱色的饱和度最高。饱和度取决于该色中含色成分和消色成分(灰色)的比例。含色成分越大,饱和度越大;消色成分越大,饱和度越小。在纯粹的颜色中掺入白色、黑色或其他颜色,都会使该颜色变暗发灰,也就是被“消饱和”了。

亮度指颜色的明暗程度,它决定于反射光的强度。它有两种意思:一种指各种色光本身给人以不同的亮度感觉,如黄色亮度最高,紫色亮度最低,绿、红、蓝、橙的亮度相近,为中间亮度;另一种是指同一色相的颜色中还存在深浅的变化,如绿色中由浅到深有粉绿、淡绿、翠绿等亮度变化。

图像的颜色模型指彩色图像所使用的颜色描述方法。常用的有RGB模型、CMYK模型、YUV模型、HSV模型等。理论上这些颜色模型可以相互转换,下面就对这些颜色模型进行简单地介绍。

一般认为任何一种颜色都可以用红、绿、蓝三种基本颜色按不同的比例混合得到,颜色与三基色之间的这种关系用等式表示为:颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色,所以组合这三种光波以产生特定颜色就称为相加混色,也就是RGB相加模型。

RGB相加模型是计算机应用中定义颜色的基本方法。三基色等量相加时得到白色;等量的红、绿相加而蓝为0值时得到黄色;等量的红、蓝相加而绿为0值时得到品红色;等量的绿、蓝相加而红为0值时得到青色。

在计算机中除用RGB来表示图像外,还用HSL(色相,饱和度,亮度)颜色模型。HSL模型中,H(色调)定义颜色的波长;S(饱和度)定义颜色的强度,表示颜色的深浅程度;L(亮度)定义掺入的白光量,即亮度。若把SL的值设置为1,当改变H时就是选择不同的纯颜色;减小饱和度S时,就可体现掺入白光的效果;降低亮度时,颜色就暗,相当于掺入黑色。

彩色打印机和印刷彩色图片采用的是CMYK相减混色模型。理论上任何一种颜色也可以用青色、品红和黄色三种基本色按一定比例混合得到,用这种方法产生的颜色减少了视觉系统识别颜色所需要的反射光,所以称为相减色。

在相减混色中,当三基色等量相减时得到黑色;等量黄色和品红相减而青色为0值时,得到红色;等量青色和品红相减而黄色为0值时,得到蓝色;等量黄色和青色相减而品红为0值时,得到绿色。而由于彩色墨水和颜料的化学特性,用等量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色,所以CMY又写成CMYK

一般来说一个能发光的物体的颜色由该物体发出的光波决定,使用RGB相加模型来描述;而一个不发光的物体的颜色由该物体吸收或者反射的那些光波决定,则使用CMY相减模型描述。

另外,在彩色电视制式中,使用YUVYIQ模型来表示彩色图像。目前存在的两种最主要的电视制式PALNTSC,在对电视信号的处理上存在差异。我国的电视制式使用的是PAL制式,其颜色空间使用的是YUVY表示亮度,UV用来表示色差,UV是构成彩色的两个分量;而美国、日本等用的NTSC制式使用的是YIQ模型,Y表示亮度,IQ是两个彩色分量。

4.5.2  图像数据的获取

从现实世界中获得数字图像的过程称为图像的获取。

与声音的数字化十分相似,图像获取的过程实质上是模拟信号的数字化过程,大致分为以下几步:

1)扫描。画面划分成MN个网格,每个网格就是一个取样点,称为像素。这样,一幅画面就转换为MN个像素组成的阵列。

2)取样。对彩色图像每一个像素的颜色分量(RGB分量)或黑白图像(又称灰度图)像素的亮度值进行测量。

3)量化。将各像素颜色分量的亮度值使用N位二进制数来表示。

图像数字化后成了像素点的颜色量化数字阵列,这些数据的前后顺序构成了图像的位置关系和颜色成分,称为数字图像。将这些数据以一定的格式存储在文件中,形成了图像文件。

如果数字图像中每个像素的颜色值只用1位存储,那么这种图像称为二值图像(单色图像),它只有黑白两种颜色,只能保存诸如笔迹、图案拓片、黑白线条之类的图案;如果用1个字节来存储量度值,能形成256级灰度过渡的黑白照片效果,这种图像称为灰度图像;而彩色图像的每个像素的颜色信息用多个彩色分量表示,彩色图像按照颜色的数目划分为16色、256色和真彩色图像等。

数字图像可通过扫描仪、数码相机等数字设备获取。而数字图像的输出可通过显示器、打印机等输出设备实现。

4.5.3  图像的属性

图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等。

1)分辨率。

图像分辨率是指组成一幅图像的像素密度。对同样大小(相同的长度和宽度尺寸)的一幅图,如果组成该图的像素数目越多,则说明图像的分辨率越高,看起来就越精细逼真。

显示分辨率是指显示屏上能够显示出的像素数目。例如,显示分辨率为800×600表示显示屏分成600行,每行显示800个像素。屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。显示设备的分辨率可用每英寸的像素点数来度量,称为ppi

当图像在打印机或绘图仪上输出时,与输出设备有关的是打印分辨率,它描述输出设备成像的精细程度,用每英寸点数(dpi)来度量。一般激光或喷墨打印机输出分辨率若在150dpi以下,图像质量是非常糟糕的,达到300dpi以上后,图像质量较为精细。

因此,在进行图像设计时,图像分辨率、显示分辨率、打印分辨率之间的变化,会引起图像显示的尺寸与打印出来的尺寸有较大的差距。

2)像素深度。

像素深度是指存储每个像素的颜色所用的二进制位数。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。例如,一幅彩色图像的每个像素用RGB三个分量表示,若每个分量用8位量化,那么一个像素共用24位表示,就说像素的深度为24,则颜色数可达224=16777216种,可以认为是真彩色。像素深度越深,所占用的存储空间越大;像素深度太浅,影响图像的质量。由于设备和人眼分辨率的限制,一般用于显示的图像使用8位或16位的像素深度即可,用于打印照片需要达到24位的颜色深度。

3)真彩色与伪彩色。

真彩色是指图像中各像素点的颜色值直接由RGB三个分量同时确定。例如RGB都用8位来表示,共3个字节,每个像素的颜色由这3个字节中的数值直接决定,可生成的颜色数达到16777216种。这种真彩色又称为全彩色。这种表示方式需要的存储空间很大,而人的眼睛也很难分辨出这么多种颜色,因此在许多场合往往用RGB 5:5:5来表示,也就是RGB各用5位进行量化,再加1位显示属性控制位,共2个字节,生成的真颜色数目为215= 32KB。已经完全能够满足人眼对颜色辨识的需要了。

伪彩色是把像素值当作颜色索引,到颜色调色板中查找对应颜色的RGB值,用查找出的RGB值来产生彩色。彩色图像本身的像素数值和颜色索引表的索引号存在映射关系,根据查找得到的数值显示的彩色是真的,但不是图像本身的颜色,所以称为伪彩色。

4)数据量。

图像文件占据的存储器空间非常大。影响文件大小的因素主要是图像分辨率和像素深度。图像数据量与图像的分辨率、像素深度成正比关系:

图像数据量(字节)=水平像素垂直像素像素深度?8

例如一幅真彩色图像,其分辨率为800600,像素深度为24位,则图像的数据量为80060024?8=1440000B,一幅同样分辨率的256颜色的图像,像素深度为8位,数据量是480000B,而同样分辨率的二值图像,像素深度为1位,数据量仅有60000B

4.5.4  图像压缩标准

通过前面的介绍可以看出即使是单幅的数字图像,其数据量也很大,为了降低存储成本,便于数据传输,对图像的数据量进行大幅度压缩显得非常重要。由于图像在画面和色彩上都是连续的,所以数据的强相关性造成的冗余度很大,因此对数字图像进行数据压缩是完全可行的,而且人眼视觉有一定的局限性,即使压缩后的图像有些失真,只要在人眼无法察觉的误差范围之内也是允许的。

数据压缩分为有损压缩和无损压缩两类。无损压缩利用数据统计特性来编码,典型的编码有Huffman编码、算术编码和LZ编码,这类无损压缩的特点是压缩以后的数据进行图像还原时,重建的图像与原始图像完全相同,所以压缩比较小,一般在2:15:1之间;有损压缩利用人的视觉特性和视觉心理进行数据压缩,主要的压缩方法有变换编码、子带编码、分形编码、基于重要性的滤波方法、矢量量化、混合编码、运动补偿编码、帧内预测、帧间预测、插值等。有损压缩后的数据进行还原,重建后的图像与原始图像虽有一定的误差,但在允许范围内,所以它的压缩比较高,如对动态视频的压缩比可达到100:1200:1。通常为了得到较高的压缩比,一般都采用有损压缩。

ISOIEC两个机构组成了一个联合专家组(Joint Photographie Group)开发了一个静止图像数据压缩编码的国际标准,称为JPEG标准。该标准可用于自然景象或任何连续色调的彩色或灰度图像,但不适用于二值图像。但是JPEG格式的图像文件体积仍然嫌大,而且不能满足高质量图像的要求,于是在20003月新一代编码方式JPEG 2000算法的最终协议草案被推出了。

JPEG 2000采用以离散小波变换算法为主的多解析编码方式,而且面向彩色、灰度、二值各种类型的图像。它是既支持低比率压缩又支持高比率压缩的通用编码方式,与JPEG相比,具有高压缩率、渐进传输、感兴趣区域压缩几方面的优势,而且在数码相机、扫描仪、网络传输、无线通信、医疗影像等领域得到了广泛应用。JPEG 2000JPEG保持向下兼容。

4.5.5  常用的图像文件

常用的图像文件如表4-4所示。

4-4  常用的图像文件

 

压缩编码方法

 

   

BMP文件

RLE(行程长度编码)

无损

Microsoft公司开发,Windows环境下运行的所有图像处理软件都支持,色彩逼真,但数据量大

GIF文件

LZW(字典编码)

无损

CompuServe公司开发,图像数据量较小,可设置透明背景,实现多幅图像切换,网页中大量使用

JPEG文件

DCTHuffman

有损/无损

ISOIEC联合制定,适用范围很广

JP2

小波变换、算术编码

有损/无损

ISOIEC联合制定,适用范围很广

TIFF文件

RLELZW

无损

AldusMicrosoft公司为扫描仪和桌面出版系统研制开发

PNG文件

LZW派生的压缩算法

无损

20世纪90年代中期开始开发,目的是替代GIFTIFF文件格式,具有很多有利于图像在网络上浏览和传播的特性

 

4.5.6  矢量图形

矢量图形是利用软件绘制出来的,而不能通过扫描得到。它采用一系列计算机指令来表示一幅图,这些指令描述一幅图中所包含的直线、圆、弧、矩形的大小和形状,也可以表示平面、曲面、光照、材质等效果。它实际上是用数学方法来描述一幅图,并不直接描述图中的每一点,而是描述产生这些点的过程和方法,所以要用到大量的数学方程式,并且所占的存储空间很小。

矢量图形中的基本单位称为图元,一条直线、一个圆、一个封闭区域、一个电路符号都可以作为图元。图元是图形中的信息单位,若干图元的集合构成一个图段,图段还可以进一步组成图层。图形的图元结构使得图中各部分可以分别进行移动、缩小、放大、旋转、复制、属性的改变等操作。

矢量图有很多优点:与分辨率无关,用户可以对图元进行任意放大或缩小,不会影响它的清晰度和光滑性;便于修改,可任意修改其形状;图元结构,相同或类似的图可以被作为构造块存到图库中,从而加速画的生成,减小文件的存储量。

矢量图的缺点是不易制作色彩丰富、内容复杂的图像。

图形通常分为二维图形和三维图形两类。二维图形是平面的实体表现形式,如工程建筑土、电子线路图;三维图形是在三维空间中表现实体,如地理信息系统、仿真和模拟系统等。

常用的图形图像制作软件有PhotoshopFireworksCorelDRAWFreeHand等。它们的特长在于制作、修饰图像,而不是分析、识别图像。