为什么文字经过扫描可以出现在电脑上?OCR软件是怎么工作的?... 为什么文字经过扫描可以出现在电脑上?
OCR软件
是怎么工作的?
扫描仪是除键盘和鼠标之外被广泛应用于计算机的输入设备。你可以利用扫描仪输入照片建立自己的电子影集;输入各种图片建立自己的网站;扫描手写信函再用E-mail发送出去以代替传真机;还可以利用扫描仪配合OCR软件输入报纸或书籍的内容,免除键盘输入汉字的辛苦。所有这些为我们展示了扫描仪不凡功能,它使我们在办公、学习和娱乐等各个方面提GX率并增进乐趣。
在选购扫描仪时,我们常常遇到许多难懂的专业技术名词,如光学分辨率(光学解析度)、Z大分辨率(Z大解析度)、色彩分辨率(色彩深度)、扫描模式、接口方式(连接界面)等等。
在使用扫描仪当中,又会遇到到扫描速度慢,占用硬盘空间多,以及一些不知所云的设置等诸多困扰。然而说明书提供给我们的操作指导并不能让所有的人成为应用专家,即使照着说明书去进行某些设置,也不知道为什么要这样做,这无疑给我们用好用巧机器带来了障碍。
本文针对这些问题,从扫描仪的基本结构入手,阐述它的工作原理,使我们对每一项设置或操作都道原因,在应用水平上有一个提高。
一、扫描仪的工作原理
扫描仪是图像信号输入设备。它对原稿进行光学扫描,然后将光学图像传送到光电转换器中变为模拟电信号,又将模拟电信号变换成为数字电信号,Z后通过计算机接口送至计算机中。
扫描仪扫描图像的步骤是:首先将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上,原稿可以是文字稿件或者图纸照片;然后启动扫描仪驱动程序后,安装在扫描仪内部的可移动光源开始扫描原稿。为了均匀照亮稿件,扫描仪光源为长条形,并沿y方向扫过整个原稿;照射到原稿上的光线经反射后穿过一个很窄的缝隙,形成沿x方向的光带,又经过一组反光镜,由光学透镜聚焦并进入分光镜,经过棱镜和红绿蓝三色滤色镜得到的RGB三条彩色光带分别照到各自的CCD上,CCD将RGB光带转变为模拟电子信号,此信号又被A/D变换器转变为数字电子信号。
至此,反映原稿图像的光信号转变为计算机能够接受的二进制数字电子信号,Z后通过串行或者并行等接口送至计算机。扫描仪每扫一行就得到原稿x方向一行的图像信息,随着沿y方向的移动,在计算机内部逐步形成原稿的全图。
在扫描仪获取图像的过程中,有两个元件起到关键作用。一个是CCD,它将光信号转换成为电信号;另一个是A/D变换器,它将模拟电信号变为数字电信号。这两个元件的性能直接影响扫描仪的整体性能指标,同时也关系到我们选购和使用扫描仪时如何正确理解和处理某些参数及设置。
1.什么是CCD?
CCD是Charge Couple Device的缩写,称为电荷耦合器件,它是利用微电子技术制成的表面光电器件,可以实现光电转换功能。
CCD在摄像机、数码相机和扫描仪中应用广泛,只不过摄像机中使用的是点阵CCD,即包括x、y两个方向用于摄取平面图像,而扫描仪中使用的是线性CCD,它只有x一个方向,y方向扫描由扫描仪的机械装置来完成。
CCD芯片上有许多光敏单元,它们可以将不同的光线转换成不同的电荷,从而形成对应原稿光图像的电荷图像。如果我们想增加图像的分辨率,就必须增加CCD上的光敏单元数量。实际上,CCD的性能决定了扫描仪的x方向的光学分辨率。
2.什么是A/D变换器?
A/D变换器是将模拟量(Analog)转变为数字量(Digital)的半导体元件。从CCD获取的电信号是对应于图像明暗的模拟信号,就是说图像由暗到亮的变化可以用从低到高的不同电平来表示,它们是连续变化的,即所谓模拟量。
A/D变换器的工作是将模拟量数字化,例如将0至1V的线性电压变化表示为0至9的10个等级的方法是:0至小于0.1V的所有电压都变换为数字0、0.1至小于0.2V的所有电压都变换为数字1……0.9至小于1.0V的所有电压都变换为数字9。实际上,A/D变换器能够表示的范围远远大于10,通常是2^8=256、2^10=1024或者2^12=4096。
如果扫描仪说明书上标明的灰度等级是10bit,则说明这个扫描仪能够将图像分成1024个灰度等级,如果标明色彩深度为30bit,则说明红、绿、蓝各个通道都有1024个等级。显然,该等级数越高,表现的彩色越丰富。
二、扫描仪的性能
扫描仪按种类可以分为手持扫描仪,台式扫描仪和滚筒式扫描仪(鼓形扫描仪)。价格方面,手持型在400~600元左右;台式机从1000至上万元不等;鼓形扫描仪的分辨率在8000dpi以上,动态范围,彩色位数等指标都较高,价格也不适合于一般家庭和办公室。
扫描仪的主要性能指标有x、y方向的分辨率、色彩分辨率(色彩位数)、扫描幅面和接口方式等。各类扫描仪都标明了它的光学分辨率和Z大分辨率。分辨率的单位是dpi,dpi是英文Dot Per Inch的缩写,意思是每英寸的像素点数。
1.什么是光学分辨率?
光学分辨率是指扫描仪的光学系统可以采集的实际信息量,也就是扫描仪的感光元件——CCD的分辨率。例如Z大扫描范围为216mm×297mm(适合于A4纸)的扫描仪可扫描的Z大宽度为8.5英寸(216mm),它的CCD含有5100个单元,其光学分辨率为5100点/8.5英寸=600dpi。常见的光学分辨率有300×600、600×1200、1000×2000或者更高。
2.什么是Z大分辨率?
Z大分辨率又叫做内插分辨率,它是在相邻像素之间求出颜色或者灰度的平均值从而增加像素数的办法。内插算法增加了像素数,但不能增添真正的图像细节,因此,我们应更重视光学分辨率。
3.什么是色彩分辨率?
色彩分辨率又叫色彩深度、色彩模式、色彩位或色阶,总之都是表示扫描仪分辨彩色或灰度细腻程度的指标,它的单位是bit(位)。
色彩位确切的含义是用多少个位来表示扫描得到的一个像素。例如:1bit只能表示黑白像素,因为计算机中的数字使用二进制,1bit只能表示两个值(21=2)即0和1,它们分别代表黑与白。8bit可以表示256个灰度级(28=256),它们代表从黑到白的不同灰度等级。24bit可以表示16777216种色彩(224=16777216),其中红(R)绿(G)蓝(B)各个通道分别占用8bit,它们各有2^8=256个等级,一般称24bit以上的色彩为真彩色,当然还有采用30bit、36bit、42bit的机种。
从理论上讲,色彩位数越多,颜色就越逼真,但对于非专业用户来讲,由于受到计算机处理能力和输出打印机分辨率的限制,追求高色彩位给我们带来的只会是浪费。
4.什么是TWAIN?
TWAIN(Technology Without An Interesting Name)是扫描仪厂商共同遵循的规格,是应用程序与影像捕捉设备间的标准接口。只要是支持TWAIN的驱动程序,就可以启动符合这种规格的扫描仪。
例如在Microsoft Word中就可以启动扫描仪,方法是打开菜单栏的“插入”→“图片”→“来自扫描仪”。利用Adobe Photoshop也可以做到这一点,方法是打开“File”→“Import”→“Select TWAIN_32 Source”。
5.什么是接口方式?
接口方式(连接界面)是指扫描仪与计算机之间采用的接口类型。常用的有USB接口、SCSI接口和并行打印机接口。SCSI接口的传输速度Z快,而采用并行打印机接口则更简便。
三、扫描仪的应用
1.选择原稿类型
扫描仪驱动程序的用户界面会提供扫描原稿类型的选择菜单。“文件”适用于白纸黑字的原稿,扫描仪会按照1个位来表示黑与白两种像素,这样会节省磁盘空间。“杂志和书籍”则适用于既有图片又有文字的图文混排稿样,扫描该类型兼顾文字和具有多个灰度等级的图片。“照片”适用于扫描彩色照片,它要对红绿蓝三个通道进行多等级的采样和存储。
进行适当的选择可以在满足要求的情况下节省磁盘空间,不同的扫描仪,可能会提供不同的原稿类型选择。
2.分辨率与文件大小
一般的扫描应用软件都可以在你预览原始稿样时自动计算出文件大小,但了解文件大小的计算方法更有助于你在管理扫描文件和确定扫描分辨率时作出适当的选择。
二值图像文件的计算公式是:水平尺寸×垂直尺寸×(扫描分辨率)2/8。彩色图像文件的计算公式是:水平尺寸×垂直尺寸×(扫描分辨率)2×3。例如用彩色RGB方式扫描一幅普通彩色照片(3R 3.5×5英寸),扫描分辨率为300DPI,那么得到的图像文件长度为5×3.5×3002×3=4725000字节即4.7MB(这个计算公式假设每一种颜色的色深是8位并且没有考虑图片的存储时的压缩算法,实际文件大小会因保存文件的格式差异与使用的色深有很大的不同)。
3.选择扫描分辨率
扫描分辨率=放大系数×打印分辨率/N (N为打印机喷头色数)。
扫描分辨率越高得到的图像越清晰,但是考虑到如果超过输出设备的分辨率,再清晰的图像也不可能打印出来,仅仅是多占用了磁盘空间,没有实际的价值。因此选择适当的扫描分辨率就很有必要。
4.使用OCR软件
OCR是字符识别软件的简称,它是英文Optical character recognition的缩写,原意是光学字符识别。它的功能是通过扫描仪等光学输入设备读取印刷品上的文字图像信息,利用模式识别的算法,分析文字的形态特征从而判别不同的汉字。
中文OCR一般只适合于识别印刷体汉字。使用扫描仪加OCR可以部分地代替键盘输入汉字的功能,是省力快捷的文字输入方法。