什么是数据冗余?有哪些类型?

数据中心运营管理2019-01-10 16:08:35

前言:

把视频和音频信号数字化了的之后,数据量大的惊人,因此,若存储大量的图像和音频信息需要大大提高系统的存储容量,通常解决的方法是采用大容量磁盘或光盘,但这仅仅是解决海量存储的一个办法,而数据冗余的作用就是将额外的数据或数据信息保存在一个独立的硬盘上,来防止数据丢失,下面详解什么是数据冗余?有哪些类型?增加数据冗余的目的是什么?

数据与信息虽然经常在一起使用,但概念是不相同的,数据是用来记录和传送信息的,数据是信息的载体。真正有用的不是数据本身,而是数据所携带的信息,信息量与数据量的关系可由下式给出:I = D - du(I,D,du分别为信息量、数据量与冗余量.冗余量du是指D中的数据冗余。)


什么是数据冗余?

冗余,指重复配置系统的一些部件,当系统发生故障时,冗余配置的部件介入并承担故障部件的工作,由此减少系统的故障时间。冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所拥有。Redundant,自动备援,即当某一设备发生损坏时,它可以自动作为后备式设备替代该设备。

数据冗余是指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象,可以说增加数据的独立性和减少数据冗余是企业范围信息资源管理和大规模信息系统获得成功的前提条件,冗余数据的管理所谓的数据冗余是指数据库的数据中有重复信息的存在,这自然浪费了很多的存储空间,尤其是存储海量数据的时候,数据冗余是指同一数据被反复存放.这样着某一属性值发生改变其他与之相同的属性值也要改变.数据冗余不仅增加了更新代价更严重的是其潜在的数据不一致及存贮空间浪费等问题。

在数据库中存贮这类导出数据项需占用较多的存贮空间亦称为数据冗余.存贮冗余数据不仅代价高也是产生数据不一致的根源,数据冗余或者信息冗余是生产、生活所必然存在的行为,没有好与不好的总体倾向。

信息的数据量:

静态图像:分辨率(640×480)的彩色(24bit/Pixel)数字图像的数据量约7.37Mbit/F,则一个100MB的硬盘只能存放约100帧(F)静态图像画面。当帧速率为1/25s时,那么视频信号的传输速率需达184 Mbit/s。


(1)语音信号:人说话的音频一般在20Hz到4kHz之间,需带宽为4kHz。按采样定理,并设数字化精度为8bit,则人讲一分钟的话的数据量约为480kB。 


(2)音频信号:音乐信号的频带很宽,激光唱盘CD-DA的采样频率为44.1kHz,每个采样样本为16bit,二通道立体声,则100MB的硬盘仅能存储10分钟的录音。

 

(3)视频图像:根据采样原理,当采样频率≥2倍的原始信号的频率时,才能保证采样后信号保真地恢复为原始信号。彩色电视信号的数据量约为每秒100Mbits,因而一个1GB容量的光盘仅能存约1分钟的原始电视数据。 

综上所述,数字化了视频和音频信号的数据量之大是非常惊人的,因此,若存储大量的图像和音频信息需要大大提高系统的存储容量,通常解决的方法是采用大容量磁盘或光盘,但这仅仅是解决海量存储的一个办法,另的重要方法是:


对图像和音频信息进行数据压缩处理,传输多媒体信息的数据率和带宽,数字音频的数据率:

种类   采样率(kHz)   位数 / 样本   数据率(kb/s)

电话     8         8        64

电话会议   16        14       224 

激光唱盘   44.1       16       705.6×2 

数字音频磁带 48        16       768 

  

数字电视图像的数据率: 

种 类  时空分辨率    数据率(KB/s)

SIF   352×240×30   7.603 

CCIR   720×480×30   31.104 

    720×576×25   31.104 

HDTV   1280×720×60   55.296

数据冗余的类型有哪些?

一般而言图像、视频、音频数据中存在的数据冗余类型主要有以下一些:


(1)结构冗余:有些图像从大体上看存在着非常强的纹理结构,例如草席图像,我们称之为它在结构上存在冗余。


(2)信息熵冗余:又可称为编码冗余,是指一组数据携带的平均信息量。正因为多媒体数据中存在着上述的各种各样的冗余,所以多媒体数据是可以被压缩的。针对不同的冗余,人们已经提出各种各样的方法实施对于多媒体数据的压缩。


(3)时间冗余:这是序列图像(电视图像、运动图像)和语音数据中所经常包含的冗余。在电视、动画图像中,在相邻帧之间往往包含了相同的背景,只不过运动物体的位置略又变换。因此对于序列图像中的相邻两帧仅记录它们之间的差异,去掉其中重复的,称为时间冗余的那部分信息。同样,由于人在说话时产生的音频也是连续和渐变的,因此声音信息中也会存在时间冗余。

(4)空间冗余:图像数据中所经常出现的一种冗余。在同一幅图像中,规则物体和规则背景(所谓规则是指表面是有序的而不是完全杂乱无章的排列)的表面物理特性具有相关性,数字化图像中表现为数据冗余。例如一幅静态图像中的一大片蓝天、草地,其中每个像素的数据完全相同,如果逐点存储,就会产生所谓的空间冗余。完全一样的数据当然可以压缩,十分接近的数据也可以压缩,因为被压缩的数据恢复后人眼也分辨不出与原来的图片有什么区别,这种压缩就是对空间冗余的压缩。


(5)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于脸的中线上等等。这类规律性的结构可由先验知识和背景知识得到,称之为知识冗余。⑤视觉冗余:是由于人体器官的不敏感性造成的。例如在高亮度下,人的视觉灵敏度下降,对灰度值的表示就可以粗糙一些。对于太强太弱的声音,如果超出了“阈值”,人们听觉感受也会被掩蔽。利用感官上的这些特性,也可以压缩掉部分数据而不被人们感知(觉察)。

增加数据冗余的目的是什么?

数据的应用中为了某种目的采取数据冗余方式。


1、重复存储或传输数据以防止数据的丢失。


2、为达到其他目的所进行的冗余。例如重复信息以达到被重视等等。


3、为方便处理而是同一信息在不同地点有不同的表现形式。例如一本书的不同语言的版本。


4、大量数据的索引,一般在数据库中经常使用。其目的类似第4点。


5、对数据进行冗余性的编码来防止数据的丢失、错误,并提供对错误数据进行反变换得到原始数据的功能。


6、为简化流程所造成额数据冗余。例如向多个目的发送同样的信息、在多个地点存放同样的信息,而不对数据进行分析而减少工作量。


7、为加快处理过程而将同一数据在不同地点存放。例如并行处理同一信息的不同内容,或用不同方法处理同一信息等。


8、方法类的信息冗余:比如每个司机都要记住同一城市的基本交通信息;大量个人电脑都安装类似的操作系统或软件。


9、规则性的冗余,根据法律、制度、规则等约束进行的。例如合同中大量的模式化的内容。


10、为了完备性而配备的冗余数据。例如字典里的字很多,但我们只查询其中很少的一些字。软件功能很多,但我们只使用其中一部分。


数据冗余或者信息冗余是生产、生活所必然存在的行为,没有好与不好的总体倾向,而对于自然界,则是物质存在的一种形式,是客观存在情况,例如每个人都有与其他人基本相同的基因。




企业级数据中心产品运营管理交流平台 

        

如果您需要定制专业方案

可以在“阅读原文”找到我们或给我们留言


Copyright © 温县电话机虚拟社区@2017