信息化软件 企业管理 营销管理 业界消息 标签索引
企业管理目录
企业管理 战略规划 评标选型 项目管理 实施运维 人力资源 培训考核 时间管理 绩效薪酬 流程管理 财务管理 企业文化 协同商务 信息安全 采购管理 资产管理

信息熵

2009-02-08

信息熵(Information Entropy)

信息熵: 什么是信息熵

信息熵是一个数学上颇为抽象的概念,在这里不妨把信息熵理解成某种特定信息的出现概率(离散随机事件的出现概率)。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。信息熵也可以说是系统有序化程度的一个度量。

信息熵: 信息熵的计算

根据Charles H. Bennett对Maxwell's Demon的解释,对信息的销毁是一个不可逆过程所以销毁信息是符合热力学第二定律的。而产生信息,则是为系统引入负(热力学)熵的过程。所以信息熵的符号与热力学熵应该是相反的。一般而言,当一种信息出现概率更高的时候,表明它被传播得更广泛,或者说,被引用的程度更高。我们可以认为,从信息传播的角度来看,信息熵可以表示信息的价值。这样我们就有一个衡量信息价值高低的标准,可以做出关于知识流通问题的更多推论。

信源的平均不定度。在信息论中信源输出是随机量,因而其不定度可以用概率分布来度量。记 H(X)=H(P1,P2,…,Pn)=P(xi)logP(xi),这里P(xi),i=1,2,…,n为信源取第i个符号的概率。P(xi)=1,H(X)称为信源的信息熵。

熵的概念来源于热力学。在热力学中熵的定义是系统可能状态数的对数值,称为热熵。它是用来表达分子状态杂乱程度的一个物理量。热力学指出,对任何已知孤立的物理系统的演化,热熵只能增加,不能减少。然而这里的信息熵则相反,它只能减少,不能增加。所以热熵和信息熵互为负量。且已证明,任何系统要获得信息必须要增加热熵来补偿,即两者在数量上是有联系的。

可以从数学上加以证明,只要H(X)满足下列三个条件:

①连续性:H(P,1-P)是P的连续函数(0≤P≤1);

②对称性:H(P1,…,Pn)与P1,…,Pn的排列次序无关;

③可加性:若Pn=Q1+Q2>0,且Q1,Q2≥0,则有H(P1,…,Pn-1,Q1,Q2)=H(P1,…,Pn-1)+PnH;则一定有下列唯一表达形式:H(P1,…,Pn)=-CP(xi)logP(xi)

其中C为正整数,一般取C=1,它是信息熵的最基本表达式。

信息熵的单位与公式中对数的底有关。最常用的是以2为底,单位为比特(bit);在理论推导中常采用以e为底,单位为奈特(Nat);还可以采用其他的底和单位,并可进行互换。

信息熵除了上述三条基本性质外,还具有一系列重要性质,其中最主要的有:

①非负性:H(P1,…,Pn)≥0;

②确定性:H(1,0)=H(0,1)=H(0,1,0,…)=0;

③扩张性:Hn-1(P1,…,Pn-ε,ε)=Hn(P1,…,Pn);

④极值性:P(xi)logP(xi)≤P(xi)logQ(xi);这里Q(xi)=1;

⑤上凸性:H[λP +(1-λ)Q]>λH(P)+(1-λ)H(Q),式中0<λ<1。

相关链接
信息量2009-02-07 软件开发模型2009-02-06
网络营销系统2009-02-13 数据仓库2009-01-10
瀑布模型2009-01-01 信息系统规划2009-04-20
螺旋模型2008-11-18 车间管理系统2008-10-17
边做边改模型2008-09-21 宏图三胞:协同商务控制风险到底值2006-03-25
返回首页 信息化软件 企业管理 营销管理 业界消息 文档查询
Copyright © 2005-2010   http://www.ourdoc.cn, 知识文档中心