0 前言
- 本文主要介绍信息增益的计算公式并举出若干例子帮助理解。
- 读者需要具备的知识有:信息熵、条件熵。
- 本文所示用的数据集为:游玩数据集 1.1节
1 信息增益计算公式
- g(D,A)表示在条件A下对于目标变量D的信息增益。
- H(D)表示随机变量D的信息熵。
- H(D|A)表示在随机变量A条件下对于目标变量D的条件熵。
2 信息增益的计算
2.1 g(play,outlook)的计算
g(play,outlook)表示在随机变量outlook条件下对于目标变量play的信息增益,计算步骤如下。
-
完整公式:g(play,outlook)=H(play)-H(play|outlook)
-
首先要计算H(play),详细计算方法请看信息熵,计算式如下所示。
-
然后计算H(play|outlook),详细计算方法请看条件熵,计算式如下。
-
最后计算g(play,outlook),计算式如下。
2.2 g(play,temperature)的计算
g(play,temperature)表示在随机变量temperature条件下对于目标变量play的信息增益,计算步骤如下。
-
完整公式:g(play,temperature)=H(play)-H(play|temperature)
-
首先要计算H(play),详细计算方法请看信息熵,计算式如下所示。
-
然后计算H(play|temperature),详细计算方法请看条件熵,计算式如下。
H(play|temperature=’cool’)=-(1.0/4.0)log2(1.0/4.0)-(3.0/4.0)log2(3.0/4.0)=0.8113
H(play|temperature=’hot’)=-(2.0/4.0)log2(2.0/4.0)-(2.0/4.0)log2(2.0/4.0)=1.0000
H(play|temperature=’mild’)=-(2.0/6.0)log2(2.0/6.0)-(4.0/6.0)log2(4.0/6.0)=0.9183
H(play|temperature)=(4.0/14)* H(play|temperature='cool')+(4.0/14)* H(play|temperature='hot')+(6.0/14)* H(play|temperature='mild')=0.9111
-
最后计算g(play,temperature),计算式如下。
g(play,temperature)=H(play)-H(play|temperature)=0.9403-0.9111=0.0292
3 计算程序
4 结语
如有错误请指正,禁止商用。
1.本站内容仅供参考,不作为任何法律依据。用户在使用本站内容时,应自行判断其真实性、准确性和完整性,并承担相应风险。
2.本站部分内容来源于互联网,仅用于交流学习研究知识,若侵犯了您的合法权益,请及时邮件或站内私信与本站联系,我们将尽快予以处理。
3.本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”您需知晓本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
5.本站是非经营性个人站点,所有软件信息均来自网络,所有资源仅供学习参考研究目的,并不贩卖软件,不存在任何商业目的及用途
暂无评论内容