博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
信息增益与决策树
阅读量:4351 次
发布时间:2019-06-07

本文共 311 字,大约阅读时间需要 1 分钟。

1. 何为信息增益(Information Gain)?

信息增益是特征选择中的一个重要指标,它定义为一个特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。

IG 是用来衡量一个属性区分数据样本的能力。IG越大,这个属性作为一棵树的根节点就能使这棵树更简洁。

 

2. 如何计算信息增益?(利用熵)

 熵的概念源于信息论中:

熵(Entropy)是表示随机变量不确定性的度量。

 

熵越大,随机变量的不确定性就越大。从定义可验证 0 ≤ H(p) ≤ log n

李航-《统计学习方法》决策树-信息增益。P60

 

转载于:https://www.cnblogs.com/shenxiaolin/p/8284047.html

你可能感兴趣的文章
linux下使用dd命令写入镜像文件到u盘
查看>>
001---进程
查看>>
视频人脸检测——OpenCV版(三)
查看>>
php获取来访者在搜索引擎搜索某个关键词,进入网站
查看>>
物联网架构成长之路(8)-EMQ-Hook了解、连接Kafka发送消息
查看>>
2018-2019-1 20165234 20165236 实验二 固件程序设计
查看>>
IDEA的GUI连接数据库写入SQL语句的问题总结
查看>>
Xpath在选择器中正确,在代码中返回的是空列表问题
查看>>
leecode第一百九十八题(打家劫舍)
查看>>
【BZOJ 1233】 [Usaco2009Open]干草堆tower (单调队列优化DP)
查看>>
07-3. 数素数 (20)
查看>>
写一个欢迎页node统计接口Py脚本(邮件,附件)-py
查看>>
计算两个日期之间的天数
查看>>
山东省第六届蓝桥杯 ///标题:三羊献瑞//c/c++组
查看>>
Unity火炬之光进度
查看>>
Android关于buildToolVersion与CompileSdkVersion的区别
查看>>
Linux企业级开发技术(7)——libevent企业级开发之锁和线程
查看>>
解决XCODE配置LLVM环境出现的问题
查看>>
Python爬虫基础
查看>>
Jmeter 监控远程服务器
查看>>