(西瓜书)周志华-机器学习.pdf

(西瓜书)周志华-机器学习.pdf_第1页
(西瓜书)周志华-机器学习.pdf_第2页
(西瓜书)周志华-机器学习.pdf_第3页
[Mitchell,1997J给出了一个更形式化的定义假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务丰获得了性能改善,则我们就说关于T和P,该程序对E进行了学习例如[Handetal.,2001].第1章绪论1.1引言傍晚小街路面上沁出微雨后的湿润,和熙的细风吹来,抬头看看天边的晚霞7嗯,明天又是一个好夭气.走到水果摊旁,挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜,一边满心期待着皮薄肉厚瓢甜的爽落感,一边愉快地想着,这学期狠下了工夫,基础概念弄得清清楚楚,算法作业也是信手拈来,这门课成绩一定差不了!希望各位在学期结束时有这样的感觉.作为开场,我们先大致了解一下什么是"机器学习"(machinelearning).回头看第一段话,我们会发现这里涉及很多基于经验做出的预判.例如,为什么看到微温路面、感到和风、看到晚霞,就认为明天是好天呢?这是因为在我们的生活经验中已经遇见过很多类似情况,头一天观察到上述特征后,第二天天气通常会很好.为什么色泽青绿、根蒂蜷缩、敲声浊晌,就能判断出是正熟的好瓜?因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们就可以做出相当好的判断.类似的,我们从以往的学习经验知道,下足了工夫、弄清了概念、做好了作业,自然会取得好成绩.可以看出,我们能做出有效的预判?是因为我们已经积累了许多经验,而通过对经验的利用?就能对新情况做出有效的决策.上面对经验的利用是靠我们人类自身完成的.计算机能帮忙吗?机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来玫善系统自身的性能在计算机系统中,"经验"通常以"数据"形式存在,因此?机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"(model)的算法,即"学习算法"(learningalgorithm).有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西瓜),模型会给我们提供相应的判断(例如好瓜).如果说计算机科学是研究关于"算法"的学问,那么类似的,可以说机器学习是研究关于"学习算法"的学问.本书用"模型"泛指从数据中学得的结果有文献用"模型"指全局性结果(例如一棵决策树),而用"模式"指局部性结呆(例如A条规则).2有时整个数据集亦称一个"样本"因为它可看作对样本空间的一个采样,通过上下文可判断出"样本"是指单个示例还是数据集训练样本亦称"如11练示例"(traininginstance)或"切|练例"学习算法通常有参数需设置,使用不同的参数值和(或)训练数据,将产生不同的结果将"Iabel"译为"标记"而非"标签"是考虑到英文中".Iabel"既可用作名词、也可用作动词第1章绪论1.2基本术语要进行机器学习,先要有数据.假定我们收集了一批关于西瓜的数据,例如(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂:稍蜷;敲声=沉闷),(色泽=浅自;根蒂t硬挺;敲声=清脆),……,每对括号内是一条记录,"_,,意思是"取值为"这组记录的集合称为一个"数据集"(dataset),其中每条记录是关于一个事件或对象(这里是一个西瓜)的描述,称为一个"示例"(instance)或"样本"(samp1e).反映事件或对象在某方面的表现或性质的事项,例如"色泽""根蒂""敲声",称为")副主"(attribute)或"特征"(feature);属性上的取值,例如"青绿""乌黑",称为")副主值"(attributeva1ue).属性张成的空间称为"属性空间"(attributespace)、"样本空间"(samp1espace)或"输入空间"例如我们把"色泽""根蒂""敲声"作为三个坐标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置.由于空间中的每个点对应一个坐标向量,因此我们也把…个示例称为一个"特征向量"(featurevector).一般地,令D={Xl,町"..,Xm}表示包含m个示例的数据集,每个示例由d个属性描述(例如上面的西瓜数据使用了3个属性),则每个示例Xi=(Xi1;Xi2;...;Xid)是d维样本空间X中的一个向量,XiεX,其中Xij是凯在第j个属性上的取值(例如上述第3个西瓜在第2个属性上的值是"硬挺"),d称为样本院的"维数"(dimensionality).从数据中学得模型的过程称为"学习"(le缸ning)或"训练"(training),这个过程通过执行某个学习算法来完成.训练过程中...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
微风舍
实名认证
内容提供者

微风舍,风起于青萍之末,浪成于微澜之间,舍是漏舍,唯吾德馨。

确认删除?
回到顶部