跳转至

01 线性回归

线性回归的一个例子是房价预测。比如说影响房价的因素有:卧室、卫生间个数和居住面积,记为 x 1, x 2, x 3,称为特征值。 预测房价是上面关键因素的加权和: \(\(加权和公式\)\) 权重和偏差在后面决定;这就是一个简单的模型。

权重:权重是模型参数的一种,用于描述特征(输入变量)对模型输出(预测值)的影响程度。举例来说,成绩构成=平时成绩(40%)+期末成绩(60%),这个百分比就是一个权重。回到房价预测上,那些不怎么重要的因素(房主的姓氏),就不太会影响估价。

特征向量:对于一个具体的房屋实例,它的特征值组合在一起形成一个向量,比如 [x1,x2,x3],这才是所谓的特征向量。

几何上来说,假设有一个二维平面,上面画了一些箭头(向量)。现在有一个线性变换(比如旋转或拉伸),它可以改变这些箭头的方向和长度。但是,如果能找到一些特殊的箭头,它们在变换后仅仅改变长度而方向不变,那么这些箭头就是特征向量。

线性模型可以看做是单层的神经网络:将输入作为一层放在一起

如何衡量预估质量

比较成交值和估价,可以用平方损失 $$ 平方损失公式 $$

训练数据

收集一些数据点(过去 6 个月卖的房子)来决定参数值(权重和偏差) $$ 样本公式 $$

参数学习

损失函数的目的是量化模型在训练数据上的表现,从而指导模型的学习过程。通过计算损失函数的值,可以知道模型在给定数据上的表现如何。 $$ 损失函数公式 $$

显示解

线性模型有显示解

线性模型的显式解通常指的是在给定一组训练数据的情况下,通过某种方法直接计算出模型参数的方法。 模型参数是模型内部的数值,这些数值在模型训练之前是未知的。在训练过程中,算法会基于训练数据调整这些参数,以使模型能够更好地拟合数据。一旦训练完成,这些参数就被确定下来,用于后续的预测任务。