首页 简介 产品 资讯 案例 支持 联系





Main Information | 相信内容
当计量经济学遇上机器学习,会发生什么
总浏览次数:68

人工智能已成为许多领域的自然力量,机器智能对我们来说每天都变得越来越重要。芝加哥大学布斯商学院教授 Sendhil Mullainathan 和斯坦福商学院助理教授 Jann Spiess 观察到机器学习,特别是监督机器学习,比程序更具经验性。例如,人脸识别算法不使用严格的规则来扫描某些像素识别。相反,这些算法利用大型照片数据集来预测人脸的外观。

另一个严重依赖这种方法的学科是计量经济学。计量经济学是在经济数据中应用统计程序,对经济关系进行实证分析。随着机器学习被用于预测等用途的数据,经验经济学家能否在他们的工作中使用机器学习工具?

个人可以在其中工作的数据构成发生了相当大的变化。

机器学习使统计学家和分析师能够处理对于标准估计方法而言维度过高的数据,例如在线帖子和评论、图像和语言信息。统计学家几乎无法查看回归等过程的此类数据类型。然而,在 2016 年的一项研究中,研究人员使用来自谷歌街景的图像来衡量纽约市和波士顿的街区级收入。此外,2013 年的一项研究开发了一种模型,可以使用在线帖子来预测卫生检查的结果。因此,我们看到机器学习如何增强我们今天的研究方式。让我们更详细地看看这个。

传统的估计方法,如普通最小二乘法 (OLS),已被用于进行预测。那么机器学习如何适应这一点呢?
将 OLS 应用于此将需要对要包含在回归中的变量进行特别策划的选择。添加变量之间的每个交互(例如,基本面积和卧室数量之间)是不可行的,因为这将包含比数据点更多的回归变量。但是,ML 会自动搜索此类交互。这里的一个问题是,具有这么多交互作用的树会导致过拟合,即它不够灵活以处理其他数据集。这个问题可以通过称为正则化的东西来解决。在回归树的情况下,需要根据更差的样本内拟合和较低的过度拟合之间的权衡来选择特定深度的树。这种正则化水平将通过经验调整 ML 算法来选择——通过在原始样本中创建样本外实验。

因此,选择基于 ML 的预测函数包括两个步骤:选择最佳的损失最小化函数和通过经验调整找到最佳的复杂度水平。树木及其部门只是这样的一个例子。Mullainathan 和 Speiss 表示,该技术可以与其他 ML 工具(如神经网络)一起使用。对于他们的数据,他们在包括森林和 LASSO 在内的各种其他 ML 方法上进行了测试,发现它们的性能优于 OLS(但是,按深度调整的树并不比传统的 OLS 更有效)。最好的预测性能是由运行几种不同算法的集成系统看到的(论文运行了 LASSO、树和森林)。因此,计量经济学可以指导设计选择以帮助提高预测质量。

当然,这里有一些与 ML 的使用相关的问题。首先是 ML 方法中系数缺乏标准误差。让我们看看这怎么会成为一个问题:Mullainathan-Spiess 研究将住房单元样本随机分成十个相等的分区。在此之后,他们重新估计了 LASSO 预测器(正则化器保持固定)。结果显示:LASSO 模型在一个分区中使用的变量可能在另一个分区中未使用。在整个分区中几乎没有稳定的模式。

这对预测精度没有太大影响,但无助于破译两个变量是否高度相关。

在传统的估计方法中,这种相关性反映为显着的标准误差。因此,虽然我们可以准确地预测房价,但我们不能使用这样的 ML 模型来回答诸如餐厅数量等变量在本研究中是否不重要等问题,因为 LASSO 回归没有使用它。正则化也会导致问题:它允许选择不太复杂但可能错误的模型。它还可能引起对遗漏变量偏差的担忧。
一个这样的类别属于前面提到的新类型的数据(语言、图像)。分析此类数据涉及作为预处理步骤的预测。这在存在经济结果数据缺失的情况下尤为重要。

上一篇:数字孪生技术在天气预测中的应用
下一篇:蜂窝网络成互联网技术将在工业应用中成主流
 




友情连接: 暂无内容
Copyright © 2021河北东泰网络科技有限公司 Inc.All rights reserved 版权所有
公司地址:河北省保定市莲池区文瀚创业孵化基地  / 电话:0312-3379071   邮箱:hbdtwlkj@163.com