泰尔森估算是什么,第1张

Tersain估计是一种通过选择穿过成对点的所有直线的斜率中值(简单线性回归)将直线鲁棒地拟合到平面中的采样点的方法。又称森斜率估计、斜率选择、单中值法、肯德尔稳健线拟合法、肯德尔-泰尔稳健线。

Tersain估计(英文:Theil-Sen估计)是一种通过选择穿过成对点的所有直线的斜率中值(简单线性回归)来鲁棒地将直线拟合到平面中的采样点的方法。又称森斜率估计、斜率选择、单中值法、肯德尔稳健线拟合法、肯德尔-泰尔稳健线。它以亨利·泰尔和普拉纳布·k·森的名字命名,他们分别于1950年和1968年发表了关于这种方法的论文,并以莫里斯·肯德尔的名字命名。

泰尔森估算是什么,泰尔森估算是什么,第2张

该估计器能够有效地进行计算,并且对异常值不敏感。对于偏斜和异方差的数据,它可以比非稳健的简单线性回归精确得多,甚至对于正态分布的数据,它可以在统计效率方面与非稳健的最小二乘法竞争。它被称为“估计线性趋势的最流行的非参数技术”。

定义

根据泰尔(1950)的定义,一组二维点

的泰尔森估计量是由所有样本对确定的斜率的中位数

。重点。森(1968)扩展了这一定义,以处理两个数据点具有相同x坐标的情况。在森的定义中,人们只使用不同x坐标的点对定义的中值斜率。

一旦确定了斜率m,就可以通过将y截距b设置为值yi-mxi的中值来确定从采样点开始的直线。正如森所观察到的,这个估计量是这样的,肯德尔τ秩相关系数比较xi的值和第七次观测的剩余值近似为零。

斜率估计的置信区间可以确定为包含点对确定的直线中间95%斜率的区间,通过采样点对,确定95%的采样区间,可以快速估计。不断走下坡路。根据模拟,大约600个样本对就足以确定准确的置信区间。

变化

泰尔-森估计量的变化,西格尔(1982)的重复中值回归,决定了每个样本点

,穿过中间mi的斜坡

这一点,然后确定总体估计为这些中位数的中位数。它比泰尔-森估计器能容忍更多的异常值,但已知的计算算法速度较慢。

不同的变体通过它们的X坐标的等级来配对样本点(具有最小坐标的点与中间坐标之上的第一个点配对,等等。),并计算这些对确定的直线斜率的中位数。得分。

还研究了基于加权中值的泰尔-森估计量的变化,其原理是,在X坐标中具有较大差异的样本对更有可能具有精确的斜率,因此应该获得更高的权重。

对于季节性数据,通过只考虑一年中属于同一个月或同一个季节的样本点对,并求出由下式确定的直线斜率的中值,就可以适当地平滑数据中的季节性变化。这对限制性更强的夫妇。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 泰尔森估算是什么

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情