全球主机论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 64|回复: 0

自动检测性能不佳的元数据

[复制链接]
发表于 2017-9-14 14:59:56 | 显示全部楼层 |阅读模式
自动检测性能不佳的元数据
想知道从哪里开始增加你的有机点击率?专栏作家Paul Shapiro 分享了他的过程,以识别低绩效的有机清单,这样你就可以开始测试了。
你是想让你的网站在搜索引擎优化方面得到提升,但你认为你已经穷尽了大多数优化方法,还是在寻求快速的胜利?
考虑改进你的搜索列表的有机点击率(CTR)。我喜欢处理这个任务的一个方法是首先检查真正的异常值。
在这里,我将概述我的过程,以便在我们的搜索引擎优化客户端自动完成这个过程。更多推荐:服务器租用cn.bluehost.com
我们如何识别离群值?
你应该经常尝试改进网站的有机搜索结果,但是你从哪里开始呢?首先,我要确定真正的异常值——真正超出常规的页面和查询组合。
可以使用许多统计方法来识别离群值,所以让我们看一下我所依赖的一些用于检测的方法。
根据可汗学院的说法,“Z-score衡量一个数据点的均值是多少个标准差。”因此,如果查询和页面组合的CTR低于z-3(有时-2.5或-2.68被用作阈值),那么它是一个离群值。
在给定位置上的CTR的=Z-score(单独的CTR-平均CTR)/标准偏差
四分位范围(IQR)
可汗学院将IQR定义为“在数据集中的中间50%的传播量”。换句话说,它是第一个四分位数(Q1)和第三个四分位数(Q3)之间的距离。
要使用这种方法找到离群值,您需要寻找一个低于第1个四分位数(IQR)低于四分位数范围的CTR。
因此,如果一个单独的CTR小于:
在给定位置的CTR的四分之一-(CTR的IQR,在给定的位置1.5)
然后,它可能被认为是一个局外数。
修改z-score
z-score对于较小的数据集来说不是很好,所以为了解决较小的网站的问题,在给定的位置上有较少的CTR的数据点,我们可以利用修改后的z-score来检测离群值。
根据IBM:
标准z-score是通过标准偏差除以均值来计算的。修改后的z-score是从平均绝对偏差(均值)或中值绝对偏差(MAD)中计算出来的。这些值必须乘以一个常数来近似标准差。
应用于我们的有机搜索清单CTR,我们正在寻找一个小于-3.5的修改z-score,被认为是一个离群值。
修正的z-score=(恒定的0.6745(单个的CTR-中给定位置的CTR中值))/中值在给定位置的中值的绝对偏差

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|小黑屋|全球服务器论坛

GMT+8, 2024-10-10 14:25 , Processed in 1.747203 second(s), 19 queries , File On.

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表