互联网广告行业数据造假成风,3分钟教你如何识别

发布时间:2019-08-09 来源:原数据

相信对于移动互联网一代,对于“信息流广告”这个词并不陌生,2018年,我国信息流广告市场规模已达到千亿元规模,约为1070亿元,同比增长73.1%。但是对于广告投放的效果让许多广告主头疼了一把!


广告界有一句名言:你知道你有一半的广告费花错了,但你不知道花错在哪,哪一半花错了。这是一种最常见的广告费浪费现象,而广告费之所以浪费,绝大部分是由数据造假产生。


目前,信息流广告行业的头部媒体也就是广告主投入最多的媒体就是:字节跳动、百度、腾讯,占据了信息流广告市场70%的市场份额,竞争极其激烈。字节跳动企业有今日头条、抖音、西瓜视频、悟空问答等多款不同维度的产品,其多样的投放形式满足了不同需求的广告主。而百度广告的“搜索+信息流”的形式通过兴趣关键词,找到真正“想购买”的那部分用户,也使广告更精准,对于腾讯系广告主要定是小而精,保证了广告的观赏性,相对于同行业信息流广告,广告质量和广告体验都能让用户接受。

在如此大的市场容量下,广告黑产也如幽灵般逐渐涌现,甚至已经形成了相当完善的产业链。作为一个在数据界摸爬滚打多年的原数据团队一员,分享一下数据造假的上中下游产业链:

位于产业链顶端的是黑产解决方案提供商,一般会培养专门负责研究模型和研究破解方式的分析人员,以及专业的软件开放人员,反作弊信息收集人员;当然,也有负责把刷量软件、脚本分发到市场上的市场运营人员。

经过不同阶层的黑产代理刷量软件、脚本,并通过包月或按分发量分成的模式获利。数据作弊者只需要极小的代价就可以方便地购买到假量,使众多广告者的广告投入石沉大海。

某知名自媒体榜单TOP500账号中,有300多个账号在生活、资讯、娱乐、情感等领域都或多或少存在刷量行为,根据腾讯相关报告,当前作弊KOL的年收入规模至少高达一百亿,也就是说,每年有一百亿推广费是打水漂的。对于投放信息流广告的广告主也是同理,高曝光、高点击、高转化的背后,是毫无增长的销售额。

流量作弊无处不在,那么这些虚假数据都是怎么做到的呢?原数据尽调团队给出常见的流量作弊主要有以下几种:

1. 流量归因作弊:最后一次点击归因的原理(lastclick)
当你看见广告产生点击时,除了跳转到落地页,还会向归因方发送一个点击链接,而激活数据都是归属给激活前最后一次点击的媒体,当广告主同时在多个媒体投放广告时,用户可能多维度地接触到了产品的广告,但一个用户只会被归属给最后一次点击的媒体。

例如:现在有一个用户,在先点击了A媒体的广告,后点击了B媒体的广告,再点击了C广告,最后下载并激活安装了某个APP,那这个激活“1”如果算在所有点击过的广告上就作弊了,理论上应该归因到最后一个“C广告”。

2. 转化作弊:用测试机或模拟器模拟下载,最典型的就是“猫池”,会有无数个手机以不同的IP和设备信息来模拟下载激活,模仿真人的下载行为。
下载完一波后会自动修改设备信息继续下载,就会出现很高的激活量。

3.点击作弊:通过一些特殊脚本制造二跳链接引流诱导用户进行点击,消耗了大量的广告费用,保证了数据的“好看”,还可能存在同行的恶意点击。

新生态下,如何有效评估和防护成为各大品牌和广告主进行广告营销呢?原数据尽调团队给出以下建议:

1. SDK加密防护:对传输激活的SDK进行加密处理,提高其破解作弊的成本。
2. 建立数据黑名单:将一些周期性活动的或者非客户端数据的点击记录和非正常行为标记为黑名单,长期过滤。
3. 归因时间差预防:通过对点击到下载激活的时间排查,能够发现伪造的点击和激活往往在时间逻辑上是错误的。
4. 应用第三方监测平台:市面上也出现了很多第三方监测软件,通过第三方平台的技术支持,对流量数据进行实时监控,对客户数据的采集和关联分析实现更精准的质量评估,可以实时发现数据的一场现场。
5. 建立欺诈终端:有条件的广告主可以自行建立高度持续化运营的欺诈终端,通过对异常用户的标记做后续的监控,可以有效预防下一次恶意流量的刷量行为,通过自动化APK静态建与其对立的模型,形成一层长期稳定的安全防护墙。

但是,有一点要说,由于黑产有发达的情报、监控体系和合理的软件架构,把底层基础服务和上层应用剥离,通过对短信接收、线程、宽带、频率、打码方式设置就可以实现刷量,对于普通的广告主来说还是难以分辨,防不胜防,所以只有通过专业的互联网数据调查团队去监测、采集,才能保证数据的真实性和准确性。

原数据尽调团队来⾃知名互联⽹企业,精通人工智能、自然语言处理、机器学习、大数据分析等技术,曾在谷歌、IBM、BAT等一线企业任职,拥有多款千万DAU产品实战背景,拥有多年反作弊实践经验。欢迎商业合作或加入我们。(微信:Robot_Volke)


 

新闻中心