「深度解读」抖音算法机制

作者:jcmp      发布时间:2021-04-23      浏览量:0
一、算法机制初体验二、什么是算法机制算法

一、算法机制初体验

二、什么是算法机制

算法机制好比 “植物生长规律”, 你可以通过"改造种子,肥料,种植环境"等外来因素去影响他的生产结果,比如 缩短生长周期 , 量产等。 但是却改变不了他生长环节,种子→萌发→结果环节还是一样一环不能少。

三、为什么了解算法机制

那么我们学习算法机制的目的,并不是忽略作品的质量问题,去通过外力去揠苗助长。这不是我的本意, 我的目的要学会做一个懂得触发机制的人去让内容符合算法 。作品好比种子,植物能不能量产以及结果品质好不好取决的是种子,非肥料,非土壤。我们需要根据算法机制去调整作品细节,让作品能触发机制后快速上升最大化。

四、带有算法机制下的场景变化

在这里不得不说“ 头条系 ",如今“头条系”产品已经成为自媒体用户最活跃并体量庞大的巨头平台。他的特色就是 “以用户为中心” ,只推送你喜欢的内容,从初期适应用户需求到精确满足用户需求的目标,从而实现内容定制化。

如果你被一个 娱乐类型 的文章或者视频所吸引并点击阅读,之后你的内容主页就可能被定制成了 娱乐类型 。而在外后的过程中机器算法,会不断细分采集并记录你的 行为标签 ,从而让你喜欢看的内容越来越精准,可能最后细化到只给你推送” 某个明星 “的相关新闻或者视频。

五、抖音算法的原型

上图就是整个算法机制的样子,其实真正的原型远远不止这些,仅仅只是把前端的原型画了出来,而我们了解这些就已经足够了。

六、给内容贴标签

那么头条系的内容标签库会如何打呢?

七、内容类目

下图为2015年今日头条透露出来的一份数据报告,表达是男性与女性关心的主要内容类目。

八、基因算法

这个标签类目算是头条系的母类目,那么作为头条系的“孩子“抖音,必然遗传了头条系“爸爸”原始基因并在细化非常多的小标签,比如娱乐,可以细化到"XX明星结婚”的标签。

九、给人物贴标签

用户画像

平台会根据用户在使用App的习惯进行分析行为路径,再进行贴标签,再继续优化标签。这个过程都是实时的机器算法。

通过不断的标签优化升级后,呈现出来标签用户,我们也称之为 用户画像, 参考下图。

十、数据共享

先看看头条系的产品(部分热门)

头条系会打通所有平台的数据库,看看你在每个平台的“ 偏爱标签 ”并记录下来。

十一、智能标签推送

模拟场景

预览顺序:

当小明第一次玩《今日头条》后,平台算法对小明平时每个预览的内容都进行贴标签。最终得出了属于小明在《今日头条》这个平台的标签画像。

当小明通过《今日头条》账号登录《抖音》后,数据共享会吧这个头条账号的 标签画像 同步到抖音平台,并进行原平台的 标签画像 匹配标签视频内容,智能推荐给小明。

在小明玩抖音的过程中,平台算法会多次 实时统计 小明有 转赞评行为 的其他新标签视频。

最后不断智能优化标签画像,最重呈现出新的标签画像,如下图

优化后同时匹配新标签同类视频推送给小明,最重完成了头条系的算法机制运行路径。这个过程是AI算法,会实时计算,升级,优化标签,而且永无止境,实现“用户为中心”定制化内容推送。

十二、抖音的推荐机制

上面对头条系的推荐机制整个框架有个大概的介绍,接下来介绍是关于抖音热门强相关的作品推荐机制解读。

十三、推荐模式原理图

整个环节简化拆解为几个步骤

十四、流量分桶

先把你的视频检测标签,如果作品被机器贴上标签那么就会分桶到对应标签的流量洼地。如果标签模糊无法贴标签,那么就会零散推荐,无法进行精准推送。

流量分桶是什么样子的?

头条系关于流量分桶的图解

十五、送量测试

这张图如果是自媒体老玩家是非常熟悉的,如果你是新手也没关系,我自绘一张“大白话”版本的流量图解。

这是头条A/B Test实验系统的基本原理。

十六、抖音数据算法反馈

那么如何通过播放量自查作品进入哪个实验组?我把作品从上传到热门优质池状态这个路径划分为3个阶段,并用播放量作为对标的方法。

十七、启动阶段

小于1000播放量 ,这个时候1000播放量就是你的作品的种子用户,那么这个时候作品的黄金3秒,精彩前置等手段保证初始种子用户留存从而进入下个阶段;

十八、小爆阶段

通过多个实验组的送量测试后,作品进入 高展状态 , 1万到10万播放量, 这个时候作品影响数据的细节,包含 用户引导,开发式问题 留给大家去评论 ,激发二次沟通意愿。 如果你的作品依然通过小爆炸阶段以后,你的作品将会进入到 优质池状态 ,我称它为王者流量池,它是一个大爆炸的阶段;

十九、大爆炸阶段

进入到这个阶段,你的作品已经进入 优质池状态, 已经上热门了。抖音会给你100万以上的播放量,这样子的播放量到底有多少转化为你的粉丝,就是你自己功底的一个累积的过程了。

二十、抖音数据影响关键

二十一、用户反馈(CPA)数据

这里面的基数分值权重是直接影响作品权重,很多人不会分享这里面的细节。今天我们大无私分享。

看到上面的基数分值的方法有没有发现一个特别有趣的点?

(正确指标) 画面清晰流畅,匹配字幕,调色符合内容:如美食(暖色调),背景干净唯美,声音清晰悦耳;

(错误指标) 画面模糊,分辨率低(非绝对,手机原生拍摄也是可以通过)。声音含糊不清,色调让人产生不舒服的感觉,背景杂乱,分散注意力。一般出现这些现象的作品,那它可能已经在人工审核环节被PASS,无法进入下个阶段的推送。

二十二、影响上热门关键因素

二十三、推荐机制全过程

从上传→审核→识别→推荐,如果推荐数据指标高于基数分值视为正,作品将会继续推荐。如果推荐的基数反馈低于基数则为负那么将停止推荐。这就是整个推荐机制的全过程。

二十四、热度强相关的转化率

上图表达了关于 转化比 强关系的要素,那么转化率直接影响的是 作品热度。

二十五、让内容更贴近算法

上面内容对于作品的基数分值针对哪些会有关联进行介绍,那么在推荐机制中对于内容的标签关联的计算方式是怎么样的?了解内容标签匹配过程,能让我们往后对于自己的作品的用户垂直度能做到更细微的调整,让算法更好的收录自己的作品并进行多次的推荐。

Step.1 短视频A进入推荐系统后,系统根据上传设定的分类“体验”将其放置体育分类池中;

Step.2 系统抓取短视频A标题《姚明大动作,男篮设两队两主帅》中的关键词,“姚明”。“男篮”;

Step.3 系统匹配用户数据中标有“姚明” “男篮” 所对应“体育”“篮球”“男篮”等标签的用户,小量级试探推荐,观察用户是否感兴趣观看并有良性反馈;

Step.4 继而扩大量级推荐,并根据“姚明”,“男篮”关联更多关键词及标签用户,如“NBA","CBA","奥尼尔”等.......

二十六、抖音推荐逻辑的3个关键词

整篇文章针对当下抖音的算法机制由浅到深,由大到小的介绍,主要目的是让抖音的内容生产者能深刻了解抖音的算法框架,对于自己的作品的细节能进行调整,让作品自触发算法更好的上热门。后面我们会教大家如何更好的玩好这个机制,解锁各路热门视频的套路。

文章首发:《TOP 达人》

下篇预告:《抖音功能背后的秘密》