SigninwithApple曝高危漏洞?
第一阶段:核心产品策略
1.核心
算法和体验
a.初始化
借助社交平台,如微博的open api,结合微博上下文语义或关键词分析对用户进行标签分类,根据用户的feature属性进行初始化分类建模
抽取一部分用户,让用户可以自主选择新闻tag分类进行订阅,对比自动推荐的人均阅读篇数和留存情况,进行模型效果比较和优化
根据上面两点进行数据挖掘和标签分类,分析用户的feature,进行建模并预测用户可能会喜欢的新闻内容,进而预测后续新进的用户类型。
b. 核心算法
算法类型
关于推荐算法的类型的讨论,大概常用的有如下类型:
基于人/文章的协同过滤推荐
矩阵分解(隐藏因子)推荐
语义分析推荐
标签分类推荐,建立用户兴趣图谱
排序思路
确定变量组作为排序优化的目标
正向变量:如打开文章,点赞,阅读完整一篇文章;
负面变量:如不感兴趣,没有阅读完,阅读时长低于当前用户文章平均阅读时长
预测在哪篇文章能够触发我们的变量
结合分析之前用户的浏览行为是怎么样的,根据feature进行建模和预测,最终最符合优化目标的变量作为排序的重要依据。
算法预测模型
对热点、趋势文章进行模型预测
如对一定时间内语义分析上升趋势明显的关键词/事件进行学习和预测,或结合 google trends,社交网站open api综合比较
可传播文章模型预测
内容传播比=社区传播量/分享量
内容回流比=回流访问量/社区传播量
通过内容传播比和内容回流比,不断机器学习那些文章是可以成为可传播文章模 型的,从而对可传播的文章进行预测性推荐。高参与度文章模型预测
根据赞”等操作,学习和预测哪些文章是高参与度的。
2.算法运营
a.通过喜欢,不感兴趣” 类似facebook的"x-out/not like"动作的积累来平衡信噪比
通过深入分析被not like的文章,对其内部权重值下调,分析看到not like文章的用户的情况来可观分析单篇文章的质量
b.生命周期不同阶段的用户采用不同的算法
针对不同的阶段,机器学习每个阶段的用户的行为特征,并且对其特征进行分析推荐。
第二阶段:快速增长策略
1. 丰富新闻信息流产品形态
新闻信息流中有多图,赛事直播,电影,视频,音乐,专辑等内容维度拓展
2. 适度穿插第一阶段中的模型(热点模型,传播模型,高参与度模型)进行信息流运营
3. 降低首次阅读文章的门槛,对新用户阅读文章的趋势进行cohort分析
分析新用户和老用户之间阅读文章占比的趋势变化,同时可以作为观察最近发行质量和老用户阅读习惯的衡量指标
4.扩展推荐的类别,允许一定误差范围内进行扩张性推荐
第三阶段
:产品运营策略/平台化策略
1.提供站点热度分析供网站源进行文章内容优化
2.和各大站点进行深度合作,
3.站点作为公众账号接入运营
4.产品运营
总结:
要避免进入的误区:推荐的内容越来越相似,面越来越窄,变成一个
收缩型的模型,不利于产品长远发展
前期推荐会进入一个收缩的阶段,最后出来的会越来越相似(好的推荐系统,会兼顾了收敛和发散),所以指标应该是一个综合值(总阅读时长,人均阅读篇数,单篇阅读时长,互动数等来综合评定)
核心目标是建立多维度综合指标优秀,且具备良好可发展生态的算法模式。