推荐系统教程:冷启动
内容纲要
推荐系统冷启动
简介
在没有大量历史数据的情况下做推荐,叫冷启动。
分类
根据缺乏数据的种类分类
- 用户冷启动:用户没有历史记录情况下的推荐
- 物品冷启动:物品没有历史记录情况下的推荐
- 系统冷启动:新上线的系统如何进行推荐
根据冷启动策略分类
- 基于规则的冷启动过程 。
- 丰富冷启动过程中可获得的用户和物品特征 。
基于规则的冷启动过程
常见方法
- 热门排行榜
- 最近流行趋势
- 最高评分
实例
Airbnb冷启动
先聚类:
- 同样的价格范围 。
- 相似的房屋属性(面积 、 房间数等) 。
- 距目标房源的距离在 10 公里以内
然后再推荐
利用用户和物品特征
用户的注册信息或第三方提供的用户信息
注册信息内容
- 人口统计学信息:包括用户的年龄、性别、职业、民族、学历和居住地。
- 用户兴趣的描述:有一些网站会让用户用文字描述他们的兴趣。
- 从其他网站导入的用户站外行为数据:比如用户通过豆瓣、新浪微博的账号登录,就可以
在得到用户同意的情况下获取用户在豆瓣或者新浪微博的一些行为数据和社交网络数据。
物品选择原则
- 比较热门
- 具有代表性和区分性
- 启动物品集合需要有多样性
推荐流程
- 获取用户的注册信息
- 根据用户的注册信息对用户分类
- 给用户推荐他所属分类中用户喜欢的物品
在得到用户同意的情况下获取用户在豆瓣或者新浪微博的一些行为数据和社交网络数据。
物品的内容特征
实例
引导用户输入的冷启动特征
一些音乐类应用会引导用户选择 “ 音乐风格 ” ; 些视频类应用会引导用户选择几部喜欢的电影 。 这些都是通过引导页面来完成丰
富冷启动特征的工作。
利用专家系统
推荐流程
- 专家定义类别
- 给物品label类别
- 根据用户感兴趣的类别,推荐物品列表
实例
-
专家定义类别
- 心情( Mood) 表示用户观看电影的心情,比如对于《功夫熊猫》观众会觉得很幽默,很兴奋。
- 剧情( Plot) 包括电影剧情的标签。
- 类别( Genres) 表示电影的类别,主要包括动画片、喜剧片、动作片等分类。
- 时间( Time/Period) 电影故事发生的时间。
- 地点( Place) 电影故事发生的地点。
- 观众( Audience) 电影的主要观众群。
- 获奖( Praise) 电影的获奖和评价情况。
- 风格( Style) 功夫片、全明星阵容等。
- 态度( Attitudes) 电影描述故事的态度。
- 画面( Look) 电脑拍摄的画面技术,比如《功夫熊猫》是用电脑动画制作的。
- 标记( Flag) 主要表示电影有没有暴力和色情内容。
-
物品给定类别
-
专家定义类别
- 心情( Mood) 表示用户观看电影的心情,比如对于《功夫熊猫》观众会觉得很幽默,很兴奋。
- 剧情( Plot) 包括电影剧情的标签。
- 类别( Genres) 表示电影的类别,主要包括动画片、喜剧片、动作片等分类。
- 时间( Time/Period) 电影故事发生的时间。
- 地点( Place) 电影故事发生的地点。
- 观众( Audience) 电影的主要观众群。
- 获奖( Praise) 电影的获奖和评价情况。
- 风格( Style) 功夫片、全明星阵容等。
- 态度( Attitudes) 电影描述故事的态度。
- 画面( Look) 电脑拍摄的画面技术,比如《功夫熊猫》是用电脑动画制作的。
- 标记( Flag) 主要表示电影有没有暴力和色情内容。
-
物品给定类别
- 用户选择了某个电影,推荐同类别的电影
留言