搜索: - 浪迹天涯
你才有病呢
江湖兵器浪迹天涯2009-02-06 10:06:37
至少可以避免这个吧? http://latimesblogs.latimes.com/lanow/2009/02/girl-washing-ma.html
Re: 我理解你的意思
江湖兵器浪迹天涯2009-02-06 10:04:03
热贴=f (帖子属性,发帖人属性,跟贴人属性) 不是要定义热贴。我的意思是要看什么因素(包括帖子属性,发帖人属性,跟贴人属性)对产生热贴有影响。比如,同样的帖子我北京时间凌晨1点发就比早上8点发效果差很多;同样的帖子你dodo跟了就比我跟了强很多。一个帖子太长成不了热贴?那么多长最好呢?热贴的产生除了和内容有关系还和这些要素有关系。 我是要跑一个回归分析(regression),看一下。我就用你对热贴的定义吧,能不能把权重告诉我一下。谢。...
没说清楚,修改一下
江湖兵器浪迹天涯2009-02-06 04:21:32
最最后,问题就是: 贴子A存在5个小时,点击数500,跟贴数5 贴子B存在1个小时,点击数100,跟贴数1 他们是不是一样的热?我的答案是: 是的,一样的热。
Re: 不合理
江湖兵器浪迹天涯2009-02-06 04:15:41
回来了,本来想写挺长的,也不想写了。都说在中国发烧就让你查艾滋病,我膝盖疼就一定要我做手术,妈的。 简单说一下吧。 你那个A和B的没有比较性,因为两个帖子存在的时间不一样(如果存在时间一样,你对了,但你也知道这不可能)。A肯定存在长于B,你拿他们两个比较,就好象比较一个电影第一个周末的票房和另一个电影半年的票房,然后说第二个电影票房高是好电影。 从逻辑上说,我们现在是说: 数据--》热贴 而由于第一个帖子存在时间长,就变成了: 数据--》热贴--》数据 也就是说成为热贴后(你在首页置顶了)又...
你当之无愧
江湖兵器浪迹天涯2009-02-06 01:02:36
呵呵。 这是个好问题,我是这样考虑的。 我那个方程是看哪个因素对热贴的形成有影响,和你说的是两个话题,你说的是如何衡量热贴。先就说你的问题。 “点击数与回贴数加权计算的值”已经是一个比较好的标准了,包括了用户和潜水员两个因素。但是这个有缺陷。比如,有帖子没回帖但点击很高,比如下面乔治贴的照片只有一个回帖但有673的点击,这不能算热贴(你的算法可能会算成热贴,看你如何加权的)。有帖子回帖很多,但点击不多,比如我这个主贴有15个回帖才300多下(你的算法可能算成不热贴,看你如何加权的)。 我想用的是...