代号“M计划”

论坛:IT江湖作者:品牌发表时间:2009-04-20 18:29
April 19, 2009
代号“M计划”

在几乎中国所有同行都写过一遍谷歌音乐之后,我老人家终于可以把我们的版本贴出来了。其实还是有自信跟你看过的所有关于谷歌音乐的报道有所不同的。

在写这篇稿子过程中,我大概有连着一周的时间每天使用谷歌音乐十个小时,并成功的利用它找到了一个我此前几乎没有接触过的歌手谢安琪。有那么几天,我因为谢安琪翻唱黄家驹的歌(1、2)而兴奋不已:让我每天起床第一件事是带上 iPod!(回忆了一下,我上一次喜欢一名流行歌手还是孙燕姿,也就是大约9年前的事情。)

虽然王小峰言辞锋利批判了一把谷歌音乐,但我却觉得,能帮助每个人找到令其兴奋的音乐的产品,本身就是一件进步。今天的问题并不止是音乐界不能在数字时代赚钱(这当然是个问题),另一个问题是,在互联网,人们的选择太多了,反而不知如何选择,帮人们减少选择是重要的。

从这个角度上,我多么希望新闻业也有类似的产品出现啊。

长期被视为谷歌中国最大短板的音乐搜索反而被创造性地打造成了一款杀手级产品。除了李彦宏,它还可能让乔布斯头疼
代号“M计划”
文 本刊记者 张亮 朱旭冬
本文发表于《环球企业家》杂志 2009 年 4 月 20 日杂志

提问:一款完美的音乐产品应该是什么样子的?

“你一动念头,音乐就出来。”谷歌中国的产品经理洪锋慢条斯理的说。大概对这个答案仍不够满意,他随即补充了一句:“甚至不用动念头,自然就出来。”——这意味着,任何人在任何时刻可以获得最适合那个环境、时间与心情的音乐。

由意念控制隐藏在情境中的音乐?这听上去太不真实了。不过,倒也像科幻作家亚瑟·克拉克所言: “任何足够先进的技术均迹近魔法”。总有革命性技术以超乎想象力的方式改变世界,就像电力、飞机和搜索引擎。

某种意义上,2009年3月30日洪锋和他的团队所发布的谷歌音乐搜索第二版已经符合这一标准。当无数媒体将目光盯在台前的谷歌大中华区总裁李开复与来自百余家唱片公司高层合影言欢,并将此视为谷歌反击百度的最新武器,人们很容易忽视:这是一款至少在两个层面上超越现实的产品。

——谷歌与巨鲸网所获得的音乐资源,是完全免费、无版权保护(DRM)、可供下载的140余家唱片公司的完整曲库。这四个条件的全部满足,在全球范围内仍属首例。

——产品层面,它改变了人与音乐之间的距离。如果说搜索引擎降低了人找到信息的成本,社区网站把人与人之间的“六度分离”扁平化,谷歌音乐则前所未有的将一个人找到某一首歌的方法丰富化。你可以根据歌手、歌名、专辑名甚至一句歌词找到一首歌,也可以直接播放排行榜上的热门歌曲。不过,真正开创性的是这样两个功能:按照歌曲的节奏、声调、音色获得推荐,以及根据每首歌的音色获得相似歌曲。因其新鲜效果及实现技术的复杂性,它毋庸置疑的成为了谷歌入华以来最富雄心与想象力的作品。

而且,它有着异常丰富的扩展空间。虽然目前谷歌与唱片公司的合作协议仅局限于中国大陆,但即使唱片业也并不希望这一模式持续不变。“如果这在中国被证明是成功的模式,几年之后它没有被推广至全球我就会很惊讶了。”环球音乐亚太区副总裁Sandy Monteiro对《环球企业家》说。虽然没有人知道这究竟需要多久,但不妨想象,未来某天,这款来自中国的免费下载正版音乐服务进入美国市场,全球最大的付费数字音乐商店、苹果公司的iTunes究竟还有多少竞争力?

此前,在谷歌全球有不止一支团队试图开发音乐搜索,均在内部遭到否决:除了版权问题,谷歌的决策者们也从未被说服他们能在此领域超越同行。那么,最终这样一款产品,为什么能诞生于不以技术创新擅长,且版权保护效果不彰的中国?

请忘记那些高度概括的答案。和任何创新过程一样,它是复杂的、难以概括的。人们当然可以事后总结出天时、地利、人和等种种方便,但归根到底,它是一系列人的行为的结果:最不着边际的狂想、精心勾勒的合作方案、小心翼翼的内部沟通、将声音的物理特性转化为数学算法最终写成十余万行代码的辛苦工作,以及一些好运气……所有这些加在一起,最终完成了一次“不可能的任务”。

“或者”的暴政

谷歌中国需要一款音乐产品,从来并非秘密。

但同样显而易见的是,正常的商业逻辑下,搜索引擎和音乐界难以共生。这是完全背道而驰的两种商业模式:谷歌相信所有信息都有其价值、且它们应该以尽可能低的成本被找到,唱片业却认为有价值的信息是有限的,它们应该被小心保存,每使用一次就收一次费。当谷歌希望针对不同人的不同需求把隐藏于长尾中的信息挖掘出来,唱片产业则比拼着谁能找到全人类中一亿分之一的音乐天才。

倾向性的差异注定了双方的互动很容易伤害其中一方的利益。在中国,胜利者是百度。这家在中国拥有60%市场份额的搜索引擎有大约15%的点击指向了音乐搜索,而普通网民可以通过它找到海量的可供下载的免费音乐。唯一的问题是,它们几乎没有版权。唱片公司不能从这一持续活跃的行为中获利。这一度引发了双方颇多纠纷,但百度坚持表示,自己的搜索结果中提供的是网上已有的音乐链接,而非自己直接提供音乐下载,这帮助它有效规避了法律风险。

类似的诱惑,谷歌中国并非没有。2006年底,百度与国际唱片业协会的官司以前者胜诉收场,不久后谷歌又收购了带有版权麻烦的YouTube,这两件事的接连发生一度也让谷歌中国有人提出,是否可以做一款跟百度类似的产品?

可这没有成为最终选择。“英文有句话叫做Tyranny of the 'or',中文可以叫做‘或者的暴政’。意思是人很容易把自己框在一个二元对立的空间,或者做合法、收费的,或者做违法、免费的,只有两个选择。但我们不愿屈服于‘或者的暴政’,我们就要做既合法的又免费的音乐搜索。”李开复在接受《环球企业家》专访时说。

首先要解决的问题是,怎么将这种诚意传递过去?

网络业和唱片业之所以难以合作,除了立场上的根本差异,也有沟通上的障碍。双方操持的并非同一种话语体系,而强大的律师队伍为了维护各自利益的讨论更加速了谈判的不欢而散。

称得上机缘际会,2006年9月,时任谷歌中国首席战略官的郭去疾在旧时相识的介绍下,见到了由篮球明星姚明投资的巨鲸网创始人兼CEO陈戈。如果按照工程师的标准,陈戈口若悬河的风格不免让人担忧。但郭去疾很快发现了陈独特的一面: “他是一个‘传道士’一般的人物。你和他约好去他公司见面,如果迟到了,他会在公司门口一直等你;如果他给你写一封邮件没有得到回复,第二天他会同样礼貌的再写一封信,第三天还是如此。”

事后证明,陈戈的情商的确令人惊讶:整个谈判过程中,没有人见过他发脾气,无论承受何种压力,他永远能心平气和与你寻求共识。这让他恰到好处的成为了一块绝缘体,把唱片公司和谷歌之间的矛盾化解于无形。创办巨鲸网之前,陈创立过普莱音乐公司,曾给崔健组织演唱会、出唱片,这让他熟悉音乐圈的语言,足以扮演双方的“翻译”。而他和巨鲸网从未从事过盗版音乐下载,也能让他以“没有原罪”的姿态面对唱片业。

由此,在陈戈的介绍下,2006年11月、12月,次年1月,谷歌中国分别与索尼、环球、百代三家唱片公司初次接洽。那正是谷歌中国风雨飘摇时(请登陆gemag.com.cn查看2007年2月号文章《最长的一年》):不停被传闻即将黯然离职的李开复和他的团队在2007年1月明确了与巨鲸网合作的想法。

当然,李开复们的意愿,并不直接等同于谷歌的意愿。一个不可回避的现实是,如此级别的产品决策,谷歌中国必须向总部汇报,得到包括两名创始人及公司CEO的许可。

如何让一款在全球屡遭否定的产品意向得以通过?一如当时被舆论界低估,但日后显现效果的,谷歌中国富于“拐大弯”的沟通智慧:他们深知这并非一蹴而就的决策,便尽可能在中国区的授权范围内有所作为,并阶段性的对总部阐述这一推进的价值,在一次次的信息叠加中累积自己的信用。

第一步是让巨鲸成为谷歌中国的利益相关方。无疑,想在中国展开长期的音乐搜索业务,谷歌必须投资于巨鲸。当2007年2月,李开复和时任大中华区投资并购总监的宓群把这一投资意向上报到公司CEO埃里克·施密特,他们并没有冒失的把谷歌中国的音乐计划和盘托出,却只阐释了巨鲸的投资价值,并借此讲述了音乐服务对于中国用户的意义。一向对于中国事务就颇为支持的施密特很快便予通过。

真正将谷歌音乐作为一个项目报到公司两名创始人处,已是2007年11月。在此期间,谷歌中国参与此事的团队已经迅速积累起了一条陡峭的学习曲线:他们不仅想好了谷歌与巨鲸的的角色分工,更已将合作细分成六步——2008年8月发布的将音乐搜索结果以Onebox形式插入相关搜索结果中,和2009 年3月30日发布的独立页面的搜索产品只是其中的第一、二步。

当时最大的说服挑战,是谷歌已经明确将全球战略方向定为搜索、广告和应用(Search,Ads,Apps),音乐产品似乎不应成为一个投入精力的领域。但李开复们的回答也相当有说服力:具体的音乐内容和产品都属于巨鲸,谷歌中国只是作为入口提供者,这就并不违背聚焦于搜索的战略,而且,在中国,如果没有音乐搜索,忠诚的谷歌用户也很容易流失。为留出转圜余地,他们甚至提出了一种折中方案:购买一个独立域名,比如m.cn,以此淡化谷歌中国的色彩。

这最终成为了谷歌中国的一个小小的传奇:创始人拉里·佩吉只问了一个问题,就和公司CEO施密特一起批准了此一项目,全程不过几分钟。

必然之奇迹

即使顺利过关,谷歌中国对于巨鲸的投资仍是异常谨慎的。宓群主导制定了一个极为细致的投资结构:总共数额不过几百万美元的投资被分为了四轮,巨鲸每签下一家重要的唱片公司才追加一轮投资。最终,陈戈证明了他的确是个合适之选:到2007年9月,他已经颇有效率的签下了索尼、环球和百代三家公司有 “数字版权管理”技术(DRM)限制的免费下载和免费的歌曲试听。

一些迄今未被披露的谈判细节足以证明当年谷歌中国对于与巨鲸合作的方案规划之巧妙。比如,为规避合作仓促结束的风险,巨鲸与唱片公司的协约不止于外界所主要谈及的广告分成。据一名知悉内情的人士称,巨鲸与每家唱片公司所签的合同都相当复杂。除了外界最常提及的广告分成模式,还有两个保底收入:每下载一首歌获得一次缴费,以及每年的保底收入。这两项费用均由巨鲸向唱片公司支付。

而且,那些有意合作的唱片公司可以在巨鲸网获得期权。这就将此前除了陈戈的人脉资源并无太多独到之处的巨鲸网推入了一个良性循环:一方面,唱片公司对巨鲸的产品有了较大耐心,另一方面,每增加一方股东,巨鲸就多了一分希望成为中国音乐市场的领跑者——如果它能在几年后真的主导此领域,财务回报注定不俗,这又给了唱片公司更多期待。

当然,没有什么推力比音乐界自身的观念改变更为重要。

因为获利渠道的多元化以及音乐数字化之后的易复制性,以往签下歌手,毕其功于一役出一张专辑获取一次回报的时代已经过去。成功的歌手更多依靠代言和演唱会获益,而出专辑更像阶段性的曝光与提供新鲜感的一种方式。这迫使唱片公司将自己的角色从音乐制作者更多的转向营销、推广、开发衍生产品等“造星”并试探商业模式上转移。

这正是谷歌、巨鲸的谈判团队切中要害之处。他们不停讲述这样一个理念:CD对于最忠诚的歌迷仍有市场,但对更多试图用音乐营销自己的明星,搜索引擎是最好的选择。而且,在传统模式中,围绕音乐开发衍生产品很可能是不经济的:多数歌手的歌迷非常分散,销售相关产品的成本就很高。但互联网却可以低成本的把某一类歌迷集合起来定向营销。

一个绝佳的案例是谷歌中国自身:在进入中国市场第二年,谷歌中国的收入已经达到1亿美元。想想看,这只是在2006年的中国拥有大约20%市场份额的谷歌。据陈戈称,2008年所有唱片公司在中国市场加起来收入不过五千万美元。

但一个障碍挥之不去:唱片公司的版权保护管理(DRM)。DRM的目的是防止消费者对他们买的媒体内容上进行非法拷贝,它可以限制正版音乐能够被拷贝几次,在几台设备上播放。但站在谷歌的角度上,提供有DRM的音乐,就意味着很多并不了解技术细节和版权保护详情的用户会经常感到不便,这是他们最不愿接受的。2007年10月,谷歌的产品部门明确表态,巨鲸必须获得没有DRM保护的使用授权。

这让原本希望在2008年3月发布的谷歌音乐一拖再拖。有当事人2007年10月到2008年4、5月称为这个项目的“黑暗时期”:没有人能够确保谷歌的愿望达成,陈戈也几乎无法承受这一压力。

有人建议由巨鲸自己开发一种附和DRM标准但不影响中国用户体验的版权保护方法,但这一擦边球方案对于一向讲究“不做恶”的谷歌仍有不小的风险,而被否决。另一个选择是只做一款流媒体播放,不提供下载的产品,但谷歌仍然担心下载功能的缺失是否会破坏用户体验,这一方案也由此作罢。

最终的转机发生于2008年5月10日,当巨鲸的陈戈和谷歌中国的郭去疾一起前往英国百代唱片的数字音乐部门,在曾经为甲壳虫、皇后乐队和U2们录制专辑的艾比路录音棚,对方负责人道出了一个惊人的消息:自己在一个多月多后即将失去这份工作。百代刚刚挖来了时任谷歌全球CIO的道格拉斯·梅瑞尔接替他——但是,即将离任者反而给出了承诺,一定在离职前把DRM取消。

这是一个非常富有意味的转折点:音乐界最后的大门终于敞开了,而开门人却是即将离职的守门人。

当百代做出改变,其它几家的跟进就成为了连锁反应。即使如此,当李开复最终说服拥有大约40%华语歌曲曲库的索尼加入这一阵营,已经是2009年初。

“能做成这件事,真的是个奇迹。”已经离开谷歌创业的郭去疾对本刊感慨到。从构思之初到跃过最后一道门槛,谷歌中国已经用了两年时间,期间,无论唱片公司还是谷歌都有不少参与者离职,但这都没有影响交易最终实现。

这是个历史的必然。但给这块沉重石头最后一下推力的,是将传统商业智慧抛之脑后的狂想。

集结号

2008年8月5日,谷歌中国办公楼,在一间名为“开心”的办公室里,人们很不开心。

这是谷歌音乐搜索第一版上线的时刻。自从2007年7月成立音乐开发组,它已经从一名工程师扩张成十人规模的开发团队,一个在谷歌内部堪称庞大的阵容。作为秘密武器存在,他们已经历了漫长而寂寞的等待期:特别是2008年3月以来,每个月都有可能发布产品,但每次又遭到延迟。这实在太令人沮丧了—— 如果奥运会之前还不能有所作为,他们就得在全国上下的兴奋中再熬上一个月。

按照计划,他们该在十点把产品放到网上,如果没有意外情况,就出去吃个午饭庆祝。

但“惊喜”很快到来:不仅中国用户能访问它,印度、纽约的用户也在网上反馈说,他们能用它下载歌曲。所有人当场“傻掉了”。按照协议,谷歌音乐只能中国用户才能访问,这是由每台电脑的IP地址识别的,现在却颠倒了过来。而这不仅会成为谷歌中国对外的一个笑柄,还可能让唱片业丧失对自己的信任。

不知所措中,他们把产品从网上拿下,一行行检查代码。网上已经开始流传谷歌音乐发布的消息,这一项目的主人们却不知道究竟多久才能正式发布。 “快的话,几十分钟,慢的话,十二小时。”当时身在上海的产品经理洪锋说。接下来的许多个小时里,他都只能坐在视频会议的镜头前,就像他的面孔被投射在墙上所隐喻的,一种巨大的无力感。

当他们把问题找到并解决——这产品跟公司的另一款产品的代码有所冲突——已经是晚上八点。

说这是一款命运多舛的作品,应不过为。谷歌音乐的前端技术负责人唐汀回忆说:“这个项目做了一年半,有无数个这种时刻,我们都可以说‘这太难了’、‘这不可能’。但最后我们就剩下了一种‘横’,较劲,一定要把它做出来。”

这是这个故事的另一侧面。当李开复、郭去疾、宓群们为了推开音乐界的方便之门而费尽心机时,一批工程师在修筑进入新的音乐世界的通道。在很长时间里,他们并不真正清楚这款产品究竟通向何方,无论它的命运还是功能取舍、介面设定,一切都并不清晰,或者说,有待创造。但这种不确定性,也正成就了谷歌音乐的惊喜感。

此项目的第一名参与者,是产品经理洪锋。郭去疾称,在项目尚处于空想阶段,洪锋是一个非常合适的讨论对象:他对事物有着朴素而深入的好奇。而当它的眉目稍微清晰,洪锋又是一个颇为讲求细节的人:做事之前想的很清楚,一旦认准方向,他会想方设法说服合作者,一步步打磨出他想要的效果。

“避免去做一款让用户不开心的产品是相对简单的。但是做一款让用户们‘不不开心’的产品,并不等于做出的产品能让他们开心。”洪锋对《环球企业家》说。他语速不快,常打比喻。这种喜欢将理念性话题以相对形象的方法表达出来的沟通方式,一定程度上与他从小学起学过多年美术有关。其产品理念也是如此。

当他想到把数以百万计乃至人类拥有的全部音乐数字化,他“看到”了一片海洋:身在其中,每首歌就像触手可及的一个气泡。

怎么让一个沉浮于大海某一角落的人抓住一个他真正想要的气泡?这个问题属于工程总监林斌及其工程师团队。

林斌喜欢讲自己加盟谷歌的故事。2006年9月,还在微软研究院工作的他在出差时遇到相识已久的李开复,随口问了一句:“你们为什么不做音乐搜索?”李很痛快的回答:“可以啊,你来做?”几个月后,林斌加盟。

没有爽约,到了谷歌,虽然很快就意识到了在这家公司做音乐产品有多难,林斌还是坚持把这个项目划在自己名下,甚至在立项之前,就跟李开复申请了专职于音乐产品开发的工程师名额。

林斌的坚持让三名初入谷歌的新兵被划入代号“Project M”(M计划)的音乐项目。性格活泼的杭州女孩汤萌芽和外表羞涩但极爱唱歌的中山大学毕业生邹振盛摸索着产品的呈现方式,而稳重、极富沟通耐心的赵启胜则专注于后端以及与巨鲸网的沟通、协作。因为尚未获得创始人许可,他们最初的三个月甚至没有进入编写代码的状态,连李开复事后回忆起来也笑称他们几人为“最可怜的工程师”。期间,林斌们还有太多的障碍需要去一一排清,为了不影响士气,尽可能以“报喜不报忧”方式与他们沟通。回顾当初,林斌仍然有些动容:“到今天我也很感激他们,那时候他们很清楚这个项目的不稳定性。”

当项目最终获得批准,当时正在谷歌中国做视频搜索产品的唐汀找到林斌,希望加入其中。之所以主动请缨,是因为成长于海外的他在申请派驻回中国时,本就希望参与一些富有中国特色的产品,而且,以前偶尔听到别人说中国不重视版权保护,也让他对此项目格外感兴趣。当唐汀带着高大的东北人韩准加入到这个团队,他们带来的是极度细心修改代码中错误的体力和耐力。

不过,这款产品还需要一个在科研层面带来突破的人。

2007年初,李开复去往谷歌纽约办公室出差,专门抽出时间做了一个关于谷歌中国的演讲,希望由此吸引更多一流工程师回国。会后,一个清秀的女生找到他。这个当时正在纽约办公室负责移动搜索质量的工程师名为胡宁,是李在卡内基梅隆的师妹,交谈不久,李就建议胡宁认识一下在北京负责移动搜索的林斌。

当林斌和胡宁终于在北京坐下来聊天,他惊讶的了解到,胡宁2004年在谷歌实习时就做过一款音乐搜索产品,而她博士的研究方向为音频信号处理和信息检索,与此恰好一脉相承。胡宁说,可以把科研领域的前沿成果放到谷歌音乐中来,并愿意为此搬回中国。

闻弦歌怎知雅意

当你获得了海量的音乐信息,你究竟有几种方式去处理它?

最简单的,是把自己变成一个庞大无匹的FTP,任何人都可以前来下载。但这就像一座无人管理的图书馆,只有当用户知道自己想读哪本书,它才是有价值的。

相对高级的方法是让电脑成为图书管理员:它通过之前做好的信息分类把类似的歌曲推送给听众。比如一家名为Pandora的公司,通过人力将音乐类别划分出400个标签,对每首歌进行标注。当你选中一首自己喜欢的歌曲,它会把同一标签下的歌曲逐一播放。但这就像一条单行道:在一个相对有限的曲库下,人做出的判别当然是准确而微妙的,可如果把曲库放大到百万级就难以为继。而且,每个人的口味总有不同,Pandora的方式却只能假设所有用户的审美是同一的。

那么,谷歌能不能教会计算机成为世界上最聪明的图书管理员呢?一方面,它能对不同音乐的特征了如指掌,另一方面,它又能针对用户做个性化推荐。

想做到这点,就必须让电脑学会很多原本只有人才有的常识。这一方向在初期显然不会像Pandora一样快而有效编制出一套推荐体系,但它的扩张性要好的多。

胡宁的工作,就是“教会电脑听歌”。与人类的“倾听”截然不同,胡宁需要先把音乐的物理特征还原成数字,由电脑对数字进行分析和类比。

比如,任何一个人都可以轻易识别出鼓和笛子的音色的差异,只要找到方法把这两种差异转化成数字——假设,鼓是2046,而笛子是1984——即使电脑没有耳朵,也可以将它们区分开来。而在一个成熟的算法下,那些音色接近的人也应该被标以类似的数字:王菲、爱尔兰乐队小红莓和冰岛歌手比约克,也许在最终数字上的差异只有0.1。

那么,想象一下,根据不同的音色,电脑是有可能给所有的音乐绘制出一张无限庞大的地图的。虽然电脑只是在计算时把彼此详尽的数据凑在一起,但还原成物理世界的歌曲,人们看到的就是钢琴曲集合在一起,吉他独奏凑在一起,声音粗砺的摇滚男声被划分到一个阵营……

当然,真实的计算过程并非如此简单。面对一首歌,胡宁先要把它还原成频谱,并以“数十毫秒”为单位将它分割成数千个段落,从每个段落中提取出事先设定好的一百余个特征值。这大约相当于,其中的一段数十毫秒为一个鼓点,而另一段数十毫秒是一声镲,它们各自被总结成一个拥有100多个特征值的向量,这两个向量是不同的。一首歌由上千个这样的多维特征向量构成。那些向量重合度相对高的歌曲是相似的——这就像你在一个纸上画出上千个点,如果有另一张纸上也有一千多个点,且这两张纸重叠起来看,所有点的位置类似,你可以说这两张画很像。

这个想法已经非常有趣,但洪锋依然希望在这个程度上更进一步。刚刚做完谷歌财经的他问胡宁,有没有可能像股票查询一样,用户只要在一些标准上做些简单的选择,就能得到不同的结果?

洪锋的设想从投资者角度是非常直观的:你可以让电脑列出市盈率在6倍以下的公司,或利润率在30%以上的公司。但胡宁并不认同他的创意:音乐是没有市盈率和利润率的,用户怎么选择?

但洪锋并不愿轻易放弃这一想法,他前后用了两周时间说服胡宁,音乐的指标并不需要像市盈率一样清晰,但增加用户与音乐的互动性本身就是一个有趣的想法。

于是,在本已紧张的开发计划中,谷歌音乐第二版包含了两个方向的产品:一个是胡宁推动的相似歌曲,一个是洪锋构想的根据音乐特征挑歌。

和胡宁一起进入这一新方向的,是2008年7月底才加入谷歌的清华大学博士路羊。一直在学校里研究信号处理的他本以为加盟谷歌这家搜索引擎公司之后可以告别老本行,没想到不仅不能如愿,还在胡宁的要求下读了厚厚一摞论文,并时不时拿出数学书来进行研究。而林斌在拣选全球工程师资料时,又在苏黎世发现了一名学术背景和胡宁、路羊相似的工程师,亦邀请他越洋加盟。

光是找出几个通行于所有歌曲的标准,已非易事。如果让普通人来设定歌曲特征,人们很容易想到根据快歌、慢歌来加以区分。但在技术实现上,它却是一条弯路。

为采集相关数据,路羊和苏黎世的同事在电话会议上一起听着同一首歌一起在桌子上打拍子,前后处理了大概一千首歌的数据。可他们最终遇到了难以逾越的问题:那些配乐很弱的歌本来就很难找到清晰的节奏,有些歌曲则前后节奏不一,甚至,不同的人对于节奏的判断也是不同的。人耳极易辨识的快慢,电脑分辨起来却只有80%的正确率。虽然在学术上,这已经是个了不起的数字,但在现实应用中,这就意味着五首歌里有一首的快慢是明显误判的。在路羊的游说下,以节奏快慢为特征选歌被修改为了按照强烈或舒缓分类。

在另一条战线上,胡宁推进的相似歌曲同样困难重重:她很快做出了一款覆盖几千首歌的演示产品,效果极佳,但当她把数据量上升到几万首歌,质量又惨不忍睹,只好推倒重来。

问题的核心在于,在学校时,她只要对1000首歌这样量级的数据进行分析就可以发表论文了,但她这次面对的是数以十万计的歌曲。当你只对几千首歌进行分析、聚类时,大概设定几百个音色类别,就可以把它们相对有效的归类。但数十万首歌的音色差异就实在太大了:中国歌曲和外国歌曲的音色听上去差别有限,但体现在数字上却明显不同,而有的歌只是从头到尾一个人在讲话,这样的特例怎么考虑进去,也是一个挑战。

一下子把数据量扩大到十万级来开发产品是不可能的。胡宁和路羊只能选择一种最笨而有效的方式:每次在较小的数量级上进行实验,确定可行的办法,然后针对每次数量级的扩大所带来的问题对最初的特征值确定、聚类进行调整。这意味着,每次针对较小数量级的曲库写出有效的代码,不久之后要主动扔掉。据说这个过程中,丢弃的代码大约是留下的十倍。

直到电脑处理过5万首歌,这套系统才最终比较稳定。而此时,特征值的分类已经扩大到了4096种。这似乎是个注定属于谷歌的产品:对30万首歌做一次分析和聚类需要上千台计算机同时工作数十个小时,并非每家公司都可以运作。

**
在谷歌音乐第二版即将发布之前三周,李开复和洪锋终于可以将产品演示给公司CEO埃里克·施密特。据在场者回忆,富有产品经验,总能一针见血看到问题的施密特这次在看过产品后,发出了疑问:“我的中国同事们,你们能不能告诉我,我该问点什么尖锐的问题?”

的确,对于今天的谷歌中国,这都是一款足以令人惊喜的产品。据说它完成第二版后已经有超过十万行代码
标签: 添加标签

0 / 0

发表回复
 
  • 标题
  • 作者
  • 时间
  • 长度
  • 点击
  • 评价
  •   不错
  • 参谋长 
  • 2009-04-20 19:35
  • 36
  • 1206
  • 0/0

京ICP备14028770号-1