微软的梦工场-第26部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
在做完演示的空暇我会在会场四处走走,参观其他研究员的展台。我发现有很多研究员非常认真,甚至是一些资深研究员们也都一直坚守在展台前演示自己的项目,不管我何时经过,都看到他们有着饱满的热情,我可以感受到他们对研究的热爱,而这份热爱和年龄与职位都没有关系。他们身上所展现出的激情与创造力让我深受感染。
我心目中对技术节的看法也因此一点点地改变了。
我见到了鲍尔默
鲍尔默,那个听说会在公司年会上骑马冲上台的CEO,我曾在公司的内部视频上看过他充满激情的演讲片段,但我从未想到有一天我能站在他的面前演示我的demo。
可技术节就是这样一个让人梦想成真的地方!
2006年3月2日,我激动而忐忑的等待在展台前。
第72节:TechFest:我们的技术节(2)
鲍尔默在两三个人的陪同下来了。没有前呼后拥,和普通的观众并没有太大不同,他很随和的拉过一把椅子,坐在了我面前。
我要给鲍尔默做的演示是photo2search,其内容是用户用手机拍下照片,把照片上传到服务器并匹配与之最相似的图片,从而得到和照片拍摄内容相关的信息。举个实际中的例子来说吧,你用手机拍下路边某餐馆,系统将该照片和其他图片进行分析匹配后,便能够知道该餐馆的名字,还可以将餐馆的优惠活动,甚至当天特价菜品等信息发送到你的手机上。你只需摁了几下手指,便很方便的得到了想要的信息。
演示中,我输入预先准备的查询图片——这是一张天安门的照片,系统立即返回了数据库中所有和天安门相关的图片。鲍尔默很快便理解了这项技术的主要功能,非常兴奋的谈起了他的看法,包括潜在的商业用途,微软哪些产品中可以运用该技术等等。他敏锐的眼光和独到的观点让我非常佩服,也让我看到了这项技术的美好前景,增强了把研究转变为现实的信心。
这次技术节上,我还注意到一些有趣的细节。为了了解什么样的演示最受欢迎,组织者在每个展台前放上了一台刷卡机,你如果对某项技术感兴趣,就在该刷卡机上刷下自己的门卡,以此作为最后的人数统计,并且会在技术节结束后把你看过的所有演示信息通过email给你。另外,会场内还装备了一台大屏幕,实时显示着每个演示的刷卡数。
于是,一个有意思的场景出现了,研究员们休息时便三三两两的端着咖啡,到这里来看自己的排名情况。也因此出现了排名之争,继而衍生出各种各样提高排名的方法。比如,有人会费尽心思将自己的展区布置成小型电影院的模样,还有人准备了小礼品以“贿赂”参观者。我们一边学习别人布置展台的经验一边也想了很多方法,租了大屏幕显示器,并请专业设计师设计了精美的海报,这一切都是为了吸引更多的眼球。努力终归没有白费,第二年,也就是2007年,在所有来自中国的演示项目中,我们拿到了刷卡量第一!
上CNN了
技术节的第一天叫做Public Day,即“公开日”。这是面对媒体的宣传活动,并会邀请一些学校的教授和其他公司的高层前来参加。公司会从参加技术节的所有Demo中挑选出一些参加Public Day上的公开演示。
2007年,我的项目被选中参加Public Day。这对我来说是更大的考验,意味着不能出任何的差错,意味着将要面对记者的采访,当然也意味着会有更多的人关注我们的项目。
今年的演示延续了上一年的工作,即用手机拍摄照片来进行搜索,但这次不仅可以支持更大规模的数据库,返回的结果也有了很大改进。在这次演示里,我们使用了百万量级的图片数据,基本上可以覆盖一个城市的大部分区域。虽然数据规模更大了,但是系统的查询时间并没有增加,基本上在几秒内就可以得到结果,在手机使用中这已经是可以接受的性能。性能提高的主要原因是我们使用了分布式的系统来处理查询,极大地提高了系统的可扩展性。
(谢幸在2007年微软技术节上向观众做Photo2Search演示)
Public Day那天,CNN、BBC、Seattle Times (《西雅图时报》)、路透社等各大媒体都派出了记者参加,也能看到来自中国的记者,如《计算机世界》、《互联网周刊》等等。通常记者的采访是这样的:一人负责拍摄,另一个人手持话筒,边看演示边提问题。整个采访过程时间并不长,这就需要我必须在很短的时间内,既让他们看懂演示的技术,又要把其中的关键点讲述得简洁清楚。就这样,记者走了一拨又来一拨,一天下来,我已经记不清楚我接待了多少位记者、做了多少遍演示。
第二天,我刚打开邮箱就发现同学给我发的Email,“你上CNN了!”我很惊讶,连忙打开CNN的网页,赫然发现我做演示的照片出现在当日科技版的头条新闻里,标题是“TechFest Explores Future Technologies”。新闻里这样写到:“Lost in Seattle with nothing but a camera phone? Just snap a picture of a nearby building; send off the photo to a database and soon you〃ll get back a map and information about where you are。 (在西雅图走失了?什么都没有,随身只剩下一个可拍照的手机?没关系,只要拍下一张周围建筑物的照片,把它传到数据库,一回你就能得到你所在地的地图和信息了)” 我的经理马维英看后开玩笑的对我说,很多人千方百计想上CNN还上不了呢。随后,沈向洋院长也写信来打趣我说“你看起来很帅!”技术节一结束,我立即将这些报道转发给为了这个演示一起努力工作的同事和学生,让他们和我一起分享这份喜悦。
2008年3月,西雅图春寒料峭,我和我的同事们又一次来到了技术节,又一次拿到了中国参演项目中的点击量冠军。
我们是一群科学顽童
现在再回头说说,为什么说技术节就好像是一个全公司的创意市集呢?
细细比较起来,两者还是有诸多相似之处的。每个参加技术节的研究员们就好像市集上的摊主,每个展位就是他们的“摊位”;市集上的摊主们出售的是自己的看家宝贝,研究员们展出的是自己引以为豪的技术;正如摊主们的主要目的不是为卖出商品一样,研究员们参加技术节也不只是为了做秀或扩大知名度,促使他们来到这里的动力主要是源于对技术本身的热爱与激情。正是由于这种热爱与激情,使得这里没有年龄的差异,没有级别的高低,这里只有一群热衷于科学的顽童,每一次的脑力激荡中总会闪现灵感的火花。
费曼说,科学是很好玩的游戏。这句话改变了很多人对科学的刻板态度。同样的,技术节也改变了我做研究的态度,研究也应该是很好玩的游戏,只有对事物保持好奇、怀疑、钻研、动手实验的态度,只有保持一颗具有创造力与激情的心灵,只有把自己的技术看作犹如自己孩子般的热爱,才能在做研究中享受创造的乐趣,才有可能体会到成功的兴奋与喜悦。
每一次的技术节,我都被这种气氛感染着,也在这个环境里成长着。从第一张朴素到不起眼的自画海报,到现在的借助专业设计;从第一次的通篇背诵讲稿,到现在的交流自如侃侃而谈;从刚开始站在展台上的紧张不安,到现在面对记者时的成熟老练……是一年又一年的技术节造就并见证了这一切。
作者介绍:
谢幸,江西南昌人,15岁离家,求学于中国科大少年班。自认既非英雄,亦非神童,然勤能补拙,并幸得良师。24岁博士毕业,加盟微软亚洲研究院,于互联网搜索组任研究员,发表论文数十篇。忙里偷闲间,尤喜阅读与收集,平日里流连方寸,神游书海,乐此不疲。偶能偷得几日浮生,寄情山水,实为平生快事也。
第73节:微软对联背后的故事(1)
微软对联背后的故事
作者:周明
微软对联系统第二版在2008年春节之前10天终于上线了。我非常高兴地看到经过自然语言祖和创新工程组的同事们半年多的努力,网站以一个崭新的界面加上一个水平更高的对联系统 带给用户更加美好的体验。我非常喜欢创新工程组同事邹放设计的漂亮的界面,有两个大红灯笼,灯笼下面垂挂着两行对联:
新年纳余庆,嘉节号长春
据说这是中国最早的一幅对联,是五代的后蜀的国王孟昶写的。从那时候起,对联就逐渐开始流行了,成为中国文化的最典型的代表。为了配合上线,在微软亚洲研究院的博客上,蒋龙在公共关系组的同事葛瑜的帮助下,投放了一篇“看计算机‘舞文弄墨’”的博客 。
虽然我们并没有做任何商业宣传,但是上线当日就创造了单日独立访问人数5万人次、每日页面浏览量达50万的“票房纪录”。许多人发帖,呼吁大家使用这个新奇的软件。在百度搜索一下“微软对联”,一下子就达到93万的记录。这对于一个研究项目来讲,似乎是一个奇迹。
用户通过微软对联系统,似乎在进行一次穿越中国文化的发现之旅,找寻中国文化渗透到每一个汉字,每一个词,甚至每一个笔画上面的千年沉淀。又似乎在跟电脑的默契配合,体现互联网时代每一台计算机背后的骨子里的一点点的创新、少许的幽默和对时弊的愤世嫉俗。
我无聊的时候,总是爱到网上去看看有没有什么有趣的评语。这就像看着自己的孩子一天天地长大。下面摘录两则我看到的比较有意思的评论。
评论一:
“微软研究院的这套对联机真的是很好很强大,那天是在大旗网外链的一个论坛上看到的,帖子很热,人气很旺,从上到下认真的看完每个对联之后,对微软的这套对联系统那真是佩服的五体投地。
咱们可以先看看饱受好评的几个对联:上联:毛林周刘华邓江胡,下联:秦汉晋隋唐宋元清,横批:震古烁今;上联:物价并不高,下联:市场已经远,横批:对酒当歌。
第74节:微软对联背后的故事(2)
评论二:
我也从来没有在家门贴春联的习惯,但是老爸喜爱书法艺术,也略有小成,用着这套好玩的微软对联机,心想:赶着春节将至,不如编个春联让老爸写写,也蛮热闹喜庆的,即成上联:木土杜家喜迎吉祥鼠,对联机略做运算即成下联:车干轩户春接富贵人,横批:骏业顺风。”
我常常在思考,这个微软对联系统究竟有什么值得总结的地方。看到微软对联,再看到这么多网上的评论,我的脑海里就总象在放电影一样,把这个历程里出现的人物和有趣的事情一幕一幕地闪现出来。值此微软研究院十周年之际,我想确实应该趁现在记忆还清晰的时候,把这段历史好好地总结一下,以便让十年、二十年之后的人们还能够看到曾经发生的有趣的故事。
誓与李敖比高低
微软对联这个项目,跟前任院长沈向洋大有渊源。此事说来有点话长了。
2004年底的时候,沈向洋把我叫去,说搞个自动对联吧。所谓自动对联,就是说人出上联,由计算机对出下联。他之前跟几个人都聊过这个设想,所有的人都告诉他别想了,不可能做出来。他失望,不甘心,反复提起来。“反正你是院长,你说做就做吧。”大家说。有点像傣族的泼水节,泼的都是冷水。
他跟我说你能做也得做,不能做也得做。我说我肯定做,而且肯定能做出来。不过,要允许下联有多个候选,还要允许人机交互。另外,我需要时间。我当时可说是穷困潦倒,自然语言组不足10人,有两名骨干即将转到微软别的部门去。还有几个项目同时在做技术转移,包括搜索引擎的拼写检查。大家还要赶写很多文章。我就从清华大学中文系招了一位同学,他的名字是马艳军,听上去像一个女孩的名字,人也是彬彬有礼的。
我设计了一个简单的模型,把对联的生成过程看作是一个翻译的过程。给定一个上联,根据字的对应和词的对应,生成很多选字和候选词,得到一个从左到右相互关联的词图,然后根据一个动态规划算法,求一个最好的下联出来。一个好的下联其评价标准也很简单,第一就是它跟上联的对应程度,一般用词和词的对应概率来代表,第二就是生成对联的语言模型,就是衡量它像不像一个对联。马艳军在我的指导下,在两个多月的时间里,根据这个思路,就做了一个简单的对联生成系统出来。我于是向沈向洋报告进展,这也是沈向洋第一次审核这个项目。
在他办公室