Yandex的Spectrum如何工作?
How does Yandex’s Spectrum work?techcrunch 2010.12.15号的文章Ilya Segalovich, yandex首席技术官,联合创始人Yandex分析海量的搜索记录(500亿次查询)来寻找查询中的“对象”,将它们分为60个类别,并根据对象的分类把每个查询分别映射为几种可能的“用户意图”的一种,然后计算用户在每种意图下寻找对象的(可能性的)百分比,然后通过NP-hard最优化问题,最大化用户对相关的常用模糊查询的满意概率。
例如,对[jaguar]和[beethoven],显示分类结果为car/animal/drink和movie/composer,然而对于产品搜索,结果将是关于buy’, ‘reviews’ 和 ‘feedback’意图的。
参见 http://company.yandex.com/genera… Spectrum 部分, 以及俄语资料 http://habrahabr.ru/company/yand…
and http://plakhov.livejournal.com/1…
说抄袭
图片来自matthewgriff (EmmGee)的相册
遵循姓名標示-非商業性-相同方式分享 2.0 通用版
这段文字在手机上断断续续按了两三天来,今天刚好看到keso在说创新与抄袭,于是就发了上来。
所谓模仿,追根溯源是人类的一种本性,而抄袭是模仿的一个极端。抄袭在各个领域都很普遍,学术上、商业上、文化上。对待抄袭,人们会公开的反对、谴责、诟病,特别是利益攸关的时候,而在实际中却又默认它带来的好处,承认它很实用。因此某种程度上,抄袭带来的是“利己利人”,损害的只是被抄袭者的利益/潜在利益,这种损失似乎又与己无关,在没有一定的统一的道德认识和道德约束的情况下,抄袭这种行为也就大行其道了。实用主义,拿来主义,实事求是,一切从实际出发,发展是硬道理,口号没有错,只是在这么多口号下抵挡抄袭的诱惑不太容易,毕竟life is short,能耐得住寂寞潜下心来的实在是少数。独善其身难,还要考虑值不值…
我是一个有创造性的家伙,有一个创业的主意,如何找到开发牛人来实现它?

图片来自fo.ol的相册,遵循姓名標示-相同方式分享 2.0 通用版
就像上一篇blog,关于quora也想写很久了,一直懒到现在,想想还是应该写写,哪怕是一点一点的写出来也可以积跬步以至千里。quora确实是一款很好的知识问答产品,有丰富的内容,可以学到很多既有时效性又有很高含金量的知识,同时融合了sns的人际关系特点。和另一款著名的知识问答产品stackoverflow又有所不同(ps1. stackoverflow上对这两个的比较和评论的问题,大家可以自行google,内容也很好。ps2. quora和stackoverflow在国内都有模仿者了现在)。在这里就不记述个人的使用感受了,而是在接下来翻译一些在quora上看到的好内容分享之。
先分享一个创业的初级话题,答案可以让很多有幻想有idea的少年早日去面对实际,去创去做,而不是在脑子里继续成为白日梦。由于对于此问题有很多答案,就选几个认同度高的共享下。
我是一个有创造性的家伙,有一个创业的主意,如何找到开发牛人来实现它?(原文)
这个问题被誉为在quora上询问度仅次于“在哪能找到忍者”的问题,大家的答案也是各有偏好,请辩证吸收学习,希望大家能从中找出些国外人眼中非技术人士或者草根如何创业的一些看法痕迹。
Continue reading »
说说blekko

7月份的时候,申请到blekko的内测邀请,感受了下这个崭新的搜索引擎,当时就想写写,结果一拖再拖到了今天。。。今天早上看到读写网的编辑Marshall Kirkpatrick写的一篇文章:如何在工作中使用blekko,觉得还是结合这篇文章写写对blekko的感受吧。
先说说blekko的创始人Rich Skrenta,来头不小。1982年,在他15岁的时候,就写下了感染Apple II电脑的Elk Cloner病毒,这被认为是第一个大规模自我传播的个人电脑病毒,对此的介绍可查看这里。
blekko的发布历程:
07年6月,Rich Skrenta离开一手创办的Topix,与其他5名Topix核心团队成员创建了Blekko。开始为挑战google PageRank模式,与搜索巨头们竞争做准备(可以关注其blog)。
07年9月,Blekko获得来自Baseline Ventures、两名早期的google员工以及创业团队手的200万美元种子基金。
08年1月,科技博客techcrunch对blekko的报道,算是对这个初创公司第一篇公开的报道。
从08年到10年,blekko一直在封闭开发,网站的首页从一张Rich女儿的布娃娃画变成了一个出现了coming soon的字样的搜索框。虽然一直没有任何实质的消息,blekko却累计获得了2000多万美元的风险投资。
10年7月,blekko终于coming soon,开始邀请内测,测试引擎,获得反馈。
再到11月,blekko beta版最终上线了。
装

中国的8卦产业从来不缺少新闻,用一个字就是“装”,知道的装不知道,不懂的装懂,有点水平的装大师,没啥的装酷,背后啥事都有,人前装清纯。翻来覆去也就那几样了。
就在国内的导演作家为文娱产业苦苦思索的时候,怎料一句“做出了一个艰难的决定”横空出世,前后恩恩怨怨火爆登场,着实让挨踢这么个有道道的技术活也大众娱乐了一把。这是国产导演导不出来的大片,让人惊呼:其实,互联网公司才是中国最大的娱乐业。这个草莽了10多年的行业,这群敢想敢做、匪性十足的企业和家,如今给中国娱乐界注入了新的活力!
前有狮城娱乐,昨有西太唐博,如今我们的娱乐遍天下。为何挨踢成了如此娱乐的一大家?有人要去看看霍炬的文章,我就不说啥了。
本文仅平淡记述装与不装的一些点,至于connect the dots之后的联想大家尽情发挥吧。
谁在装?
开始厂家装清纯,
于是用户在装软件,
后来厂家互相装卫道士,
结果用户开始不装软件了,
大量既得/潜在既得利益这,既失/潜在既失利益者,呈义愤填膺状,装的要死要活,
再往后,开始装无辜。。。
网上有这么张图片,不评论。
杂

社交网络近几年一跃成为互联网上最活跃的舞台,微博客就是其中重要的一员,现在越来越火热,几天前,“万维网之父”蒂姆·伯纳斯·李也开始用起了 T-&w_&itter,很多w3c的成员也是。在中国,新浪的围脖也如火如荼:排名前三的李开复,黄健翔,姚晨,没人都有16万多的跟 随者,而且人数还在增加啊。16万个人在关注你的只言片语,这是多么大的传播效应和话语权。更不用说蕴含的商机了。别的不说,一个半月才发布了22行文字 的李宇春同学,从第6条开始每条都是上千的评论,从第8条,每条都是上千人次的转发。。。当然,这个一个“得永生”的传说分不开。。。一个小小的工具,一 下让所有人有了平等交流的几会,每个人都可以说,当然,不是有平等说的权利就会得到相当的关注,网络中的相当大的一部分还是草**6%根,只能聚众的力 量,而无法引导方向。。。
即时检索重要吗
最近社交网络的红火越来越映衬出即时搜索的需求,一时间炒作频起,关于实时搜索,成了IT的一个时髦名词。facebook开放部分数据,bing推出实时搜索,紧接着,google也在昨天有了social search(google之前的很多项目也都反映了实时性)。这不,yahoo也说我们早就在评估了,正在弄着呢。在前段时间的web2.0会上,有专业人士提出,“未来主宰网络的是Twitter、 Facebook、Apple 和 eBay,而不是 Google”。有人解读为了即时搜索,我觉得他们提供的大量无用信息在信息膨胀的时代,是一种对人的迫害。。。
Twitter、Facebook要想独当一面,首先就要解决去噪问题,如何识别并摒除垃圾信息。即时信息显然很重要,但是当前的即时发布平台大多数都是无聊的文字,我们看到某人关注了上百上千个人的信息发布,如果他的关注是真的关注,那他太痛苦了。这种感受大家都会有,要从大量无意义的事物中找到一个亮点,而且需要人工完成。这个问题如果能够很好的解决,不光是即时信息,IT的整个格局都会发生转变。可是,现在牵扯到智能的东西,研究和现实的差距还是很大的。
[zz]雅虎与微软达成搜索引擎合作协议

雅虎和微软从合并,到合作,终于熬出头,于今天签下合作协议。
跟我们之前预测的一样,微软将为雅虎提供搜索引擎,同时雅虎成为两家公司在全球广告业务的独家代理商。
合作的重点包括:
- 合作期长达10年
- 微软将购买10年的雅虎核心搜索技术授权,并将其与自家的搜索平台(就是Bing)整合在一起
- 微软的Bing搜索引擎将成为雅虎网站独家搜索算法和点击付费搜索独家平台
- 雅虎也可以继续使用自己的技术和数据,以使自家业务更好的显示广告
- 雅虎将成为两家公司在全球广告业务的独家代理商
- 两家公司的自助广告业务都将在微软的AdCenter平台进行,所有搜索广告的价格由AdCenter自动拍卖流程决定
- 两家公司都可保留各自独立的显示广告业务和销售队伍
- 即便雅虎使用了微软的搜索技术,但将依然改进搜索的用户体验和创新
- 在前5年,微软需要为雅虎网络旗下品牌网站和由雅虎运营的网站为其Bing搜索带来的流量支付88%的流量费用
- 微软要补偿部分雅虎网络旗下品牌网站和由雅虎运营的网站搜索带来的收入
- 微软保证合作的前18个月里,雅虎网络旗下品牌网站和由雅虎运营的网站按点击搜索的广告收入在各个国家都保持合作前的水平
好复杂的合作,不过希望雅虎和微软可以稍微的挑战一下Google一家独大的搜索市场。
Via TechCrunch
原文地址:http://google.org.cn/posts/microsoft-yahoo-search-deal.html
对SaaS的用户调查
SaaS 软件即服务,被炒作了有一段时间了,从技术曾上似乎不太容易提出什么新东西,基本上是里理念了一种体现,在开发中,大家的感觉也是还汤不换药,像是用个新名词忽悠下市场。觉得炒作的有点过了。。。国外也有些大公司做这个,好现技术上提出的东西也没有很多,但是做得效果增样,感觉应该比国内好吧。可这下看到这篇RWW的文章,似乎实际应用起来,国外也没有像吹呼的那么夸张了。不过,Gartner的分析还是证明了SaaS的发展还是有进步的,也是一种趋势,只是有些东西吹呼的过于猛烈反而更容易让用户产生落差。下面这个是直接Copy中文版的RWW了,遵循 创作共用 版权协议,署名-非商业。
"Page’s Law"—佩奇定律
Page’s Law:It says software gets twice as slow every 18 months.
佩奇定律:软件性能每18个月会变慢一倍。
摩尔定律认为每隔18个月,处理器性能将提升一倍;而Google创始人之一的Larry Page提出的佩奇定律认为,每隔18个月,软件的性能将会下降一半。 在Google I/O开发者会议上,另一位创始人Sergey Brin讲述了Google如何努力的抵御佩奇定律,他表示硬件性能提升抵消了软件性能下降的趋势,他开玩笑的说,“我们愿意打破佩奇定律,让我们的软件在同样的硬件上运行得越来越快。”Brin指出编程工具的进步,尤其是JavaScript上的性能改进,令更快的梦想成真。他称Google正在努力的提升Chrome浏览器和本地搜索工具的性能。
来源:1,2,3
其实,大家用电脑久了都会有类似的感受把,越来越慢,直至重装@@
豆瓣电台
链接表
近期评论
- hbn 发表在《骑车》
- zhaozz 发表在《走跑骑爬打,运动多样化》
- hbn 发表在《走跑骑爬打,运动多样化》
- 刘苏 发表在《hello, 2010》
- Bony 发表在《hello, 2010》

yandex是俄罗斯第一大搜索引擎,在俄罗斯拥有