2008-12-31

2008年的终结

2009的钟锤已经举起,2009年究竟会有什么意外,令人期待,也令人彷徨。尽管如此,在2008年里,大风起,尘飞扬,亲离悲,悔悠悠,爱涟涟,所发生的、所经历的,这一切都随钟声凝住,成为一片记忆,永远,永远。


面对现实,如果不再相信自己

(普希金)

面对现实,如果不再相信自己
不要消沉,不要发狂
惆怅的日子需要平静
请相信,快乐的日子要来临
明天的心依然跳跃
现在,这里阴沉
一瞬间,这些伤感都将过去
那过去的,也会变得亲切



【上面的这份中文译稿是自己翻译的,互联网可以查到很多译本,但我特别不喜欢将“If by life you were deceived”翻译为“假如生活欺骗了你”。生活丰富多姿,或可爱,或可恨,真实映衬自己的内心,它怎会欺骗人,相反,这“人欺人”、“人骗人”到发生了不少。既然译本的版本众多,索性自己也来了一份。我俄文不懂,也只能参照其中一份的英文译本,英文译本如下:

If by life you were deceived,

(Alesander Pushkin)

If by life you were deceived,
Don't be dismal, don't be wild!
In the day of grief, be mild .
Merry days will come, believe.
Heart is living in tomorrow;
Present is dejected here;
In a moment, passes sorrow;
That which passes will be dear.

2008-12-30

要求“不折腾”也是折腾

上面的有啥动静,下面的自然也要有些动静。上面要求“不折腾”,下面要响应再响应,还要激情感动,要这样:上下,嘿咻,上下,嘿咻,一直折腾下去,直到有一方玩不下去了。如果真的不折腾,就大道简出,自然无为,少要求,多做事,再放开一些大家都晓得要放手的东西。

2008-12-29

平静更可贵

批判错误并不会变得正确,而失去的将是安宁。

此句摘自王鸿飞的博文

2008-12-22

批评与表扬

“若批评不自由,则表扬无意义”

2008-12-21

温总理在北航讲的“首位”与拾荒者的“旱冰鞋”

这则新闻报道了一位拾荒者,令人敬佩,不去埋怨、顺从现状,而是努力地改变现状。
记者在路过南京市汉中门大街欧尚超市门口附近时,发现了一位与众不同的时髦拾荒者——穿溜冰鞋拾荒。这位小伙称自从有了这双旱冰鞋后,他不仅提高了“拾荒作业”的效率,而且劳动强度也没有以前那么累了。

记者在采访这位穿溜冰鞋拾荒者时,问到这个溜冰鞋是不是他自己所买,这位小伙对记者说这双旱冰鞋是他攒了很久的钱才买到的,因此也非常爱惜。小伙子告诉记者,自从有了这双旱冰鞋后,他不仅比以前提高了拾荒的效率,“以前都是跑一段路腿就疼了,需要休息一段时间,现在就好多了。”记者获悉,这位从山东来宁打工的小伙子,原先想在南京好好找份工作,自己也有些手工艺,可没想到,刚到南京,钱夹证件就遭偷了,他自己独立意识很强,又不想去救助站,因此干脆选择了一般人不会去做的“拾荒”

上面一则让人看到了年轻人的活力和弹性,然而另一则新闻则令人有些心寒:昨天温家宝在北航与大学生座谈,强调把大学生就业放在首位

同学们请放心,我们把大学生就业放在首位。我们会提出一系列措施,以让大家毕业有用武之地。

尊敬的总理,遇到经济寒流,无论是谁都会觉得冷,找抵御寒冷的方法。对于年轻人,何况是大学生,无论在什么情况下,他们的就业问题相对其他年龄段的人还是很有弹性的,就业好坏先另当别论。政府是否应将那些低收入家庭职工的失业问题摆在『首位』呢,这里面有很多人,他们有的是在前5年国企改革中下岗后来再就业的,他们的生活还没恢复,而现在又要面临失业的压力,他们有的人是离开农村来到城镇,一切生活刚刚开始,他们现在也要面临经济压力,如何在城镇里生活下去,但他们已不可能再回到农村。还有很到情况,无论如何,这些理应摆在『首位』的人们,他们有不少是大学生的直接养育者,对那些在读的大学生和毕业接着失业者的应届生,他们才是真正的经济后盾。关心他们就是关心大学生。

2008-12-19

太强了

(照片版权属于南方都市报)


槑话说到这份上,囧囧无语。下面对话摘自此处
记者:学校对学生的个人信息的管理上有什么样的规定吗?比如说能保障学生的个人信息不被泄露?

宣传部长:你这个,我跟你说啊,你现在别按照你的思路,你跟着我的思路走。我们马上要在网上公布消息,而且要占领天涯,占领你们所有得到信息的渠道,所以 你再不要挖这个事了,这是学校的一个集体行为。你一问我就理解你想做啥,你想说学校对学生的信息是否应该保密?

2008-12-11

五分与五毛

难道是汇率惹得祸?!

2008-12-10

Data and Science

Science needs data, but data is not science.

2008-12-08

20秒的记忆

下面文字摘自此处
今年12月2日,82岁的莫莱森由于呼吸衰竭,终于在康涅狄格州温莎·洛克斯市的疗养院中离开了人世。这些年来一直对莫莱森进行大脑研究的麻省理工学院神经学家苏珊·科金证实了莫莱森去世的消息。科金博士称,莫莱森的大脑将像爱因斯坦的大脑一样被保存下来,在未来继续用作科学研究。莫莱森的大脑是科学史上永远无法替代的研究物。

为了治疗莫莱森的癫痫,1953年,美国哈特福德医院著名前脑叶白质切除术专家威廉·比切尔·斯科维尔为当时27岁的莫莱森实施了一次实验性的大脑手术,他切除了莫莱森的大部分内侧颞叶,包括部分海马状突起和扁桃体颞。然而令人做梦也没想到的是,大脑手术确实减轻了莫莱森的癫痫症,却让他患上了另一种怪病——“深度健忘症”,莫莱森的大脑失去了对任何最新记忆的存储能力

当时,许多科学家仍然相信记忆存在于所有大脑细胞中,而不仅仅是储存在某个大脑区域或神经器官上。即使莫莱森手术后得了健忘症,许多医生仍然认为这是由癫痫症引发的,跟他的内侧颞叶被切除并无多大关系。直到1962年,科学家通过对莫莱森进行大量测试后才发现,人体的大脑中至少有两个系统用来储存新的记忆,一个被称做“陈述性记忆系统”,它专门记忆姓名、脸庞和新经验,并将它们储存在脑海中。这一记忆系统主要依赖于内侧颞叶区域的功能,尤其是“海马状突起”部分的功能

另一个记忆系统被称做“运动认知系统”,它是下意识的,主要依赖于大脑其他部分的功能,这一记忆系统可以解释为什么一个人多年没骑自行车后,仍然还会骑自行车;或他们多年没弹吉他后,仍然拿起吉他就能弹出曲调。

美国哥伦比亚大学神经学家埃里克·坎德尔博士说:“对莫莱森进行的大脑记忆研究,是现代神经学史上最重要的里程碑之一,它打开了研究人脑两个记忆系统的大门。”

2008-12-07

新手与高手

这里有一段Jevuxe1关于新手和高手的感言,很有启发:
您说的很对,但很多时候,很多人都没有选择最好的权利。。。。
比如选择画图软件,如果用户英语不过关,只能受制于整个社区的氛围,当然不光语言关,技术手册的本地化在思想和习惯上也更贴近普通用户。像现在绘图软件的中文教程,只有cvgmt愿意来写asymptote中文手册,那么可以想见,不久远的将来,很多新用户会投向asymptote。然后是cvgmt对推动asymptote在大陆生根发芽立下汗马功劳。再举个例子,就像TeX用户,从张教授的CCT,到吴博士的CTeX,引领风骚这么多年,现在还支配着许多TeX用户的习惯。

这就是新手群的一种倾向性的趋势。当然也是不成熟的表现,但这是人性。

高手(这里不是特指您)一般体会不到这种感受。高手通常都是什么都高的手,十八般武艺样样精通,外语,编程这些工具会很熟,随之会有更好的环境、更多的高手和他交流。很快马太效应开始显现:让知道得多的、知识丰富的掌握更多资源,更快的进步;而让知道得少的、知识贫乏的原地踏步。

马太效应“凡是有的,还要给他,使他富足;但凡没有的,连他所有的,也要把它夺去”。对于财富,富者越富,穷者越穷;就如上面Jevuxe1所说,对于知识,也是富者愈富,贫者愈贫。这“似乎”不公平,尤其这“夺去”也显得过于“野蛮”。

但这是『生产』内涵,效率所致。高手并非天生,也始于新手,使他们注定成为高手的是他们的『好奇』与『偏执』。高手最精彩是其经历而非其所知,新手所要的是得其所知,而非其经历。如何令新手看待自己?如何使新手成为高手,这才是问题,而非马太效应。

2008-12-06

Memory Wall

这里有篇文章谈到,CPU的多核结构对高性能计算来说未必有益。


这里遇到一个瓶颈问题是,CPU有多快,对访问数据的要求就有多快
the growing disparity between how fast a CPU can operate on data and how fast it can get the data it needs.

解决问题的方向就在于更为智能地集成内存和处理器。
The key to solving this bottleneck is tighter, and maybe smarter, integration of memory and processors,” says Peery.

大胆猜测,为什么非要是处理器主导整个系统,为什么内存不能成为主导呢?处理器变得轻量些,使得
“一块内存搭一个处理器”

很显然,这样一来,计算机组成结构、编译系统和操作系统都将要重新设计了。

“要赢”与“他输”

克林顿说:“不要忘记,当别人穷困时,我们必须付出代价,因为我们要帮助他们;当别人富裕时,我们则能有福同享。要赢,就要确保他人输的想法已不合乎时宜。”(摘自此处

2008-12-05

看来有关部门是被冤枉了

南方周刊有篇文章《罗永浩:我最被高估的是勇气》这样说:
第二天,罗永浩早早地到办公室守着电脑,心里一直发毛。结果一直到下午都没有有关部门要求删帖,到了临下班的时候,罗永浩忐忑不安地跟有关部门询问消息,答复是:没有听说过什么消息,你自己看着办吧。

...

“我们一直没顶什么压力,也没有人要求我们删除。”罗永浩发现这两次事件中都没有被有关部门要求删帖。

“让我们删帖我们从来没顶过,让删就删,但是这已经很罕见了,大部分网站会主动删除他们认为有‘风险’的文章。我身上最被高估的一个品德是勇气。我没那么勇敢,我只是稍稍正常一点,没那么窝囊而已。”他说。

想起了一件小寓言,但忘了听谁讲的:

一位老板,下了个计划,要一个小时内完成某个任务。一位经理接受了这个任务,害怕丢了位子,那就提前些吧,指定一位工段长在40分钟内完成。随后,工段长就要求一位组长在30分钟内,组长就向工友们宣称这任务要25分钟内完成,大家一听,疯了。没办法,一切饭碗要紧,最后紧紧张张,偷工减料地草草完成。很不幸,花了39分钟。

工段长将货交给经理,经理见了货,与期望的有些差距(毕竟39分钟做出的),就另外要人花了20分钟包装了几下,你还别说,这模样看起来还真不错。经理电话告诉老板:工作完成了。老板一看表59分钟,称赞到,“不愧是MBA,我暗想这要70分钟完成,在你的安排下,60分钟内就完成,这很好,很好”。另外,组长和工人可没这么幸运,工段长要维持“威严”,说好的30分,你们39分给我,这多没面子,这以后谁还听我的,这绝对不行,那位组长和那几位工人这月奖金要全扣。

后话说到这货的客户,收到此货后,再也没从这家继续下单。

你说,这里谁是最冤的?

外销与内销的区别

下图有内销香烟和外销香烟,为何它们包装不同,看出它们的差异了吗?

图片和下面文字均来自此处


特殊的香烟文化
在大多数国家,各个品牌各个档次之间的卷烟价格差别并不很大,美国人将其称为“最平等的商品”。但在中国,烟草的价格差别却如天壤,最便宜的每包售价不过一两元,最昂贵的每包数百元甚至上千。

买的不抽,抽的不买,是高价烟消费中公开的秘密——这是国人用来送礼或者公款消费的最常见的东西,有的品牌甚至曾经露骨地大做广告“××烟,厅局级的享受”。

烟草经济与政府财政

在中国,烟农每种植一亩烟叶,就必须要上交20%的农业税。加上烟草销售环节征收的计算复杂的各种形式的课税,卷烟的综合税率约在40%左右(为了控制烟草,西方国家通常实行60%—70%的高税率)。烟草工业每年为中央财政贡献的税收超过1000亿元,尽管近年占整体税收的比重有所下降,但依然占7%左右。为地方政府所作的贡献更大。烟草税收支撑了烟草第一大省云南财政的48.8%,第二大省湖南的28.9%。再细分到一些地市,烟草甚至成为绝对支撑,贡献了财政收入的六七成。

中国是世界上唯一一个实行烟草业100%国有专卖体制的国家。
按照实施准则(《烟草控制框架公约》),中国不仅应保证国有烟草公司的代表不能成为代表团的任何一部分成员,还必须保证不允许“受雇于烟草业或任何促进烟草业利益的实体的任何成员”参加代表团,或者参与制定烟草控制政策

但这和现行的烟草管理体系直接产生矛盾,中国的履约协调小组的牵头人是工信部,而烟草专卖局局长是工信部党组成员,工信部的职责之一是“拟定卷烟生产计划”。“让生产烟草的人来控烟,不是让左手打右手吗?”民间控烟机构新探健康发展研究中心常务副主任吴宜群说。这正是中国烟草控制的体制之惑。

2008-12-04

一个判例

此处报道:
法院支持证监会的解释,认定上市公司董事为《证券法》中的“其他直接责任人员”,强调了董事的勤勉尽责义务和违反义务所应承担的法律责任。

....

“本次法院的判决进一步肯定和明确了董事等信息披露责任人员的行政法律认定要求。董事在信息披露义务上必须符合勤勉义务和忠实义务的要求。事实上未勤勉履行职责的,或者不能有效证明自己在信息披露中勤勉尽责的,将承担行政法律责任。”刘俊海在前述座谈会上说。

2008-11-30

近代中国学习西方的原动力

推荐秦晖的《反法之儒:近代中国学习西方的原动力

因此,我觉得索绪尔提出的两个原则很重要的。他说这个话语本身是可以任意解释的,也就是所谓的“能指”和“所指”之间的关系遵循“任意原则”,但是这样的话,语言还有什么意义呢?索绪尔认为是有意义的,这个意义就在于不同话语的“能指”之间是有冲突的,也就是说话语的意义主要是根据能指与能指之间的“差异原则”(有的人叫做对立原则)来确定的。简单地说,任何一种学说,思想,它都是由一堆Goodwords,即好词来构成的,任何一种学说都说我要的是仁义道德,自由平等,公平正义等等,从来没有一种学说说我主张杀人放火、欺男霸女、尔虞我诈。但是,对于任何一种学说如果你仅仅看这个Goodwords你就不知道它是什么意思。你一定要看这个Goodwords是针对谁的

2008-11-26

马赛克

新华网快讯
经最高人民法院核准,袭警杀人案罪犯杨佳26日上午在上海被执行死刑。

(上图是直接从新华网复制过来的)


老虎庙透露
还有一个现象:案件处理的结果,其所有程序都似乎比公布的早了一拍,最典型的是,我们看到的死刑裁决书落款是21日,而在25日的今天才向杨母宣布,此间还叫杨母去了趟上海,见面了杨佳。但已经下达死刑裁决书的事却一字未提,令人疑惑。

刘晓原律师叙述
25日晚八时四十分,我与李劲松律师到了王静梅家。我们到达时,已经有几家媒体记者在王静梅家里。随后,艾未未等人也赶来了。

王静梅说,上海市高级人民法院两个法官,在晚上七时(11月25日)到了她家里,他们称受最高人民法院的委托,向她送到最高人民法院刑事裁定书。

我看了最高人民法院的刑事裁定书,作出的日期是11月21日。王静梅说,她在23日去上海,24日在提篮桥监狱会见杨佳时,最高法院就已经作出了核准死刑的裁定,为何不明确告诉自己这是见杨佳最后一面呢?

王静梅心情很不好,她说自己被欺骗糊弄了。

24日晚上,我见到王静梅后,获知有关部门主动送她去上海见杨佳,后又主动将她送回家中,已经感觉到案件快了结,但王静梅一直还蒙在鼓里。

2008-11-25

盲人摸象

每个人的所知总是有着各自的局限,仅依其所知而探索身边世界,这个过程就像盲人摸一头从来没见过的大象一样。我们和寓言中的盲人没有什么太大的分别,但寓言的深意在于:盲人们彼此互不相信而争执起来,固执自己的所知所感。因此,彼此多一点信任,相信对方感觉到的是真实的,思其所述的,或者到对方的位置亲自体验一下,分享彼此的经历。

2008-11-24

睡眠为记忆“腾出空间”

报道:无论是慢波睡眠还是快速眼动睡眠,都会改变大脑的生物化学组合,这样的改变是继续学习新东西的必需。睡眠在为获取新信息而清楚旧记忆方面的作用是显而易见的。“睡眠不仅建构事情,也清除它们”。

小路

世界上第一位获得诺贝尔物理学奖的伦琴有一句名言:“我喜欢离开人们常走的小路,而走荆棘丛生的山路。如果我迷失了,不要在大道上找我!”(摘自“考槃在涧”)

专业与直觉

报道
日本理化研究所的研究小组最新发现,将棋(又称日本象棋)专业棋手在下棋时可能凭直觉判断将棋布局。

他们让专业棋手观察棋盘1秒钟,然后用功能磁共振成像仪监测棋手破解棋局时的大脑活动情况。研究人员发现,这些棋手在判断棋局的时候,大脑中的基底神经节变得活跃。以往的研究显示,基底神经节会在人无意识的习惯动作时活跃。比如,一个人从家走到常去的车站,他走路时并没有有意识地去想行走的路线,却能在转弯的时候正确判断方向。

2008-11-22

拆迁/群体性上访!不明真相/别用用心?

陇南事件据新京报报道

甘肃陇南市政府新闻办公室昨日下午举行新闻发布会,介绍该市日前发生的群体性事件处置情况。陇南官方称,在此次事件中,共有110间房屋、22辆汽车被砸烧,74名武警、民警、记者受伤,刑事拘留30名不法分子。
...
11月17日、18日,酝酿中的陇南市行政中心搬迁问题引发了严重的扰乱社会秩序的群体性事件。中共陇南市委副书记、纪委书记李学春昨日在发布会上表示,群体性事件中,部分聚集人员向市委门口维持秩序的武警投掷砖块、石头、酒瓶,打伤武警69名,公安民警2名,新闻记者3名。其中,11名伤者住院。
...
中共陇南市委副书记、纪委书记李学春称,在事件的处置中,本着教育大多数、打击极少数的原则,维持秩序的公安民警和武警果断采取措施,共传唤询问违法人员110人,目前已刑事拘留30人(取保候审7人),经过谈话教育具结悔改的有80人。





除了官方新闻,还有些民间消息。下面的图片和文字摘自艾未未刘晓原的博客:

11月17日上午九点半,武都城区30多名拆迁户集体到陇南市委信访室上访,要求对陇南市行政中心搬迁后他们的住房、土地、今后的生活等问题如何安排做出答复,以致引来部分群众围观,致使市委大门一时拥堵。

按照陇南市新闻办公室说法,由于“被少数别有用心的人煽动”,有些群众开始冲击市委大院,“在此十分危急的情况下,为了防止事态进一步扩大和恶化,执法部门果断处置,使事态基本得到控制。”

据我(刘晓原)从媒体上所了解,陇南市所采取的“果断措施”,就是动用大批警力进行镇压,将人民内部矛盾上升为敌我矛盾,在冲突中造成大批警民受伤。













全息界

有一篇关于全息界(Holographic Bound)的科普文章中文译文
Namely, that the maximum possible entropy depends on the boundary area instead of the volume.

补充: 全息原理是说带有引力的系统可以用至少低一维的非引力系统完全描述,或者是说一个系统原则上可以由它的边界上的一些自由度完全描述。

2008-11-19

污泥已满身

满身已是污泥,才想洗去污泥的途径

2008-11-17

素数序列

这里看到这两段Haskell代码的讨论,其中递归定义的素数序列是相当的漂亮。

通过奇数序列求解的素数序列:
isprime n = not $ elem 0 $ map (\x -> mod n x) 
    $ takeWhile (\x -> x^2 <= n) (2:[3,5..])

primelist = [x | x <- 2:[3,5..], isprime x]
通过递归定义的素数序列:
isprime n = not $ elem 0 $ map (\x -> mod n x) 
    $ takeWhile(\x -> x^2 <= n) primelist

primelist = 2:[x | x <- [3,5..], isprime x]

2008-11-14

是发大财?还是养好人?

这则新闻介绍到:
汪洋说,现在大家都很关心广东经济遇到的困难,很多人都在发表议论,让人有天塌了的感觉。比如,有人说,今年以来广东有5万多家企业倒掉了!数据是否真实另当别论,但大家要认真分析一下,现在倒闭的是什么企业?有著名的大企业吗?没有!我判断,这些企业总体上讲,都是落后的生产能力。落后的生产能力被市场周期性波动所淘汰,是市场经济的规律在起作用。

对汪洋的考察,这里有更详细描绘:
汪洋十分关心重点工程项目的建设和推进情况,一到湛江,就前往总投资32亿元的重点项目湛江龙腾物流有限公司球团项目建设工地考察。

工地上,数十台大型机械设备正在平整土地,工人们紧张施工,通水、通电、通路,到处热火朝天。

“这样的场面说明了什么?”汪洋给随行的同志抛出了这个问题,引发大家的深思。

有个很简单的问题,我们是要发大财?还是要养好人?现在这当口人们不得不要面对这个问题,小企业利润低,但它养了不少人;而大企业利润虽高,但养的人少。

产业升级,不少人丢掉工作,这是免不了的,汪洋提到“政府要妥善安置失业工人”。人们却很是担心,毕竟这些年来的国企改革,“妥善安置”下岗工人的成功案例并不多,“妥善安置”已听的太多太多。

最蠢的就是试图解释不存在的现象

(无内容)

2008-11-10

省直管县:“中央─省─市县”三级体制

有两篇报道(这里这里),讨论了去掉市一级行政体系,由省直接管理县的模式,即“中央─省─市县”三级体制:

省直管县已经成为政治课题。全国各省区都已经进入改革试点状态。省直管县,最关键的是要赋予县财政权(浙江模式)和行政权(也即人事权,海南模式)。能够彻底进行财政和行政两条腿改革的,典型者当属湖北省的仙桃、潜江和天门三个省直管市。他们已经为此急行了14年。

我国目前实行的是五级行政体制【现划分为:中央、省、市、县、乡镇五级财政】,是行政层级最多的国家。行政层级过多,不仅导致行政成本上升,更妨碍了政府层级间沟通的速度和公共管理的绩效。

目前世界上绝大部分国家实行的是二级或三级行政管理体制,实行四级制及以上的国家不到20%。比如,美国国土面积与我国相近,实行“州—市”二级与“州—县—镇”三级共存制;印度人口众多,仍然实行“邦—县—区”三级制;日本则为“都、道、府、县—市、盯、村”二级制。

2008-11-09

决策的悟性、理性和赌性

只要不是那些封闭的、机械的系统,任何开放系统处处都有不确定的东西,相对个体的意愿的实现与否来说,任何个体决策都变得像一次赌博。

决策要依赖于知识和信息,选择何种知识,选择何种信息,这种『选择』的能力是需要『悟性』,所选择的知识可以看作是一个函数,而所选择的信息就是向知识这一函数所输入的参数,得到一个函数,知识(信息)。选择的结果不总是一个,为了决策可以丰实,希望越多越好,而且它们可以复合为一个整体,有一个具体的形状,这种『复合』的能力就是『理性』。理性的结果是获得了一个形体,尽管在意识中它已存在,但相信它,这是一个心理问题。决策只有作用于周边的环境,这才是一个完整的决策,个体对决策的相信及执行的能力是需要『赌性』。

搜索关键词的多样性

这里有一组数据 ,可以反映搜索关键的多样性,据调研者Bill Tancer的宣称,其数据来自2008年九月以前三个月发生在美国本地的搜索记录,而且这些数据已过滤掉了“成人类”关键词:
  • 使用频度排名前100项占了搜索整个流量的5.7%
  • 使用频度排名前500项占了搜索整个流量的8.9%
  • 使用频度排名前1,000项占了搜索整个流量的10.6%
  • 使用频度排名前10,000项占了搜索整个流量的18.5%

2008-11-07

中国的谷歌/Goolge的谷歌

这里有篇评论,讲述了中国谷歌近三年来走过的风风雨雨,深有启发。一来推荐给大家阅读,二来我也忍不住要发泄几点看法。(下面所摘文字均来自此文

中国谷歌与Google不同,尽管这区分很难说得是一是二的,但有一点中国谷歌是诞生在有特色国情中国这片土地上。
过去三年里,外界对谷歌中国保持着极高的关注度,不过多数时候仅将目光集中于最表层的矛盾冲突——李开复的去留,谷歌拼音的侵权问题,或与百度的简单比较——它们并无法准确呈现出一家国际网络巨头在后发进入中国互联网业这样一个充分竞争的市场后,究竟会遇到怎样的挑战,哪些策略、方法和手段能避免最糟糕到情况到来。
...
2005年在李开复的官司未有定论时,谷歌曾做了最坏准备:如果官司输掉,就只在中国设一个比较小的办公室。而在2006年初,谷歌中国因牌照问题而可能被迫关掉Google.cn时,谷歌创始人之一谢尔盖·布林曾对李开复表示:如果在中国无法经营,至少会保障已经雇佣的员工的工作。
...
比起搜索技术,品牌的打造与推广或许是谷歌全球上下最不熟悉的领域。即使在美国,谷歌也以不打广告著称,与此恰成对比的是,它从不吝惜于投资在渠道推广上,如用9亿美元重金将搜索框嵌入MySpace。在中国,谷歌的市场团队也已经更换了两拨人马。

但这是谷歌中国必须尽快做出改观的木桶短板。一道简单的算术是,如果说目前百度和谷歌的市场份额之比是65:25,那么口口相传的效应便以平方关系扩展为4225:625——你可以将此理解为, 每10个人因为他人推荐使用搜索引擎,大约有9个会被推荐使用百度
...
据艾瑞咨询的统计,2005年年中,李开复转投谷歌、周鸿祎去职之前,百度、谷歌和雅虎在中国还有着三分天下的均势,三家的市场份额为37 : 23 : 21。而雅虎的自堕,及周鸿补上的一击,让雅虎的市场份额到2006年底,已经直落到5%左右。
...
理论上,谷歌是有机会的。但李开复与微软纠结半年的官司,的确让谷歌一时间无暇它顾。当然,现实中,即使没有这场官司,谷歌中国能在2005年下半年到2006年上半年期间能做的事情终归有限:中国团队远未建立,一切本土化功课也未开始……

这让一场本应颇费一番角逐的市场份额之争,平静得未被外界注意就结束了。结果是,百度未费吹灰之力接下了雅虎丧失的全部用户。也就是说,百度和谷歌的市场份额在极短时间内变成了53: 23。


特殊的中国国情,不当规则,无面对错误自信的氛围,在这片哺育其子民的大地上,『互害』已成为其子民获得成功的窍门。
005年9月,谷歌中国首席战略官郭去疾在查阅流量数据时赫然发现,过去5个月中,谷歌在中国的搜索量居然下降了18%—— 谷歌已经严重受到了IP屏蔽的影响:当一个用户搜索一个禁忌词汇,他的IP地址会在几分钟内无法使用谷歌,如果一些人共享一个IP,很多人就短暂的同时丧失了使用谷歌搜索的能力。谷歌的统计发现,任一时间上,居然有5%到20%的搜索用户被屏蔽。

...

这是谷歌在中国遇到的一道两难问题:解决这个问题,需要依靠Google.cn自动过滤一部分不符合中国法律的关键词,但启用Google.cn这一域名,不仅需要对谷歌在全球不过滤关键词的准则进行调整,还需申请中国政府下发的ICP牌照。

谷歌内部并非没有不解:为什么一定要为了进入某个市场而过滤搜索结果?但李开复坚持进入一个国家就要遵守该国法律的说法,让此事逐渐可以接受。另一方面,虽然多少有些曲折,但从这时起,谷歌中国已经逐渐形成了自己的性格

为尽快解决身份的合法化问题,权宜之计,是借用谷歌员工投资的赶集网牌照。据当事者回忆,最初,谷歌希望收购赶集网,此一方案未能通过后,便迅速转为合资。虽然这个过程本身很难说有何错误,但至今回忆起来,这种过于紧张的结果导向的推进,让谷歌丧失了对更多可能性的思考和探索,本身足以证明谷歌在中国的有欠从容。

谷歌在中国申请牌照的确并不容易。一方面,它必须符合中国政策、法律的要求,另一方面,它必须满足谷歌在全球范围“不做恶”的种种原则。 这就让它起草每一份相关文件,都必须先给总部各个相关部门审阅,然后再交到中国相关监管部门,绝大多数情况下需要进行修改,然后再循环一遍“总部—中国监管部门 ”的过程。

“我们最终能够获得牌照,是因为竞争对手实在找不到我们的问题去举报了”,2007年下半年,一名谷歌高层曾对《环球企业家》如此解释。


对于一个“互害”和“厚黑”的环境,示弱,一点点改变环境,这是唯一的法门。
某种程度上,这也是因为谷歌中国示人以“弱”。到2006年下半年,私下里,许多网络业重量级人物陆续开始表达对于李开复及其团队的失望感,即使他们也不能理解,为什么李开复的团队表现得如此之缺乏冲劲,缺乏作为。这甚至导致了连百度都开始将目光转向一个短期更需要关注的对手:阿里巴巴。

但在谷歌中国内部,战略是非常清晰的。“当百度获得了雅虎的所有份额之后我们就知道,跟百度竞争的唯一选择只有一个字:耗,因为扭转这样的市场差距是没有银枪弹的,只有耗到对手出错。”郭去疾说。

让李开复们有此“保守”决定的原因很简单,他们很早就看到,谷歌中国并不可能被百度彻底消灭:作为网络时代最成功的公司,谷歌正处于其全盛时期,有着足够的资源支持一场区域战争。

但事实证明,这一传统智慧意义重大:短期看来,改善搜索引擎是最平淡,最不能带给市场惊喜的,但长期来看,它是一切竞争的根本,是谷歌中国和总部都最容易衡量成果,也是李最不需要重新发明轮子的功课。

另一方面,也是因为谷歌中国坚持于自己的防守位置,它能够较为专注的解决每个阶段的主要矛盾。它曾有断网问题,但随着Google.cn上线而解决;它曾被对手讥笑为不懂得中文的分词,但它备受争议的推荐搜索和输入法终于证明了这方面的实力;它曾陷入抄袭同行的风波,但但一年后的春运地图,证明了它能够在本土化基础上创新;它也曾被视为抓取新网页速度慢于竞争对手,但随着整合搜索的上线,这种批评偃旗息鼓;它曾被指为名字不好发音、不好拼,它就找到了g.cn;它也被业界称为不重视低端客户,但它极为低调的收购了265.com并进军网吧……

超过三名熟悉百度内部的人士对本刊表示,到了2008年底,百度内部已经明显感觉到了来自谷歌技术的压力。由于基础的技术架构比不上谷歌,百度之前采取了“人工”形式来调整搜索结果。比如,产品经理发现某个搜索关键词结果不如人意,便会将报告提交技术人员解决,相当于打“补丁”。然而,随着互联网上网页的量级增加,这种工作的压力就越来越大。

特殊的中国国情,需要一些技术手段,来避免冒犯缺乏自信、且神经已经相当脆弱的政府。这也注定影响对产品开发的激励和选择。
对于谷歌来说,虽然总部对李开复的授权算得上充分,但谷歌有另外的阻力:它比其他公司更在意道德姿态上的完善,而且,它在网络业独一无二的成功,也让它极度自信于自己的方法论——比如在品牌营销方面,谷歌的缺乏重视,在美国并不算太大的错,但在市场份额落后的中国,就成了无法回避的短板。

...

那么,它更像一个需要让各个利益主题满意的一个中间机构:它必须遵循中国的法律,这需要极多的跨越中美文化的详细讲解;它必须遵守谷歌的原则,有雅虎将其用户的邮件内容交给中国政府的历史在前,谷歌中国注定了不可能在中国推广任何和个人账户有关的产品,无论Gmail还是社区产品,这就极大缩小它可尝试的空间;事实上,谷歌中国还必须找到对中国团队合适的激励机制,毕竟,如果想在中国开发出Gmail、Google Earth这样的令全世界惊艳的产品。

无论如何,对于互联网,中国依然还是初级市场,人们还无法方便、自由的使用互联网。因此,认识『网吧』这一传统渠道,挖掘其价值,这应值得思考。
早在谷歌入华之初,很多员工曾到网吧中进行考察,但发现那里的年轻人都在用电脑听歌、打游戏,便判断这与谷歌的核心业务并无太大关系,直至他们觉察到:网吧其实是很多青少年接触互联网的第一站。在2006年4月,谷歌的中文名发布时,谷歌中国曾安排总部的一群高管造访网吧,但这群不熟悉中国文化的人们仍然难以理解这种中国互联网的特殊形态。因此,要说服他们同意此项合作,需要有强有力的实验和数据。

...

比如,在网吧这种流动性很大的地方,怎么能确定用户对谷歌有印象?一旦谷歌停止这个合作,是不是效果又都不见了?有没有长期的持续的效果?

这是数字可以解决的。汪华的团队在网吧里设置的数据统计,谷歌产品的使用率越来越高,这证明了合作对用户的正向影响。另外在很多区域,比如学校附近的区域,用户的流动性并没有想象中的那么大,在和网吧的合作中设置某个产品,它在这个地区的其他非网吧渠道的流量也会上升

当谷歌中国团队通过合作把网吧首页设成谷歌,总部便有人质疑:这会不会影响用户的自主选择权? 在这个问题上,汪华他们的团队解释说:网吧电脑并非用户所有,它从某种意义上说是网吧主租赁给用户的,所以用户本身不能给网吧电脑所装的软件进行更改或者设置,这和个人电脑的情况是不一样的。


易复制是软件的天性,盗版屡禁不止也是这个原因,我们厌恶这种行为,还是重新看待它,把『盗版』看作人的一种正常行为。软件既然可以、或理应自由地复制,那么对于软件的渠道价值,就不容忽视它。也许是时候了,我们应该反思传统软件的『渠道』价值了。
相比进入网吧这种直截了当的扩张方式,谷歌在中国展开的另一种合作并不会迅速拉动其搜索量,但却很可能在更长时间里提升其品牌认知率。

那就是与其他品牌产品的深化合作,像谷歌与金山共同将谷歌金山词霸免费一样。换句话说,如果谷歌不愿安静等待自己的产品团队打造出明星产品,它还有一个选择,就是利用找到拿些在中国市场上已经拥有一定品牌、但商业模式收到侵害的网络应用,以此丰满自己的产品线。

但随着谈判逐渐深入,郭去疾看到自相矛盾的两点。一方面,数据显示,谷歌中国的翻译功能,流量相当惊人,这意味着,中国人的好学心理让这样一款产品有很强的需求。但另一方面,大多数中国消费者并未养成购买正版软件的习惯,像金山词霸这种在中国市场占有率极高的产品,多数时候是以盗版方式流传的。

这最终指向了一个想法:谷歌的广告模式效率不俗,它应该可以在长期实现金山词霸的赢利。那么,金山词霸与其和盗版进行艰苦的抗争,不如自己将它免费,换取更大的市场占有率。

乍看来, 谷歌金山词霸和音乐搜索都不是争夺市场份额的利器,但它们打开了将正版产品免费化的一条新路径。这无疑是谷歌作为一家全球顶级创新公司最应该对中国产生的 影响。


墨子强调兼爱和非攻,这是否可以发展一种对『竞争』的新认识呢?!具体说,我们是该去『强夺』属于他人的财富?还是去『开拓』新的天地,积累属于自己的财富?
“如果一家公司国际化的全部使命就是争夺市场份额,那它必定会走上穷途末路。它需要提供一些新的火种,或者告诉大家如何把鸡蛋立在桌子上”,郭去疾说,“而且,我一直比较相信,当你有尊严的跟对手竞争,你最终会得到一个有尊严的对手,反之亦然。因为,当你的对手觉得可以一直向你学点什么的时候,它或许也就没有那么急切的消灭你了”。

The DiVincenzo Code

here

2008-11-06

选择的自由:放松选择、基因备份

放松选择(relaxed selection),这是一种与“自然选择”不同的进化方式。下面文字所摘抄的内容,其原文的中文翻译可在这里(科学松鼠会)获得,英文原文可在这里(科学松鼠会)这里(NewScientist)获得,(Christine Kenneally, 2008. Freedom from selection lets genes get creative)。


解答孟加拉雀之谜为解决生物学中更一般的问题带来了曙光,这个问题是:自然是怎么创造复杂事物的?我们倾向于认为进化是一场野蛮的竞赛,而行为的复杂性是这场竞争中被锤炼出来的辉煌战略。在跑道上,奔跑者努力超过可怕的气候、凶猛的病毒和饥饿的捕食者。在一切的幕后,DNA不断的复制并匆忙地变形,沿着突变DNA所开辟的道路,某些个体获得了异乎寻常的能力,这使得它们在这场奔跑中取得了竞争优势。可是,如果生物并不以这种方式进化呢?如果大自然最复杂的创造并不是如此辛苦的点滴积累,而更多的来自于一场随意的异想天开呢?

在Terry Deacon看来,与其说复杂性是适应环境的结果,不如说它更多的源于懒惰和幸运。Deacon是生物人类学和语言学方面的知名学者,他目前在加州伯克利大学工作。他对自然选择很感兴趣,但他不关心自然选择能够做什么,反而很好奇一个不经历自然选择的物种会发生什么。他相信,自然选择的缺席以一种重要但不为人知的方式推动着进化过程。事实上,他声称当选择的压力消除时,基因组开始漫无边际的散步,而一组无法预知、引人入胜且相互作用的效应开始展现。他相信这些效应不仅仅包括孟加拉雀的歌声,还包括我们人类的某些特别的身体和精神方面的属性,如我们的技术才华和语言天赋。如果这是真的,那么咱们也许得换个角度看待人类了:从适应环境的角度来看,与其说咱们是进化的顶峰,Deacon认为咱们更像退化的猿猴。

实验由英国爱丁堡大学的Graham Ritchie和Simon Kirby完成。他们用软件模拟了一个种群,种群中每个个体的生存依赖于它们能够识别其他个体的鸣唱,结果种群发展出了简单不变的歌声。在另一个代表驯养环境的实验中,实验者放松了对于歌声的选择压力,允许每个个体自由选择伴侣而不考虑它们的歌声。结果,这些个体(或者说“实验对象”)发展出了更加复杂和多变的歌声,不同代的歌曲之间又有许多创新和变化。

然而,放松选择最迷人的形式发生在一种生物主动的抵御自然选择时。例如,在石器和烹饪方面的技术创新使得我们的祖先无须再咀嚼难咬的蔬菜和肉食,这改变重构了我们的外貌。接着,农业让食物变得更可口,这降低了自然选择对我们的消化系统提出的要求。随着消化变得更容易,更多的能量可以被用于别的目的,特别是建立和运作一个更大的大脑。我们的祖先一次又一次的使用增强了的认知能力发明出越来越多的技术和文化方面的创新,这些创新又进一步帮助他们抵御了自然选择的压力。

当自然选择退居幕后,一个或一组基因不再被要求完成它们原本的特殊工作了。这种事情的发生,常常是因为一个基因在繁衍的过程中被偶然地备份了(gene duplication)。也许这种备份不能让个体变得更适应环境,但只要备份不影响个体的生存,它们就会被一代代的传下去。以后的某一天,备份部分可能发生变化,也许还有了新功能,如果进化同时又变得严酷,这些新的功能也许能对物种取得进化上的胜利起到积极作用。

自然辩证法,疯人之作

在最近一期新语丝(XYS20081105)上看到一段文字,有关《自然辩证法》,摘抄留念:

“爱德华·伯恩斯坦先生(注:出版商)把恩格斯的一部关于自然科学内容的手稿交给我,托付我发表意见,看这部手稿是否应该付印。我的意见如下:要是这部手稿出自一位并非作为一个历史人物而引人注意的作者,那么我就不会建议把它付印,因为不论从当代物理学的观点来看,还是从物理学史方面来说,这部手稿的内容完全就是胡说八道、疯人之作。可是,我可以这样设想:如果考虑到这部著作对于阐明恩格斯的思想的意义是一个有趣的文献,那是可以勉强出版的。”(笔者注: 此段文字也可在《爱因斯坦文集》第一卷 (商务印书馆出版),1977年,第202页中找到)

【2008年11月7日,补充『新语丝(XYS20081106)』“飞蠓”和“lgvu
”的质疑,引用同一段文字出现了不同内容】

爱德华·伯恩斯坦先生把恩格斯的一部关于自然科学内容的手稿交给我,托付我发表意见,看这部手稿是否应该付印。我的意见如下:要是这部手稿出自一位并非作为一个历史人物而引人注意的作者,那么我就不会建议把它付印,因为不论从当代物理学的观点来看,还是从物理学史方面来说,这部手稿的内容都没有特殊的趣味。可是,我可以这样设想:如果考虑到这部著作对于阐明恩格斯的思想的意义是一个有趣的文献,那是可以出版的。(1977年《爱因斯坦文集》第一卷 (商务印书馆出版)第202页)

 这是爱因斯坦于1924年6月30日写给E.伯恩施坦的意见。这里译自梁赞诺夫为1925年版《自然辩证法》所写的序言中所用的引文,见德文版《马克思恩格斯文库》(Marx-Engels Archiv),第2卷,法兰克福,1927年,141页。译时参考了俄文版《马克思恩格斯文库》,第2卷,莫斯科-列宁格勒,1925年,XXVI页。标题是我们加的。
  按:伯恩施坦于恩格斯逝世(1895年)后,长期隐藏着《自然辩证法》手稿,制造各种借口,不让出版。1924年春天,联共(布)中央派梁赞诺夫到德国向伯恩施坦追查恩格斯的这部遗稿,伯恩施坦为了推脱罪责,就把这部手稿送交爱因斯坦,要他发表意见。爱因斯坦囿于资产阶级的偏见,根本不理解《自然辩证法》
这部辉煌文献的深刻内容和伟大意义,结果作出了完全错误的评论。梁赞诺夫在他写的这篇序言中推测,当时伯恩施坦并没有把恩格斯的全部《自然辩证法》手稿送给爱因斯坦,而只送去一束主要关于电和磁的那部分手稿。美国反共哲学家西德尼·胡克(Sidney Hook)在他的一本专门攻击马克思主义的著作《理性、社会神话和民主》(Reason, Social Myths and Democracy)中说,伯恩施坦与1929年在柏林告诉过他:爱因斯坦当时是看到了《自然辩证法》全部手稿的。在这本书中,胡克还引了爱因斯坦于 1940年6月17日给他的这样一封信:
  “爱德华·伯恩施坦送来全部手稿要我出主意,我的评语是对全部手稿而说的。我坚信,要是恩格斯本人能够看到,在这样长久的时间之后,他的这个谨慎的尝试竟被认为具有如此巨大的重要性,他会觉得好笑。”(见胡克《理性、社会神话和民主》,纽约,人文学出版社,1940年,226页。)对恩格斯的《自然辩证法》手稿的任何污蔑,当然无损于《自然辩证法》所揭示的真理的光芒,同时也丝毫抹煞不了这部伟大的著作对现代自然科学发展的伟大指导意义;真正“可笑的 ”,恰恰是爱因斯坦的无知和他的顽固的资产阶级偏见,是反共小丑胡克之流的卑劣的用心!---编译者

2008-11-05

博客令企业内部关系变得清晰

这有则评论,及时发布“坏消息”,不再含糊其辞,这已成为企业责任:
美国《纽约时报》今天发表分析文章称,在过去经济处于低迷时,被公司解雇在很大程度上属于一件私事。大公司趋向于发出含糊其辞的新闻稿,上面满是有关“缩小规模”的行话,创业公司则往往向员工下发解雇通知书,同时又不向外界作任何表态。在越发讲究“透明”的 时代,这种做法已经一去不复返,炒鱿鱼的消息开始登上公司博客。

...

有关裁员消息的博客在硅谷尤为流行。在这个新闻制造工厂,科技八卦网站猛扑向每一个传闻,精通网络的员工则在自己的博客或者Twitter上传播他们的每一个想法。在这种背景下,很多公司被迫在自家博客上公布坏消息,以便更好地进行控制。人力资源和公共关系专家认为,所有规模、所有行业的公司被迫在博客上公布令人痛苦的消息只是一个时间问题。

...

与更多传统公司有所不同的是,现在的很多网络公司都背负着对用户“透明”的使命。管理层通常会在博客上大写特写公司的成功事迹。在不景气即将到 来的背景下,他们中的一些人觉得也应该将坏消息对外公布。相对于满纸引用语的新闻稿来说,博客更能让人产生一种实实在在的感觉。

UOML与话语权毫无关系

不彻底了解UOML,就有限的了解,我对UOML的定位感到很困惑(可参看其章程)。看到这一则新闻,立即由『困惑』转为『痛苦』:

长久以来被微软等跨国公司所垄断的文档信息产业,即将被中国人自己制定的软件标准所打破。昨日,中国电子工业标准化技术协会(下称“中电标协”)宣布,由电子文档读写接口标准UOML已经被结构化信息标准促进组织OASIS批准为国际标准,成为中国软件行业第一个国际标准。

“OASIS批准为国际标准”,不清楚中国电子工业标准化技术协会的负责人是如何得出这个结论的。没有细读,是草略地看了其离完善还很远的标准文稿。心中疑问,中电标协的负责人和倪光南院士们在表态前,他们是否看过文稿。

这种带着“要出口气”的怨气来搞技术,搞研发。这种稍微地小走了一小步,外界就大说成跨了一大步。这样走下去,出路渺茫茫啊。

2008-11-02

为什么情感不再有

“格致”最近的一篇博文问道,“为什么中国大陆很难产生任何领域的明星”,他谈到“看过的几百个学生里面,能找到快乐的寥寥无几。大部分都是循规蹈矩,照本宣科,放在注重发声方法上的努力远远超过放在表达感情上的”。


“不要再感情用事”,让后生的『理性』去征服,去消灭那天生的『幼稚』和『天真』,共造『大同』的世界。『大同』世界里的人们,『理性』的颜料涂装全身,除了还能区分是个『人』,彼此毫无异别。生命的价值也变得简单,仅有『活着』与『死去』这两个状态。

立法者的困境

推荐任志强的一篇博文,《立法者的困境》,相当精彩,摘录部分:
  • 首先是宪法,但没有宪法法庭,因此没有纠正违反宪法的机构与程序...用什么手段去维护宪法呢?
  • 其次是全国人大或人大常委会审批的以国家名义发布的法律,但这些法律几乎都有个法律的实施细则...细则已变了味道,也只能按细则执行而不是按法律执行。
  • 没有实施细则的法律都留了许多解释的口子,用解释来代替细则
  • 后续的是法规或规意,有国家级与地方级之分,也都同样有着细则与解释
  • 最令人不解和迷惑的则是解释着常常不是立法者,而是监管与执行者

  • 如果一个中央政府下的政策,多个管理部门之间的意见都不统一,又如何让市场中本就混乱的认识统一呢?
  • 如果一个立法会有多种的解释,又如何指导或引导市场向一个方向转化呢?

  • 立法者不能于立法时取消细则与解释本就是一种悲哀,立法者不能去制定细则与解释更是一种悲哀,

  • 社会在世界经济危机的影响下要的是可实现的新政,而非一个争论来、解释去的新政,这大约正是立法的一种困境。

2008-11-01

沉默的接受

在网上看到一句话:

思想是扭曲的,
内容是空洞的,
形式是奢华的,
立场是反动的,
思路是混乱的,
创意是疯狂的。

对那些沉默的,所接受的,这句描述倒是很贴切。

2008-10-30

信息本无价,只不过发生了一些费用

武夷山老师介绍了一篇论文,该论文谈及了几条的信息悖论。我仅看武老师翻译的部分,还未抽时间看原文,笼统想来,这几条悖论都可归于“信息到底有无价”这个基本命题上,这一命题变化,其它命题的讨论也都会有所影响。

我的观点:信息自身是没有任何价值的。在日常生活中,我们会“感”到信息有一定价值,这是因为,我们总是『期望』,或感到存在一种机会,获得那些又及时又正确信息的机会。我们相信凭借这些所『期望』的信息,决策的『可靠性』会得到提高。然而,现实中,获得这些所期望的信息,我们会观察到,这个过程的确很费劲,耗费了一些时间和东西,这些耗费主要发生在对信息的『选择』和『传递』过程上。除了那些因为支付不起所发生的费用而放弃获得信息的情况,那些想得而得不到的信息,只是期望,这类信息实体不存在,就如当期彩票的票号。

总之,我们在使用信息上存在『选择费用』和『传递费用』(信息产生费用是否存在,这就是另外一个极有意思的话题,或另作博文讨论)。降低这些费用,这自然也就成为组织改革和信息技术发展的动机之一。需要再说明一点,降低『选择费用』一个有效途径就是更为丰富提供『信息』的『背景信息』,换句话说,产生信息的组织要更公开、更透明,提供更多的背景信息,信息检索技术要能够提供更为丰富背景信息。

我想最近就有一个很典型的案例:政府最近针对一些谣言,所发布了『辟谣』的信息,然而这些信息没有起到作用,为什么?!『信息』的『背景信息』与群众『选择信息』费用之间的关系,这应是个原因。

2008-10-27

一个梦想:内容可以自由地移动

Mark Shuttleworth最近谈及可用性时候强调,用户理应关注的是内容(working with your content),活动的重点不是那些用来打开内容的各种应用程序:
We need a consistent experience across GNOME, KDE, OpenOffice and Firefox so that content can flow from app to app in a seamless fashion and the user’s expectations can be met no matter which app or environment they happen to use.(大意:应该让用户拥有一种连贯的体验,内容可以无缝的从一个应用流到另一个应用,用户的体验与何种环境何种应用无关)

内容在应用程序间可以自由的移动,可以方便的整合和分拆,这便是『内容的移动性』。这些要求,如果说是某个系统的建构目标,不如说是整个产业的挑战。问题复杂性超出想象,如果你熟悉剪贴板的『复制/粘贴』,如果你熟悉TeX系统的Tex Weave和Tangle,如果你熟悉Windows系统的OLE(如在Word里嵌入电子表格),那么你可以回想一下它们带了的方便和烦扰,如果你是软件设计师,可以回忆一下它们的实现机制。或许此时,你会感到它的复杂。

内容移动性,这一问题的解决方案,似乎超出目前的技术水平,这不是软件架构的接口问题能够根本解决的,更不是单纯开发工作量投入不足问题。在理论上,问题可归为两个:
  1. 内容的实体变化多样,如何标识内容存在和其实体存在;
  2. 内容常脱离实体(即所谓的灵魂出窍),这便涉及了内容状态与实体状态保持及一致性问题。

函式程序之美

偶然从这里看到一段Haskell程序,用来求解由任意两个三位数乘积组成的最大回文数(palindrome),摘录如下(该程序版权属原作者)。这段程序是相当的简洁、美丽绝伦。

euler4 = 
   maximum [a*b | a<-range, b<-range, palindrome (a*b)]

range :: [Int]
range = [100..999] -- three digits

palindrome :: Int -> Bool
palindrome n = 
    digits == (reverse digits)
       where digits = show n

2008-10-26

金融危机与风险管理系统(续)

在上一篇博文《金融危机与风险管理系统》 提到“我们总是制造、选择那些乐意看到的。想得到什么,就输入什么。结果却成了,输入的是垃圾,输出的是垃圾。”

今天看到一则新闻:美联储前主席艾伦·格林斯潘(Alan Greenspan)在美国众议院政府改革与监督委员会举行的听证会上作证时表示,数据不充分是这次金融危机爆发的原因之一:
格林斯潘在今天的听证会上表示,向计算机系统输入的数据都是垃圾。
...
格林斯潘说,金融服务机构的决定基于数学家和金融专家的缜密分析,并得到了计算机和通讯技术的支持。但是,整座金碧辉煌的金融大厦去年夏季坍塌了,原因是输入风险管理系统的数据都是过去二十年的数据。众所周知,过去二十年金融服务业务一直在高速发展,从没有遭遇大的危机。
...
格林斯潘还说,如果风险管理系统包含了过去金融危机期间的数据,信贷机构对借款人抵押财产的要求就会高得多,整个金融服务行业也不致于像目前这样惨不忍睹。


这则新闻
同时还引述美国证监会主席克里斯托弗·考克斯(Christopher Cox)的作证词:
考克斯表示,信用评级机构给予了一些抵押债券“AAA”评级,而这些债券本不应该得到这样的评级。

考克斯在一份书面证词中写道,这些评级不仅仅误导了投资者,也误导了计算机风险评估模式。

在决策上,我们为了得到可靠的结果,需要使用数据分析的工具增加可信度,然而,在很多场合下,为了某种企图,或为了维持某些关系,这些工具成了祭祀神坛的法器,不是去说服,而是去『震慑』人们,推销神秘变化莫测的未来,美好的前景,但过程有风险,令人们害怕、令人们再无法确定那些已经理解的,让人们去猜疑那些已经知道。谁标榜能控制这过程上的风险,人们就会臣服谁。

不是有一句笑话吗:
数据,只要你肆意地拷打,它就会招认你所愿意听到的


分析工具不当使用,就会成为凶器。打个比方,一个法制社会,程序正当性,它远比鉴定技术的先进性要重要的多。然而对于数据分析,我们错了,我更关注是它的结果,这些结果正是我们内心所要的,可信性由工具的先进性和复杂性代替了,越复杂的越可信。

这就是我们的错,『平庸的恶』,我们一个个都臣服在『复杂』的脚下,相信『复杂』的神秘,将『简单的真相』作为祭品,奉献给从未谋面的『神灵』,丢弃所已经知道的,不愿再受思考所累。

政府需直面群众的恐惧

谣言和群众的恐惧的关系,就像影子和实体的关系”,只要群众有恐惧,谣言就会顽强的生存。柑橘大实蝇疫情状况如此,科特迪瓦“绑架儿童”短信引发骚乱也是如此:

科国家电视台援引警方25日发表的公报说,日前部分阿比让市民收到一则匿名手机短信称,最近有一个犯罪集团的成员乘一辆深色玻璃的汽车在阿比让进行绑架儿童的活动,这在民众中引发恐慌。24日,阿比让的部分小学已经停课。

报道说,24日,在阿比让的阿博博区,部分愤怒的家长围攻了两名疑似罪犯的中年男子,并将其殴打致死,4名闻讯赶来的警察也被打伤;当天在尤布贡区,也有一名男子被误认为是绑匪而遭殴打,目前已被送往医院治疗。此外还有多辆汽车被烧毁。

查清、澄清谣言,这只是理应做的外表工作,而更实质的,是要消除群众的内心恐惧,这与谣言调查是完全不同性质的工作。唯一可行的方式,是让群众看到,政府有切实的行动正在执行,群众们看得见那些实实在在的保障,这就是消除黑暗的那丝亮光,只有这时人们的理性才有可能回归。

谁更可怕?

不作为 >> 乱作为 >> 谣言

2008-10-25

谣言止于智者:不『通告』,又何来『智』

根据邓秀新院士调查证实,柑橘大实蝇疫情只是四川省广元市旺苍县范围内,其它地区未发现。然而事情发展的现在,柑橘大实蝇疫情的影响却波及全国,柑橘市场萎缩,果农经济损失惨重。

对此,邓院士反思,指责有不实传言,恶意炒作。注意到邓院士提到,9月底发现疫情,占全县柑橘总数的8.9%,最终疫情得到了控制。邓院士也粗略的给出了谣言扩散的范围:
  • 10月4日,四川省某地方报刊对旺苍县柑橘大实蝇疫情进行了不实报道,此后被多家网站转载;
  • 10月中旬,有人利用手机短信进行恶意炒作,造成不良影响;
  • 10月21日,有媒体声称在山西太原发现四川产的生蛆柑橘,经山西省农业厅核实,太并未发现染病柑橘。
  • 10月22日,有人向农业部举报在北京某超市发现生蛆柑橘。农业部种植业司立即组织北京市植保站到包括该超市在内的海淀区、朝阳区、昌平区的12个超市、农贸批发市场和零售市场,在19个柑橘销售点抽取243个柑橘样本,并经中国科学院动物研究所专家鉴定,未发现柑橘大实蝇以及其它昆虫。
  • 10月23日,互联网转载重庆某媒体声称在重庆发现生蛆的柑橘,而且强调柑橘多产于广西。经重庆市部门进行市场调查,未发现蛆果。
正如邓院士描绘的,『谣言』的影响力是一点点持续扩大,但令人生疑的是,在这个过程里,政府的『通告』在哪里,为什么没有信息公开,为什么那些早就制定好了的一个个危机预案不见踪影,为什么民众没有感到政府在力行。

有一点很清楚,我们这些民众根本就是一个个普通的人,一盘散沙,我们辜负了政府的信任,因为我们根本就没有所期待的『大智慧』。那些所谓『不实』的传言,就是我们的恐惧,害怕自己受到伤害,害怕亲人受到伤害,不愿朋友也受到蒙蔽,受到伤害。面对危机,什么能够打破我们的心里恐惧,那是一种面对着漆黑黑的将来,不知何去何从的恐惧。只要一丝的亮光,这漆黑就有消散的可能,只要有及时的『信息』,有说服力的『证实』。

我们害怕黑暗,更愿跟随光亮。

2008-10-24

要求与习惯

今天我在电梯里,偶得了一段极具“洞察力”的对话:


“这是他的要求吗?”
“不,那是他的习惯”


『要求』或缘于一种应得的责任、或缘于一种主动的鞭策、或缘于一种客观的约束,或缘于防止发生某种不良状态的目的。无论如何『要求』这一行为关系,它缘于以往的经验,在执行具体行为时,又需要个体的主动性的决策。与『要求』相对的,『习惯』这一行为关系,类似于某种行为的“惯性力”。

『要求』与『习惯』有很大的不同,但人们对它的区分却不明显。有时,为了避免『要求』与『习惯』的模糊,我们会将『要求』变为『规定』。

2008-10-23

上天给了我两只眼睛

上天赋我两只眼睛,

一只是善良的眼睛,
观察已发生的变化,

一只是怀疑的眼睛,
审视已存在的另类。

睁一只,闭一只,
只窥尘世的争扰。

汇聚两眼的世象
尽得宇宙的幽静

辨析Responsibility和Accountability

南侨给的解释

英文中有两个词Responsibility 和Accountability,奇怪的是在中文中通常都被翻译成“责任”。其实这两种“责任”的不分,会造成很多问题。粗糙一点说,二者的区分是,前者是职权范围,后者是对结果的责任。很多时候,我们给了一个人responsibility, 却没有运用体制或者道德手段,给予对等的accountability. 责任范围和结果责任的脱节,就造成了在位管事的人不负责,负责的人却不在位不能管事这个局面。我们现在常说问责问责,通常的情况是没有人问,他就不负责任。甚至你去问责的时候,他去问别人的“责”。

2008-10-21

报告领导:『难题评价』和『难题预测』是最大的难题

为贯彻落实“十七大”精神和科学发展观,科技部现征集我国一万个技术难题,技术难题征集采用网上提交、受理、评估和入选发布方式。征集的技术难题经专家评估后,向社会公开发布。我也凑个热闹,报告一个:『对难题建模』、『对难题评价』以及『对难题预测』,它们是最大的难题。

难题之所以难,很大一点就是还没理解、看清它,看清了,表述清楚了,解决反而是自然而得。难道现在研究者们手里空闲的很,不知道还有啥题目要做。吃自己碗里的饭,知道其酸甜苦辣,何苦要折腾一把呢。不过有些人,尽管没事,但还是要找些事来做的。也不知道科技部是想抢教育部的饭碗还是学习教育部,也搞个题库啥的,弄个百万人才大临考的盛况。

一片秋天的枯叶,一个历史的符号

吃完晚饭,慢悠悠地散着步。无意间,一片枯叶滑入手中,那是一种轻轻的、很柔和的感觉,抬起手来,看了看,它很小,没有了水分,枯黄的很,已没有一丝绿意。原本就要飘落在路上的它,消失在这个世界,它却滑入我的手中,最后的留念,令我感受它那曾经细小短暂的生命。

历史需要一些符号用来记录历史。今天两千零八年十月二十日,在中国的法制进程上,出现了一个历史的符号——杨佳。无论他做了什么,他应得什么惩罚,已不重要,因为这个名字转变为一个符号,一个历史符号,也正是这个“符号”的所担负历史作用,它使那些无辜受害者、牵连者更加地痛苦。“符号”并不纯粹,它关联了一些人,一些事,有投机的,也有进取的,有正面的,也有反面的,这些也都因为这个符号成为历史的一部分。

2008-10-20

空即色

今天准备一个报告,突然意识的“空即色(Nothing is a thing)”的问题。“色”,有形,一物或多物,可见;“空”,无形,无一物,不可见。为何会有“空即色”呢?

不妨用一个简单的例子来说明:一盒粉笔,将里面的粉笔倒出来,此时问盒子是空的吗?显然是空的。再复杂一点,我们在粉笔盒壁上画一只粉笔,再问盒子是空的吗?画的是粉笔,但盒子里还是没有那些已经倒出的“实在”粉笔,因此答案依然是,盒子还是“空”的。

在这个例子里,所说的“空”是“实在”的粉笔,而不是那个画的粉笔,空是具体的。换句话说,究其所提供的信息量来说,“空”粉笔要小于一支(两或多支)粉笔提供的信息,也就是说,空粉笔是一个“最小固定点”。

2008-10-19

和谐的不平静

最近,听到和谐,脑袋就涨,似乎里面豆腐脑就要沸了。

如果遇到一个人,他的一举一动、一言一词都和你一模一样,的确很协调,很配合。你开始觉得好玩,你笑一下,他也笑一下;接着厌烦,你阴着着脸,他也阴着脸;你生气,骂他,他也骂你;你怒,打他,他也同样力道打你;最后你受不了,举枪杀他,他也举起枪,向你开了一枪。眼前一片漆黑,一切都结束了。

在一片漆黑里,努力睁开眼睛,还是一片漆黑。害怕,漆黑,什么都看不到,听到的是心跳,咚、咚、咚,周围的一切也开始,咚、咚、咚,声音越来越大,节奏越来越快。恐惧,心里还是恐惧。你举起双手,快速用力拍向双耳...

醒来,听不到,看不到。一切感觉都消失了,这时你才意识到,唯一可以做的是平静。你一点一点地尝试着,心平静慢慢下来。这时你才想起那些和你不同的,想念它们原是那么可爱,是那么的平静。

2008-10-18

一个生动有趣的Haskell教程

推荐一个Haskell入门教程,Learn You a Haskell for Great Good!,它尽力令学习Haskell、理解函式编程(functional programming,也可译为泛函编程)的过程变得生动。

2008-10-17

为何“争先恐后”?

这里介绍美国《侨报》10月15日的一篇文章,文章认为:“争先恐后”已经成了很多中国人的习惯。何时才能不争?显而易见的答案是资源不再稀缺,不过这个过程非一朝一夕之功,尤其是在中国这个人口众多的国度。在此之前,先要补课,从最基本的文明礼仪、有序排队做起,日积月累、滴水穿石,进而逐渐改变中国人的视野、心态和言行。

文章鞭策国人的初衷,理应谢之,但究其观点,“最根本的还是提高全民族的文明素养,重新审视价值观”,这可是“想灭火,却无心浇了油”。这个人人皆谈了两千年的“德”,难道还没够。

“资源稀缺,先到先得”,这是天理,没有错。难道还要用国家暴力将一切先得到的再抢了去,奖给那些“礼”让到最后有德之人,想想这两千年来“教化”历史,冷汗足可以洗澡。自然法则,是个萝卜就要占个坑,这没错。

“资源稀缺”,归根到底还是它。但为何我们总是逃离不了这“资源短缺”怪圈圈?非要到最后闹个大饥荒饿死一批人缓解压力。不该反思吗!悲惨的是,我们还没走出这两千多年来的礼教,集权的管制,人人都同质的厉害,彼此没多少分别。

有人认为中国人像散沙,缺乏协同精神,但我怎么左看右看,这个社会极有协同精神啊!可歌可泣!

英雄的人们早上集体的从郊区赶到市中心参加工作,为了一个共同的目的,赚钱养家,晚上又集体的从市中心赶到郊区,同样的中心,同样的小区,为了克服资源稀缺,算来一天路上就要两小时的肌肤相亲、磕磕碰碰,人们彼此容忍,这不是牺牲精神、礼让精神嘛,可叹啊。

我们的企业们也为了让利消费者,要上的“新”产品,专选那种“众乐乐”的技术,我可以做,你也可以做。有买卖大家一起来做,要做买卖就一定要打价格战,一打就达到底,还要打到国外,让利全世界的消费者,合作与牺牲,可敬!

教育系统也为了社会和谐,专拣那些基本的教,那些熟透了的教,那些谁也不知有何用途的教,决不让一个学生落下,决不让一个用人单位在“鱼和熊掌”问题上为难。

人人都一样,同样的路,同样技能,同样的生活,同样的价值观。
一个大同社会,怎能不能“争先恐后”。

是缘是份,如幻如影,亦实亦真

无论结果如何,祝福这两位苦命人
一17岁小伙高空作业时脚下一滑掉下楼去,直接砸在了一个18岁女孩刘燕的身上,结果两个人同时重伤入院。捡回一条命的小伙子表示,要照顾这个救命姐姐一辈子。

2008-10-16

两件投机性措施

  1. 北京首次进网吧须拍照存档。在北京1500多家网吧上网时,如果是第一次进入网吧,就要在网吧内的监管系统终端设备上拍照、扫描身份证,并且以此存档。文化执法总队新闻发言人李菲介绍,整个的控制终端是执法总队的管理平台上,网吧业主只是负责采集资料以及核对资料,无权对资料进行任何修改和使用。在监控平台上,工作人员可以实时对任意一家网吧的任意一个机位进行监控。某一个机位上的上网者的年龄、图像资料也可以快速查阅,确保进入网吧登记的资料与机位上上网者保持一致。
  2. 移动WiMAX还不能在中国使用,TD继续受扶持。工业和信息化部无线电管理局副局长谢飞波在“3G在中国”2008全球高层论坛上表示,移动WiMAX目前尚未通过中国通信标准委员会审定。这意味着针对中国的TD-SCDMA标准的一系列保护和倾斜政策正在不断实施。

2008-10-14

密集与压力

我理解克鲁格曼的国际贸易理论,理论揭示了全球化的一种趋向,生产制造基地的产品项目和其所在位置方面会进一步密集化。这二十年来,人们所感受到全球化,有了更丰富的产品选择,有廉价的、有咂舌的高档消费品,有物质的,也有精神的。然而,尽管人们生活的范围、层次得到了扩大,但人们也明显感到了城市生活的压力在持续的增加,而且更为疯狂的是,人们也越来越“心甘情愿”地(被期望所迫)要挤入密集区的中心地带,寻找机会,这已经是共识,那些逆向选择的人们已经会成为“异类”或者被当作失落者。

我信奉的是,社会关系一旦失去了“分散”,就会失去“自由”,这不是一中“自然”的趋势,它会压迫人性,令人失去“兼爱”,让人失去“好奇心”和“想象力”。或许,这仅仅是一种猜测,当前的金融危机并不简单的归于金融产品开发的失控,或者什么投资人的品德失落,我想更多的是这种密集化所驱使的“需求”,“密集”所要的不仅是资料流通的速度,而是速度的增量,一种持续的力量,当一切正常的生产机制不能满足时,必然会选择其它的“极端”。

或许可以进一步的猜想,我们是否可以将物质的生产的密集转化为信息的密集,毕竟人的需求在局限条件下是有限的,通过转换来减轻密集的压力。一切仅是开始。

恐怖组织的网络结构

普通人总是感到恐怖组织的网络结构很神秘,这里有一篇论文《The topology of dark networks》,文中介绍了对贩毒、军火交易、恐怖组织等组织网络的研究结果,这些网络不但依然有小世界的性质,而且也显示出了相当高的聚合度,注意到,由于存在一小部分节点要承担关键桥接的作用,这种类型网络也特别容易受到攻击,这自然是打击恐怖组织的一个策略。下图来自论文(版权归作者与本博客CC授权无关),图中绿色的节点是南亚地区的。

回到2001年,搜“三聚氰胺 奶粉”

巧合有时令人恐惧得很。从这里得知,在google推出一个特别纪念项目,搜索2001年,搜索“三聚氰胺 奶粉”,你会得到
看搜索结果第一个条目,“三聚氰胺”、“婴儿配方奶粉”和“三鹿集团”这三个敏感的关键词居然在一起。惊讶、恐怖。慢着!先别急的议论,看一下2001年时那个网页到底是什么,这要感谢web.archive.org项目,可以查到那时的结果
 奥,原来有两个招商项目的广告摘要离得的太近了。

 最后感谢AW用“如有雷同 纯属巧合”的实例来提醒,现实中一定要独立思考。

2008-10-13

“温水煮蛙”:道理与现实是有区别的

经常听到温水煮蛙的寓言,寓意提醒注意那些“微不足道”的变化,积累下来或许就是一场灾难。寓言和现实经常不一致,一位网友很较真,亲自做实验,结果是:
  • 将青蛙轻轻放入锅中,生火,生火后1分钟17秒时,青蛙开始多次往外跳跃,试图逃生;
  • 将大锅中的水烧开,水沸腾时,抓起一只,扔至锅中,青蛙挣扎4秒左右,烫死。

无论这事后其它网友怎么评论,我还是有些虚伪,挺同情那些不幸烫死的青蛙。寓言总归寓言,传达了要说明的道理,不用与现实太较真。

测试“自我意识”

下面文字摘自此处
自我意识在动物个体生存和发展中具有十分重要的作用,而产生自我意识关键的一步是理解自己的镜像(哦,那不是别人,是你自己!)。通过成功地相互比较试验,如工具的使用、情节性记忆和利用自身经验去判断伙伴的行为等,我们现在知道至少在某些鸟类中也存在类似于人类和猿类的思维能力。

对于非人类动物和人类儿童,“标记测试(mark test)”已经被作为测试自我意识的工具。在这些实验中,测试对象被放置在一面镜子前面,并且在被测试对象身上做一些标记(很显然,这些标记只能通过镜子看到),然后观察被测试对象是否能根据镜像中看到的标记表现相关的行为。

几句评价

礼教几千年,现在又全民爱国长跑,而且四百配一师。我们喜欢听评价,这里有几句,摘自萧瀚的追遠堂。它们尽管听着不舒服,但现在还是受用的:

(1)黑格尔说:“中国的显著特色就是,在实际上和理论上,绝对没有束缚的伦常、道德、情绪、内在的‘宗教’、‘科学’和真正的‘艺术’凡是属于‘精神’的一切一概离他们很远。”

(2)孟德斯鸠说:“中国人的生活完全以礼为指南,但他们却是地球上最会骗人的民族。”

(3)利玛窦神父说:“……还有一点不能容忍,就是在中国盛行撒谎和欺骗,谁都对此不以为耻,有地位的和知识分子也不例外,因此,谁也不信任他人,彼此猜疑,不只在朋友、乡里之间如此,就是在亲人之间,如兄弟姐妹、父母子女之间也都不绝对信任。中国人彼此之间的交往,只是动听的外交辞令表演,心里没有真情实义。……”

(4)韦伯说:“中国人彼此间典型的不信任已为所有观察者所证实,同清教诸教派中对信徒的诚实品质的信赖成为鲜明的对照,即使在宗教团体以外,也可以信赖清教徒的诚实。”

2008-10-12

自发性生产与投机性毁灭

自发性生产和投机性毁灭是一对过程,自发性强调了生产的客观性,而投机性强调了主体的主观性。凡是自发性的生产都会具有所谓的创造性或者创新性,只是这些创造性比较,有多有少的。然而,一个关键问题是经常将投机性的毁灭当作生产,这就更加混淆了创造性。因此,我们在主观上剥夺了创造性的客观性,认为创造性是可以补偿的,即创新动机是可以激励的,这只是一厢情愿,没有出路。

2008-10-10

一个面试官的感受

这里有一篇冯大辉在南大作为面试官的感受,无论如何,所说的这些是要面对的现实:
今天发现的一个事情是,现在大学的很多计算机专业的硕士生真的被一些王八蛋导师坑了。多数硕士生的功底反而不如本科生了(无论从昨天的阅卷还是今天的面试来看),尽管可能做硕士期间做过很多项目,但那些项目基本都是用 .net 之类的东西做的,或者就是"大作业"。研究生被用来用作赚钱工具,一两年下来,以前的很多东西基本也都丢掉了。他们很无辜。

另外是学校研究生的课程设置,真是有些骗人了。问所有研究生的研究生课程,多数都说不明白能研究生课程的内容,有的主打课程教材就是看导师弄的 PPT ... 教课的导师根本把握不住计算机行业的脉搏,真不知道都干什么吃的去了。


在冯大辉博客上还有一篇很中肯的建议《毕业生该怎么找互联网行业的工作?

想象力

匆匆地赶路,最惨就是将最宝贵的东西丢掉,这就是想象力。

知识的第一印象

昨天在校园路上散步,突然听到清脆的叫声,“爸爸,教我”,寻声望去,看到一对父女,女孩看着很兴奋、很迫切的样子。一声“教我”,这句话令我觉得它是多么的陌生。我们都从幼年过来,在这过程里越发感到知识的价值,对于研究者,“知识”作为“事物”的形态却越来越模糊。问题是“知识”一开始给我们的第一印象是什么呢?对“知识”的感觉究竟是什么?

“教我”,幼童看到那有趣而不能为的,总是有显得“过剩”的好奇心,觉得好玩,想试一把。“有趣而不能为”这或许就是对知识第一印象,或许正是这种朴素的感觉,它注定了“知识”的永远神秘性,人类对知识的无止尽向往。

很有意思,信息检索、人工智能或知识管理等所研究的知识是“已知的”,这与知识的第一印象不同,因为它是未知的。无论信息检索、人工智能或知识管理都是将知识局限在“已知”中,不能说这是漏洞,因为这是实践所必须的。

如果“已知”与“未知”有交互,那么在微观上,这个交互点令人感到神秘莫测。

2008-10-08

对称性破缺

今年的诺贝尔物理奖涉及的问题是对称破缺,John ArmstrongMark C. Chu-Carroll的博客上举了两个对称性破缺(symmetry-breaking)的简单例子:
The canonical example to define symmetry-breaking is a bunch of people seated around circular table. Each place setting has a plate, and there's a cup set between each pair of plates. The situation has a rotational symmetry (turn by one setting) and a reflection symmetry (draw a line across the center of the table, through a pair of plates).

But is the cup on your right side or your left side part of your setting? When everyone sits down, it doesn't matter, since everything is symmetric. But if I grab the cup on my right, the woman sitting there has to grab the cup on her right, and the man on the other side has to grab the cup on his right, and so on all round until we get to the woman on my left who grabs the cup on her right -- my left.

Now the reflection symmetry has been broken, but the rotational symmetry remains.
另一个例子是:
It strikes me I should say something about spontaneous symmetry-breaking.
The canonical example here is to consider a punted wine bottle. That is, the bottom isn't flat, but is domed up in the middle. It's rotationally symmetric. If you place a marble on the punt in the exact center, it will balance and the situation is still symmetric.

But that situation isn't stable. The slightest nudge will push the marble off the center (just like one person grabbing the left or the right cup). Then it will roll off in that directly until it comes to rest in the groove at the base of the punt. Now the rotational symmetry has been broken, since one direction from the center has been identified as different.

The important thing is that nobody made a "choice" here. Energetically, the non-symmetric configurations are all just as good as each other, but they're all better than the symmetric position. So the tendency of the universe to minimize energy is what "spontanously" breaks the symmetry without having to "intentionally" break it by making a choice to pick out one direction over the others.

2008-10-07

信息质量能否通过审查来提高?

到底要何种程度的信息质量,这取决于使用该类信息的要求。然而要求却是多种多样的,费用也有所不同,单一的信息质量规定是不现实的,对于大信息量,尤其像国家科技基础条件平台资源信息这类信息资源,必须有后级的各类加工,而且能够形成市场,允许将某些单位研究时加工的数据共享出来,并可获得一定的补偿,来降低整体信息质量相关的费用,更重要一点要有一个信号,来反映对信息对质量真实要求。

三年多前参加过一次与基础条件平台相关的技术讨论会议,觉得这类信息非常有价值,关键目前在国内也没有任何一家可以做这类型的事情。一直担心的就是信息质量和后期的运营。虽然国家会当成公益工作一直支持,但问题不仅是信息的产生、存储与共享。看到这则新闻更有些忧虑了:

科技部、财政部共同成立了国家科技基础条件平台资源信息质量核查专家组,专家组组长张泽院士表示:“国家科技基础条件资源平台信息质量核查工作使命崇高、责任重大、任务艰巨,专家们一定严格按照要求,站在国家全局的高度,认真履行职责,在工作中注意加强交流,严格自律,总结经验,发现问题,为国家科技基础条件平台资源信息质量核查工作献计献策”。

像国家科技基础条件平台资源信息这类信息,量如此的巨大,内容如此的专业,有的条目权威的专家,国内就那一两个专家,保证资源信息的质量,这已非是信息质量核查能解决的,这也不是在一两年内通过一两个工程可以为达到的。观点还是两条:现有平台功能上要减肥,去掉花哨;开始探索新的运营策略,维基百科、Creative Commons,以及刚出来的Google Knol等开放的互联网运营模式都值得参考。

金融危机与风险管理系统

由次贷危机引发当前金融危机,这个话题已经有很多。无论有什么阴谋论,我想每个人都不希望有这样个局面。抛开人性的责难,有一点令人深思,金融界不但花费巨资投入在风险管理上,而且从事这方面工作的都是聪明人,都是精英,他们有金融评论家,有数学家,有计算机专家,有经济学家。但这个系统失效了。

如果仅仅是资本家面对系统刺耳的警告,充耳不闻,有意掩盖,这个问题就简单多了。但问题没有这么简单,更不幸的,一切都失效了,投资家、评论家、数学家、计算机专家以及经济学家都在这个过程“迷失”了方向。

为什么?!

这篇评论《How Wall Street Lied to Its Computers》里有一句话,或许有些启发:
The people who ran the financial firms chose to program their risk-management systems with overly optimistic assumptions and to feed them oversimplified data.

我们总是制造、选择那些乐意看到的。想得到什么,就输入什么。结果却成了,输入的是垃圾,输出的是垃圾。

2008-10-05

增值税是“税”还是“租”?

张五常教授在《中国的经济制度》提出了一个问题,“增值税的本质:“税”还是“租”?”。有一点是清楚的,有“租”,就有“权”划分的问题,这是所谓的“中国特色”,还是中国在改革开放中“一不小心”地触及了一个一般性的经济性质。这越想越复杂,还是先放放,需要再学习,再思考。

2008-10-04

彻底无语的“长跑国策”

如果下面这则新闻是真的,这次真的对彻底教育部无语了:
由教育部、国家体育总局、共青团中央联合开展的“全国亿万学生阳光体育冬季长跑活动”将于10月26日正式启动。冬季长跑总里程以60公里为基数,象征新中国成立60周年。小学生为120公里,初中生为180公里,高中生、高校学生为240公里。

在10月26日至明年4月30日的半年时间里,全国学生将坚持每天长跑。10月26日起全国小学生每天跑1000米,初中生1500米,高中及以上2000米。

2008-10-03

经验与质疑

下面文字摘自“寻正”的《科学圈子里如何对待经验——答费思》(XYS20081002)


科学圈子里讲究证据原则,证据原则中有如下一些证据强弱的判断,双盲强于单盲,盲强于不盲,试验强于观察,随机试验强于不随机试验,有对照实验强于无对照实验,前瞻性观察强于回顾性观察,系统性观察强于非系统性观察(个案系列、个案、经验),个案系列强于个案,专业人员观察强于非专业人员观察。

......

相对而言,理论是最容易质疑的,其次是实践,再其次才是事实。你从个人经验来质疑专业人员对事实的描述,这在科学圈子里是不太可以思议的事情,由于中国学术造假问题严重,诚信缺失,的确有大量的专业人员的事实被质疑,但这些质疑,无不是存在逻辑上不洽或者是由专业人员作出来的。

......

当经验与理论不相附合时,如果理论的支持证据的强弱水平不显著高于经验的层次,普通人可以质疑理论,如果理论的支持证据显著高于经验,那么只有专业人员可以质疑理论的合理性,更多的是质疑其局限性,找出理论更恰当的适用条件,换一句说法,叫做灵感。

2008-10-01

虽云计算稍些有毒,但也没办法

Richard Stallman警告说“云计算是个陷进”。争论的焦点依然在争夺数据的控制权上,但现实问题是,尽管“云计算”是一些技术的“打包”,但这很实用,目前我们没有其它现成的技术,以廉价的成本处理那些海量的、相互连接的数据。

另外,还有人说“云计算”被过度营销了,的确,这是有点过分。没有超过1000个计算节点,不是云计算设施,这个观点我赞同,搭建云计算设施不是小民能玩的,若计算节点少了,运营成本优势、应用广度和深度就体现不出云计算特点了。但开发云计算的应用,这可不意味着非要搭建个啥平台的。找现成的,能在上跑就行了。目前一个缺点,这方面标准少,对于应用在各平台上的兼容成本,这自然就要自己承担了。

就长期来看,这种舍近求远,闲置桌面和移动的计算资源不用,这显然有问题。我也相信,问题核心还是需要在基础计算理论上的突破,为什么数据不是连续的呢?!为什么信息谷仓效应越来越突出?!问什么需要显性的连接数据呢?!为什么我们总是建了一个又一个的烟道式系统呢?!问题丛生,有一个梦,“如果记忆能够编织多好”,这也在情理中。

2008-09-30

08年度科研娱乐盛事

弱智的决策与浮躁的行为总是形影不离,这里就有一例
教育部科学技术委员会自1998年起开展了“中国高等学校十大科技进展”的评选。2008年度“中国高等学校十大科技进展”项目的评选工作继续进行。
...
推荐项目应具备的条件:
1、高校应为项目的主要完成单位,或高校科研人员为项目的主要完成人。推荐项目应归入下列类型之一,并符合其条件。
一、推荐项目应具备的条件
A类:探索自然现象有重要发现;研究自然规律,创立了新理论、新学说;发明了新的研究方法或实验手段。
B类:攻克或解决了制约国民经济和社会发展的重大科技问题,在理论方法和技术原理上居国际领先或先进,对经济和社会发展有重要影响。
C类:具有自主知识产权,具有重大经济和社会效益,创新性的技术、工艺、设计、产品等。

2、推荐项目中的标志性成果(如论文、专利证书或成果鉴定证书等)产生的时间范围应在2007年12月至2008年12月之间
...
摘自此处,或直接访问教育部的通知

注意到时间要求了吗!是的,从所谓的“标志性成果”产生一年内。

一个新事物的诞生,在一开始会有多少人知道,它可能会成为当前的一项科学发现或技术突破,答案是极少数!对于这些,尽管历史会最终会给一个说法,但当前教育部这个“年度”究竟如何摆平呢?这或令各位校长或主任感到头疼的,也会劳烦不少学生、秘书汇编材料。

2008-09-28

“死”与“生”

下文摘自此处:
至于具体是何种原因促使Forelius pusillus蚁每天都采取自杀性的举动对蚁穴入口实施伪装,科学家们目前还未查明。有学者猜测,Forelius pusillus蚁采取这种伪装措施是为了使整个种群免遭另外一种蚂蚁——红蚁的袭击。除此之外,科学家们还不清楚Forelius pusillus蚁群是采用何种方式来挑选那些需要待在洞外的蚂蚁。研究人员猜测,被挑选出的蚂蚁很可能都是病蚁,当然,这种猜测还需要进一步的验证。

2008-09-26

“多数统治”和“多数评判”

参看此处

伯里克利曾经用很简练的方式说明这个观点:“在我们这群人中,可能只有几个人有能力制订政策、具体实行,但是,我们所有人都要有评判的权力。”

理念——特别是创新的理念——或许会得到一些人的踵事增华、澄清诠释,但是追本溯原一定是少数人的心血结晶。但是,很多人在事后,却有能力评判这些观点是对是错,特别是那些切身经历政策后果的人,他们的看法更值得重视。这样的评估,这种对错的判断,是可以交由广泛的选民抉择的。

如果是这样,重要的是弄清楚一件事:想大众征询意见的课题,不要超出了他们的理解范围

尽管有中央政府,但...

老脸丢得彻底,自然无语,下面的文字摘自此处

China may have an authoritarian central government but what goes on in the provinces is often beyond its control. And what goes on there was largely invisible to everyone until Chinese exports started to reach every corner of the globe in quantity. As its reputation and credibly lie in tatters, China is now discovering one of the hazards of that kind of economic reach.

And the world is discovering the hazards of Chinese exports.

最近删贴之风盛行

两千零八,有冰雪、有出轨、有地震、有奥运、有台风、有溃坝、有奶粉,有股市,有房市,有神七,还有什么

2008-09-23

如果信息架构存在,那么它也是无法复制的

信息系统和组织一样,我相信它们是有生命的。“生命”意味着,它的“经历”,尤其那些我们希望“再现”的成功经历,这些是无法复制的。信息系统,它的确曾经是人造的,但有时却十分的神秘,令人感到哪里好像失控了,似乎不再是原来那个,令人发疯。无论是软件架构,还是信息架构,它们或许在“建造”非常有用,这是“工程”的内在要求,但这绝对不是信息系统“成长”所必须的,这是“生命”的价值映衬

2008-09-02

人是成长起来的,不是教出来的

推荐阅读张五常先生的《穷孩子的玩意与日本妹的前途》。

大智若驴

南侨的一篇书评
现代的社会万马奔腾,一个以驴为友的人,才能做到边走边看,用作者的话来说:Watch the world go by. 看着世界在身边溜走。
...
多么愚蠢啊!总想做一个不是自己的人,总是在玩别人的游戏。
...
人在旅途未必全是赶路,从一个目标到另外一个目标。人活着有很多事情可做,这么慢慢走也是一种。

2008-09-01

注定失败的地方标准

看到这则新闻,才知道广州《电子文件档案资源管理规范》作为推荐性地方标准今日正式执行。无论标准的技术成熟度如何,若这个标准在一开始就没考虑社会上的实施成本,它注定失败。进一步,从标准选择CEB格式这点来说,广州市档案局低估了电子文件长期保存技术的复杂性,更为讽刺的,广州市档案局虽然职责是档案管理,但它却混淆了办公自动化和档案管理的区别。

“杰青”结题的幽默

冷幽默到处都是,这篇新闻《基金委化学部07年度杰青结题验收及中期检查结果》亦是如此。按报道给出的数据,22位资助对象共发表1023篇论文,SCI索引976篇。平均每位已经结题的“杰青”每年要发表11.6篇论文,几乎一月一篇,一月内有0.9篇文章要被SCI索引。
将这22位的研究团队也算进来,即包括博士后和博士生,共22+17+220=259位,在这个范畴内,平均每人每年1.0篇。

2008-08-29

知识的凝结——产品人性的一面

如果时间是生命的度量,那么对于一件产品,它耗费许多人的一些生命,凝结了这些的人知识。“iPhone Girl”是一名普通的劳动者,因为意外,被产品的消费者发现,因为其甜美的笑容,被大众接受。产品长期被货币化,数字代表了产品的价值,尽管这组数字只用来完成一次交易。生命的热度已消散,产品变得冷冰冰。

试想,在你拿到一个产品后,你可以看到哪些人参与。回看一下历史,单人手工制品,手工作坊制品,机械的工厂制品,工厂标准件制品,流水线生产,区域产业群生产,全球化生产。个人的作用越来越少,凝结的知识越来越多,有设计师的,市场策划者的,工人的,司机的,清洁工的,推销员的,管理者的,...,无数人参与其中。产品会回归人性吗?这是一个问题。

2008-08-05

文档的长期保存

正如胡才勇先生提到,微软DOC文件格式复杂,版本多且封闭,兼容性差,无法承担长期保存文档任务的。这点我非常赞同,但胡先生以此为论据推荐UOF格式,这就有争议了。

无论UOF还是ODF,它们的设计需求,都没有设定长期保存文档内容的要求。更何况UOF能否生存下去都是一个问题。我没有调查,只是感觉UOF的生态环境远要比ODF小的多,这也就意味着企事业部署UOF的成本和风险都要比ODF高。何况我也不了解,UOF有什么样的特色功能让人非要选择它,仅为了中国特色?

如何长期保存电子文档,当前无论是在学界还是在产业都是没有定论的。当前处理遗留文档最为稳妥的方式,就是打印再扫描,即图像化。如果非要推荐一个格式标准,PDF就是一个,——PDF/A或ISO 32000——,至少它被假定用来长期保存文档。

2008-08-04

最重要的决定并不是你要做什么,而是你不做什么

摘自这里

乔布斯坚持要尽可能多地去掉界面上的元素,他说窗口里的内容才是最重要的,而不是这些窗口本身。
...
他想避免“奥斯本效应”,即一个公司宣布了一项很酷的新技术正在开发之中几乎就等于自杀。
...
许多公司号称自己以消费者为中心,他们接触用户并询问他们需要什么。这种所谓的用户中心创新,是通过用户的反馈和焦点团体来进行的。但是,乔布斯避开了这种把用户关在一个会议室来加以研究的繁重工作。他自己玩弄这些新技术,记录下自己的反应,将之反馈给工程师。如果一个东西太难使用,乔布斯就会指出哪些地方必须简化。任何不必要的或者令人费解的地方,都会被要求去掉。如果乔布斯满意了,用户也就满意了。
...
艺术和技术中的创造性,核心都是个体的体验。艺术家不能通过组织焦点用户团体讨论来作画,乔布斯亦如是。乔布斯不会通过询问焦点用户团体需要什么来进行创新——他们也不知道自己想要什么。
...
人们不知道他们真的想要什么,直到你把成品放到他们面前。
...
有时候他说:‘我看我们得这么做。’这只是一个测试,看看是否有人会出来挑战他,这才是他想要的人。”
...
乔布斯喜欢在规模较小的团队工作。他不希望Mac团队超过一百人,以免重点不清、难以管理。乔布斯坚定地相信,大型团队之外必须包围着若干由聪明员工组成的小组。

规定是规定,发展是发展

这里有这样一段评论
陈德人教授说:“20年以前,国家有个规定,任何家庭如果有传真机必须去登记;10年前,国家又有个规定,电话机有两个接口的也要登记.后来,虽然没有人说这种规定是不行的,但是也没有人去登记.我想,国家有国家的规定,社会有社会的发展.这和网店新规的道理是一样的.”

“你是你,我是我”,“你规定你的,我发展我的”,这或就是自然发展的“态度”吧。

2008-07-30

沟通的责任

这里谈到东西方在沟通责任上的差异:西方把沟通的责任赋予讲话的一方,而东方则把沟通的责任加在听话的一方。“你听懂了吗?”,这句话在沟通中是没有正面价值的。

2008-07-29

环看四周
眼前条条的路
都是前人走出的

总要走的
是沿着眼前的路
还是迈出眼前的路

回头看去
那刚走过的
是自己的路
尽管零零散散
总算清晰

向远处望去
一切的路
尽失在远处

双脚踏着
眼前这片地
它一直是它

2008-07-28

伪装

漂亮女人最好的伪装是骄傲
成功男人最好的伪装是果断
全知高人最好的伪装是自大

轮询 vs. 事件

Evan Henshaw-Plath在OSCON2008做了题为“Beyond REST? Building Data Services with XMPP PubSub”的讲话,谈到RSS轮询检索导致的伸缩性问题。

Friendfeed网站使用RSS技术用来收集数据,就在2008年7月21日,为了得到45,754个用户最新图片信息,它就爬了2,975,981次,但其中仅有6,721的用户会上传图片。从这组数据看,平均对一个用户在一天里约查询65次,查看更新内容。假如用户习惯一天更新一次,对于这预计的一次更细,系统就要承担约443次(2975981/6721)的无效查询,压力增大443倍。更为糟糕的,RSS列表是有长度限制的,一般是20条,这意味着,如果用户上传了许多的话,系统记下的最多只能是20条。控制更新服务质量的方式,就是控制查询的频率和窗口大小(RSS清单项目最大数)。频繁的查询、大的查询窗口,对单个用户来说,更新的数据会更可靠,但对系统来说,系统的效用会更差。

问题的确严重,系统承担不必要的巨大压力,能源损耗也是巨大。为了这个问题,Henshaw-Plath讲话中提出了XMPP的消息传递的方法。是基于轮询(poll-based)?还是基于事件(event-based)?三四十年来,架构设计一直在这个问题上来回摇摆。

“轮询”,结构和实现方法是简单易上手,但以性能为代价;“事件”,效率的确好,但传递机制和维护措施复杂。一个事实是,无论是性能的代价,还是机制的复杂,它们都会导致系统伸缩问题。

预警系统,你好吗?

这则新闻说“我国将建房地产预警系统”:根据国家发改委的批复,“房地产预警预报系统”将依托互联网,建立涵盖40个城市节点的广域数据专网,构建包含40个城市节点的房地产市场基础信息数据库、监测指标数据库和信息发布共享数据库,建设基础数据库采集系统、基础数据库整合系统、监测数据分析系统、监测指标预警预报系统、监测与预警预报信息发布系统等应用系统等。

世上没有救世主,系统也一样,这类的经济预警系统,我国建了不少了,养了不少“纸上谈兵”的专家,也让大家都有项目分。大家知道,“风险”啦“危害”啦最容易说事,你怕了,你担心了,你也不明白,好,这就好办了。

那么,这里所说房地产风险究竟是什么风险?难道不是金融风险、不是信贷问题吗?如果没有银行贪婪地玩耍,房地产会走到如此地步吗?最近美国总统布什也戏言“次贷危机”,华尔街喝醉了,设计出自己也不明白的“金融产品”,人民上套了,银行上套,大家都上套了。

痛了,如果还不认真审视自己,发现自身的错误,纠正自己,痛苦还会再来,而且更加猛烈。

2008-07-25

消息?还是状态?

不管期望什么,服务计算的现实任务还是实现异构系统间的互操作。既然是为了互操作,两系统间总是要交换一些东西,那么这些交换的东西是消息呢?还是的状态?这便是SOAP(WS-*)和REST两个派别争执的核心。

在理想世界中, 消息和状态的变更是一回事情,只是视点不同。假如A按了B上的一个按钮,这便有了两个互补消息(e, e'),e使得系统B发生了状态变化,同理事件e'也使得系统A发生了变化。或许疑惑为何是两个互补的消息,不是一个吗?这也就想力有作用与反作用力,我推你一把,同样的力也反作用我自己。就服务范畴而言,消息e可以理解为请求,而消息e'理解为系统B处理事件e的响应。

再稍微复杂一点,假设A依次按了B的两个按钮。系统B因消息e由初始的s0变为s1,再因消息f变为s2; 系统A也相应地因消息e'由状态t0变为t1,再因消息f'变为t2。对于这两组互补消息(e, e')和(f, f'),很明显(e, e')发生于(f, f')之前。

至此,我理解发生顺序很重要,如果错乱,系统的状态肯定混乱。现实中总因素导致消息丢失,延时,因并发而冲突。这也就是为什么SOAP族的协议越做越复杂的一种因素。

尽管REST耦合性更为松弛,但你会发现,这种松弛令服务的自动发现和组合难以实现,还产生了令人恼火的资源发散,希望能够统一的处理,但这并不容易。

2008-07-22

计划的代价注定要漠视品质

那些无论谈什么总是口口讲计划的,我称这些人是“计划主义者”。试图将质量控制和风险管理纳入计划范畴的努力都是徒劳的。好的计划者总是可以平衡进度、成本和资源,他是一个政客;好的质量者应热衷去追求他所认为的内涵,他是一个艺术评论家,甚至是个事无巨细挑剔的讨厌鬼;风险者却是一个天生持怀疑主义的行为谨慎的保守人士。

计划总是一个项目内的事,而质量和可能风险却总要超越项目。政客总会向他的支持者许诺,我有个计划,这回实现你们的要求。一段时间后,你会看到,那些有良心的政客履行了那些诺言,执行了那些计划,但你却发现,这些结果不是你所最急需的。

2008-07-21

最优有害?最终还是“简单”来支配!

这里报道了一项研究结果:
遗传突变为自然选择创造了赖以行事的原料。突变的短期命运相当清楚——制造更合适的生物体的突变能一代代持续下去,有害的突变更易于随着生物体消亡;突变的长期结果则并没有被进化生物学家很好地理解。新的研究表明,短期有利的选择可能会阻碍长期的进化
...
Cowperthwaite解释说:“一些特征很容易进化——它们由突变的许多不同联合构成;另外一些特征则很难进化——它们由不太可能的遗传‘处方’构成。进化选择了容易的,即使它们并不是最好的。”
...
结果表明,生命确实由“容易”的特征所支配,或许以牺牲最好的为代价。
(报道所介绍的论文可在这里获得)

所有最优化进程都是局部的,或正因这种局部性,其最优化的结果也难复制和传递。

2008-07-17

文档工程

无论是企业单位,还是政府机关,只要是一个组织就会有林林种种的文档存在,可以这么说,没有这些文档的存在,组织是按制度无法运作的,运作过程也难以预计。看似简单的管理,事事却需巨细的处理,时间长了就令人抓狂。我曾参与一家飞机总机厂的知识工程,发现现实问题比想象的复杂,如标识文档和文档数字化,其所需工作量是原估计的二至三倍,而且最终成效也未必如愿,最后不了了之。



这里介绍了一种方法,或许有助于你在面上了解文档工程的相关活动。

上图取自Bob Glushko的博文,图中字母D-O-C-U-M-E-N-T的含义如下:

D -- 数据类型和文档类型

O -- 组织事务或组织过程

C -- 环境、上下文或相关事情

U -- 用户类型和特殊用户需求

M -- 所需的模型、模式或标准

E -- 相关企业、领域或生存环境

N -- 可以驱动企业的需求

T -- 技术、限制或机会

2008-07-16

个人破产法

昨天闲聊,谈到房贷的“断供”,一个问题,银行究竟怕不怕?

这或许有一个相当直接的答案,中国的银行不怕,这是因为中国没有“个人破产法”,债务是利滚利,一生一世,子子孙孙,有债必偿,这也是流传久远的传统观念。对放债人来说,风险极小只要心狠,这是一本万利的买卖。对于个人,无论是天灾还是人祸,一切都毁了,只要命在,债就在。

中国啊,个人破产法的出世,为何这么艰难!

2008-07-14

顽皮的语言

计算机的自然语言处理,众所周知那是相当的呆板,其实作为实在的人,有时在“理解”上也会有所呆板,索性在反复怀疑和假设下,如果不在中途放弃的话,最终会理解的。下面是博主刘瑜在一篇博文使用的形式:

我“不明真相”,没多少看法,就12条:
1. ...。
4. ...。
12. ...。
仔细想来,这12个看法都跟...

我开始理解是博主的意见共有一十二条,但看到是三条意见。博主更“可恨”的,还这三条意见分别标注为“1、4、12”,在我看来,以十进制阿拉伯数字书写,这是“断”号了。我还以为是RSS系统的问题,自动摘取部分内,打开原网站一看,还是一样的内容,再看附后的评注。呵呵,才知“上当”了。

博文中的符号“12条”存在符号的困户,必然被重新理解:
  • 有的人解释为“一两条”,但博文给出了三条意见,一种选择就是将“一两条”的“一个或两个”含义放松为“几个,最好越靠近一个或两个越好”;
  • 有的人还理解为“1 + 2 = 3”,强调数量上的逻辑关系。

然而对于博文后面的标号“1、4、12”的理解,有人放弃了其原本的含义,直接当成一种纯符号,“第12条”就是一个名字而已。

这是一个很有意思的理解过程,起作用的不仅仅是所谓“语义”的东西,还有其它什么东西,那这是什么呢?

2008-07-13

高德纳谈开源和重用

高德纳在今年的一次访谈中,谈及开源和软件重用的话题,英文稿可从此处下载,热心人士的中文译稿参见此处。在这次访谈中,对“二进制级(或组件级)重用优于源码级重用”的质疑,这令人兴趣大增,高德纳本人更信任“可重编辑的代码”。

(下面摘抄访谈部分内容)

For example, open-source code can produce thousands of binaries, tuned perfectly to the configurations of individual users, whereas commercial software usually will exist in only a few versions. A generic binary executable file must include things like inefficient "sync" instructions that are totally inappropriate for many installations; such wastage goes away when the source code is highly configurable. This should be a huge win for open source.
例如,开放源代码能带来数以千计的二进制包,可以完美地针对每个独立用户进行配置,但是商业软件通常只有几种版本。一个通用的二进制可执行文件必须包含很多指令来“抹平”不同运行环境间的差异,这对于很多安装环境来说并不合适;然而源代码是高度可配置的,因此这种浪费也就随之消失了。这是开源软件的巨大优势。

...

I don’t want to duck your question entirely. I might as well flame a bit about my personal unhappiness with the current trend toward multicore architecture. To me, it looks more or less like the hardware designers have run out of ideas, and that they’re trying to pass the blame for the future demise of Moore’s Law to the software writers by giving us machines that work faster only on a few key benchmarks! I won’t be surprised at all if the whole multithreading idea turns out to be a flop, worse than the "Itanium" approach that was supposed to be so terrific—until it turned out that the wished-for compilers were basically impossible to write.
我不想回避你的问题。也许我个人的一些观点会为当前流行的多核架构趋势泼一盆冷水。在我看来,这种现象或多或少是由于硬件设计者已经无计可施了导致的,他们将Moore定律失效的责任推脱给软件开发者,而他们给我们的机器只是在某些指标上运行得更快了而已。如果多线程的想法被证明是失败的,我一点都不会感到惊讶,也许这比当年的Itanium还要糟糕——人们基本上无法开发出它所需要的编译器。

...

The machine I use today has dual processors. I get to use them both only when I’m running two independent jobs at the same time; that’s nice, but it happens only a few minutes every week. If I had four processors, or eight, or more, I still wouldn’t be any better off, considering the kind of work I do—even though I’m using my computer almost every day during most of the day. So why should I be so happy about the future that hardware vendors promise? They think a magic bullet will come along to make multicores speed up my kind of work; I think it’s a pipe dream. (No—that’s the wrong metaphor! "Pipelines" actually work for me, but threads don’t. Maybe the word I want is "bubble.")
我今天所用的机器有两个处理器。而我只有在同时运行两个独立的作业时,才会用到这两个处理器;这样很好,不过每周这种情况只会发生几分钟而已。如果我有四个、八个甚至更多的处理器,我同样得不到任何好处,想一想我是做什么的——我几乎每天每时每刻都在使用计算机。所以,我为什么要为硬件供应商承诺的未来而高兴?他们认为多核的到来可以为我的工作提速,我认为这是“白日梦”(pipe dream)。(不——这个比喻不准确!我是会用“Pipeline”的,但是不会用线程。也许我应该说这是个“泡影(bubble)”)

...

That question is almost contradictory, because I’m basically advising young people to listen to themselves rather than to others, and I’m one of the others. Almost every biography of every person whom you would like to emulate will say that he or she did many things against the "conventional wisdom" of the day. Still, I hate to duck your questions even though I also hate to offend other people’s sensibilities—given that software methodology has always been akin to religion.
我通常都是建议年轻人要相信自己的判断,而不是其他人。我就是“其他人”中的一员。大概每一位你要效仿的“伟大人物”的传记上都会记载,他或她曾经向当时的“传统智慧”发起过挑战。 虽然如此,我并不想回避这个问题,尽管我也不想触动其他人敏感的神经——有一种软件方法学已经类似于某种宗教了。

...

I also must confess to a strong bias against the fashion for reusable code. To me, "re-editable code" is much, much better than an untouchable black box or toolkit. I could go on and on about this. If you’re totally convinced that reusable code is wonderful, I probably won’t be able to sway you anyway, but you’ll never convince me that reusable code isn’t mostly a menace.
我还必须承认我对“可重用代码”的流行保有强烈的偏见。对我来说,“可重编辑的代码”要远远胜于一个无法触及的黑盒或工具集。就这个问题我还可以不断地说下去。如果你对可重用代码深信不疑,我可能丝毫无法动摇你,但是你也无法让我相信,可重用代码并不总是麻烦制造者。

2008-07-07

业务偏模型

无论是面向服务体系结构(SOA),还是业务进程管理(business process management)都有一个共同根基,这就是业务模型。只有健全的业务模型,才可能使得业务愿景得以实现。但现实令人困窘:
  1. 我们很难有一个全貌的业务模型,即使努力的完成它一部分,也发现,在宏观框架,它是井井有条,颇有成就感,但扎入微观的细节,才发现那是有多么的复杂,看似冗余但却必须,这些细微差别,专家是侃侃而谈,却令旁人昏昏欲睡;
  2. 业务模型总是要超脱那些具体实例业务应用系统的,这种超脱地位是不能动摇的,自业务应用系统运转后,同床异梦就开始,总是走不到一起,对于这种混乱我们束手无策,尽管有人大呼该治理(governance)了;
  3. “敏捷”是一种时尚,不时的新的业务模式会突现一种,在竞争名义下要去适应它,但我们很快就会发现,将合并的业务模型中,这不是一件轻松的事情,要冒着弄脏数据的风险。

我一直在怀疑,那个“健全的业务模型”是否会存在。或许无论处于何时,使用何种方法,所见的只是部分,那些逻辑完全的业务模型都是一种偏模型(partial model)。如果每一个应用系统都是这些偏模型的实例,那么这些偏模型是如何“粘”接在一起的呢?或许存在一个连续的空间,某个偏模型就是某个投影,那么这个“连续”的空间是什么?!

2008-07-03

非结构化数据面临的风险

企业的数据绝大部分是非结构化数据,这些数据也面临了不少风险,援引此文的调查,这些问题可归纳为:
  • 没有具体的访问控制策略,存在滥用的风险。
    84%的受访者则说,在他们的公司,太多的员工可以访问企业里关键的非结构化数据,约76%的人表示他们的公司没有设置具体的方法去控制哪些员工可以访问具体的非结构化数据。

  • 缺乏跟踪非结构化数据的手段,易失去控制能力。
    大约61%的受访者表示他们无法跟踪哪些用户在访问具体的非结构化数据,91%的人则表示,由于错误的管理政策,以及缺乏能解决这个问题的可用的存储工具,他们的组织没有能力去确定数据的所有权。

  • 意识到这些风险,却束手无策。投入资金,亦难以见效。
    虽然IT经理们继续在存储技术上花费大量的金钱,以满足迅速增加的结构化数据,许多人都承认非结构化数据的复杂性使得人们难以掌握它。
    Ponemon 说:“我们发现,不是IT经理不愿意去花钱,而是他们真的不知道怎样去解决非结构化数据的复杂性,这是一个知识层面上的问题。”

2008-06-30

工作流与业务进程(业务流程)的区别

“Business Process”,这一概念很流行,译法也很多,有翻译成“业务过程”的、也有翻译成“业务流程”的,但我更倾向于“业务进程”的翻译。这里没有必要“玩耍”概念,若概念“业务进程(business process)”的存在有价值,必然要说出个因由。一个与其容易混淆的概念就是这个“工作流(workflow)”。那么这两者有什么根本区别呢?

首先我们谈一下工作流,每个工作流具有有限个、可以列举的工作状态,例如“开始-进行中-检查通过-结束”,而且所有的工作状态都应封闭到这个工作流内。正因如此,工作流最有效的建模工具是“状态图”,可以被理解为一个自动机。这既是实现流程自动化的工作流引擎的基础。

不同于工作流,“业务进程”不在具有状态有限的约束限制,不在要求其所有状态封闭在同一个工作流内。此时,我们所考察不再是单一的某个业务进程,而是观察业务进程与业务进程之间的交互关系(互作用关系),实现交互一个途径就是“消息”,业务进程间所交互的消息也成为我们观察的重点。因此,一般来说,业务进程建模不用关心某个业务进程内在结构,仅仅考察业务进程间的交互关系即可。

当然,为了实现自动化,我们是可以将“业务进程”简化为“工作流”的。这也就是问题,如果企业仅仅是要实现“自动化”,为什么还要实现更为复杂的“业务进程管理(business process management)”呢!

企业的信息化人员必须清楚认识到,“业务进程管理”与“工作自动化”不是一个层次的东西,不建议那些还没有工作自动化成功案例企业l就提早引入“业务进程管理”,因为企业要在“工作自动化”阶段完成一个任务,锻炼一种能力:在自动化阶段,企业不可避免的要改变一些工作模式,要设计一些新的流程,这既是目标,也是一种能力的锻炼。只有企业开始关注面对变化的工作能力的“连续性”及“可预见性”时,需要在工作方式上深挖“绩效”时,企业方可考虑业务进程管理。

2008-06-29

串联的所知

只有将所知的完全串联为一体,这个至极的简单才同构于真实的世界。

2008-06-28

服务计算:“服务”究竟是哪个服务?!

服务计算(service computing)、服务科学(service science)以及服务研究(service research),甚至Web服务(Web Service),这些的核心词汇都是“服务”。再谈大一点,从经济上,有第一产业农业,第二产业的工业,第三产业的服务业,服务业主体也是“服务”。这里并不想把问题搞乱,而是希望说明,“服务”一词在不同环境下有不同含义,本篇的落脚点还是服务计算的“服务”。

服务计算的服务有两个层面的含义。从管理层面看,服务是一个商品化的能力实体;从计算技术层面看,服务就是有自主计算能力的主体(agent)。服务彼此不同,若要相互协同合作,必然彼此需要一个约束方式,在管理层面内这种约束方式是合同契约(contract,在计算层面内约束方式是接口(interface);同样,服务要有一个依靠的环境,在管理层面内这种环境可笼统归为市场机制(market),在计算层面内服务环境不仅仅是一种软件体系结构(architecture)和某种框架(framework),而是一套社会性的信息基础设施(infrastructure)。

从这两个层面看,服务具有社会性,依靠社会的方式进行组织。就这一点,目前的SOA相关技术是无法实现的,尤其对于WS-*标准族,它仅是平台组织方式的延续。另外,还有三个服务的质量特征,我们经常忽略它们,忽视它们对技术影响。

(一)服务的可发现。社会上存在目的、形式各异的服务,如果客户可自主的选择服务,那么必然能够发现那些符合需求的服务,会有一个清单提供足够的信息,用来帮助供客户决策。这一点服务是与组件不同的,组件装配是由软件工程师来完成的,然而这个装配清单并非客户选择,而是由软件生产商决定。显然,如何清楚的描述一个服务,提供足够的可信的信息,让客户发现,并使其相信其符合自己的需求和现状,这仍然是一个难题

(二)服务的再配置。服务用来实现客户的业务要求,然而外界环境总是要变化的,与其协作的服务也许会发生变化,这必然会导致服务原有的配置(或许这些配置写在契约里了)必须发生变更,这种再配置是不能导致一个现行服务的在业务进程上中断,至少不会导致其它关联服务在业务进程上的中断,例如,旧配置的数据会过渡到新配置下。遗憾的是,就目前计算技术来看,目前再配置问题还没有明朗的解决途径,即使实现成本不菲而且也令系统更加复杂且脆弱。

(三)服务的可代替。对于一个发展不止的社会来说,新服务更适合当前的需求,需要替代某个服务,这并不奇怪,显然服务不能成为毒品,令人难以戒除。然而,这对于软件来说,的确是个问题,比如,旧有服务数据能否迁移下来?另外,新的服务也会导致服务范围的变化,系统各方力量需要重新平衡。

如果要实现服务计算,这三个特征是不能回避的。但就目前SOA相关技术的成熟状况来看, 会解决一部分问题,但不能彻底解决。

在参与某些会议时,尽管很多企业站出来声明,SOA是怎么怎么的帮助他们提高了生产效率,但我还是怀疑,因为,上述根本问题从来就没有解决。最终,企业还是构筑一个更脆弱的、更复杂的系统。我也相信,那时或现在会有人站出来说:嗨,这是因为你们的服务治理(service governance)没做或没做好。

2008-06-19

论文数量考核是为何?

如何考核科研人员绩效,这是一个复杂问题,但在当下,却简单一句,发表论文,有论文有生活。原来科研人员也是件工。

下面摘录张五常的《件工制度有所不逮(1986)》:

在件工制下,偷懒或散漫的工人自食其果,所以他们有自动自觉的生产意向。可是,件工制虽可减少监察的交易费用,另一种交易费用却会较高的。这是因为件工制虽能鼓励工人增加件数,但他们却有意向出产质量低劣的产品。所以在件工制下,审核产品的交易费用就增加了。
...
问题是,为什么目前中国的工厂,除件工以外,很少用其它的合约形式?这是一个有趣而重要的问题。
我的答案是:由于工厂是国家所有,赚钱的多少在大体上与私人的利害无关。一个厂长只能以件数的方式,而不能以自己的判断、认识,随「意」奖、罚工人,因为这样做,就变成滥用权力了!这样,只有以件数的或多或少来决定工人的收入的多寡,才能看来名正言顺,因为这是以产量来奖优罚劣的办法。但如此一来,件工之有所不逮,就难以补救了。
...


这也就难怪有人要提倡《告别灰色检索》了,太过轻易得到论文也会令人上瘾。“它要占用很多我们本应该读书、实验、打球、恋爱、休息的美好时光,让我们如痴如狂的枯坐在电脑前,淹没浩渺的数字海洋里”。“灰色文献获取的游戏,是一个昂贵的游戏;杀伤力极强,不但是指对数据库、对学校,更是对玩家自身”。“放弃了灰色检索,我们忽然惊奇的发现天地可以那么大,我们可以那么自由快乐——其实,我们原本就是这样的。”

我们如迷宫中穿梭的小白鼠,一面为了体面的生存而麻木“产出”论文,一面又发狂地去“占有”更多的论文。何时走出这个迷宫。

2008-06-14

科学与民主;激进与保守

科学是保守的,民主是激进的。前者执着于现实,后者集力于欲求。

2008-06-13

编织记忆

想象一下,一个互作用(interaction)的世界,众互作用前后地、连续(continuous)地、自然地接连起来,这个过程就是编织(kitting),这个结果就是记忆(memory)。考究一件文物,今世的人们以今世已知的,还原那久远的过去;观测一个星体,今世的人们以今世已知的,推测那遥远的存在;阅读一本书,今世的人们以今世已知的,学习那曾记录的内容。这个不断的进程,一代又一代的持续发生。我们是彼此相近,共有一片记忆,这令我们具体,而非抽象。

2008-06-07

前途、现实与自由

前途是一个令人困惑的概念,
憧憬前途,或令人自大,或令人自卑。

自大者归咎于那被高估的现实,
自卑者惜怜于那被低估的现实。

既然前途令你心扰躁动,为何要执着是哪个决定。

放下它吧,做好眼前事,珍惜已得到的,
尊重现实,自由自己。

2008-06-06

工作中的即时消息软件

据一项研究表明,“使用即时消息软件有助提高工作效率”,我很怀疑对这个结果。
据《计算机媒介通讯杂志》介绍,这项研究调查了每个星期至少工作30个小时以上的912名工作人员。这篇报告的共同作者俄亥俄州大学通信副教授Kelly Garrett说,许多人使用即时消息软件查看同事是否在线。即时消息还能够用来快速回答一些问题,而不用长时间的面对面的谈话。
经查,该论文 是《IM=Interruption Management? Instant Messaging and Disruption in the Workplace》(R. Kelly Garrett)。

疑点主要来自两点:

第一点,与平时的观察和经验相悖。沟通在工作中很重要,现在通讯工具已相当发达。困扰我们的问题已不是及时性问题和信息传递质量问题,而是沟通效果问题。我们太过协调,而忽略并行处理的效率、独立处理能力和授权范围,这也是为什么我们需要推广GTD的原因,GTD更需要个人空间。


我鼓励使用电子邮件,原因有:

  1. 是一份非正式的、相当简短的请求或报告;
  2. 有适当的背景描述,可避免一来一往的询问;
  3. 节奏控制1天单位内;
  4. 有个体独立空间;
  5. 可简掉不必要的突发“事件”;
  6. 可事后备案、查找总结;
  7. 有急事,电话或会面的沟通效率比IM高,事后可发邮件确认;
  8. 若即时确认,通过电话或会面,承诺的责任感和可信度会更高。

第二点,论文的研究方法可信度不高,它采用的是调查问卷,这是一种相当粗糙的方法,尽管很多人以此为生,没有什么新意,只是结论惊人。IM效率问题研究已久,我相信如果此类研究再深入下去,应设计可控的实验,建立对个体行为观察上。

2008-05-26

生而不有,为而不恃,长而不宰

警示:救灾用移动板房的卫生安全问题

为了临时安置四川地震受灾群众,我国正加速赶制移动板房,但2005年新奥尔良灾后安置给了我们一个警示,板房的卫生安全不应被忽视,制定相应的生产标准,建立严格的质检体制和问责体制,参见《美国新奥尔良爆丑闻 30万灾民陷卫生危机》:

飓风“卡特里娜”2005年8月吹袭美国新奥尔良后,联邦紧急措施署(FEMA)以27亿美元购买货柜和流动房屋给灾民居住,但该署在建造规格上没详列建材的卫生安全标准,制造商为赶工疑使用劣质木材和含甲醛材料,结果30万灾民入住数个月后,堕公共卫生危机,部分人出现健康问题,甚至有人死亡。

2008-05-20

让数据拥有自由

如果一堆数据,没有可用的计算来解读,无法提供信息,这堆数据就垃圾。Richard Stallman提到一个现象,这应值得深思。

如果Google今天把Docs釋出成自由軟體,讓你能夠在完全自由軟體的環境中去執行它,從傳統自由軟體的觀點來看是OK的, 但事實上,由於你可能必須透過他人的伺服器才能執行Google Docs這一類的網路型應用軟體,你便喪失了對個人資料、個人運算的掌控權,其不自由的結果與專屬軟體並無不同,雖然造成不自由的方式相當不同。

這很特別,因為就算Google把所有線上服務的軟體都自由化了,卻還是無法改變不自由的結果。


2008-05-15

天佑

79小时过去了,请保佑那些还受困的人们。

2008-05-07

民意的时间性

很有启发的一篇文章,主要有三个观点:
  1. 民意通常是非常有时间性的;
  2. 不能要求政治家或者政客不去顺应民意;
  3. 体制上得有些东西来“对抗”时间性太强的民意。

政客们也可利用民意时间短的特点来玩弄政治,玩弄民意,“朝三暮四”,一时间潮锋涌起,民众难于自查、堤防。“对抗”民意时间性太强的体制是堤防政客而非民众。

开源商业模式5个问题

Sun公司首席开源官Simon Phipps,认为开源商业模式上面临下面5大问题
  1. 开源带来的商业模式对于社区来说应该是透明的;
  2. 新商业模式应该充分体现出采用不同软件的价值;
  3. 新的商业模式当中,人所创造的价值应该更高;
  4. 针对互联网企业数据的开放上需要考虑版权问题;
  5. 对于服务的理解应该多方面考虑。

2008-05-06

户籍好比一座大坝

摘自《发改委提出2008年六大改革重点》:

“户籍好比一座大坝。”杜鹰打了一个形象的比喻,只有当农民和城里的居民所享受的福利一样时,这座大坝才可自然取消。就像上世纪九十年代初,国家大幅提高城市居民对粮食的购销价,与市场价持平,粮票亦自动消失。

在杜鹰看来,要拆除户口潘篱,一方面要对城市居民的福利实行货币化改革,另一方面要提高农民的医疗、教育及养老保障等福利。后一方面,目前正在农村推进。


“福利货币化”、“提高农民待遇”已经提了很多年了,就是没有什么实质的进展。“福利货币化”难点是那些福利不明的机构,核心是政府机构、事业单位和国有垄断型企业。“提高农民待遇”也涉及了敏感问题,“大幅提高农产品价格”和“土地自由交易”。

2008-05-05

热度比拼:“家乐福”vs.“沃尔玛”(奥运藏独事件)

先来看一下“家乐福”和“沃尔玛”这两个关键在2007年度的词搜索热度。



就上图可看出2007年度家乐福”和“沃尔玛”这两个关键词的搜索热度差别不大,但从4月中旬家乐福搅入西藏喇嘛打砸事件后,网民异常关注“家乐福”,“沃尔玛”望尘莫及。(请参看下面“2008全年”和“2008年4月两张图”


2008年全年



2008年4月



当时网上盛传要5月1日进行抵制,4月底部分地方甚至出现打砸家乐福的事件,但为何关注度下降了呢?因为“家乐福”成了要避讳要和谐的词,当然归功于GFW(中国墙)。那么“家乐福”和“沃尔玛”在5月份表现如何呢?请看下图:

2008年5月


五月四日据报道“家乐福”关键字回归国内搜索引擎

据《京华时报》报道,北京市公安局公共信息网络安全监察处值班人员解释称,家乐福相关信息大量涉及中法关系、“藏独”等字样,可能存在涉及不符合相关法律法规的内容,所以被屏蔽了。

母鸡的免责声明

尊敬的要吃鸡蛋的朋友们:

在你开始吃这个鸡蛋前,请注意:

本母鸡已放弃孵化这个鸡蛋的权力,对随后所可能发生,因这个鸡蛋噎住气管而导致的死亡,本母鸡一律不予负责。

祝,吃得愉快!

母鸡敬

2008-05-01

数据库存储了多少非结构化数据?

2005年,据Forrester调研机构估计

Forrester estimates that more than 90% of all business data in enterprises is unstructured, but only 5% of unstructured data is stored in databases.
(企业90%商务数据是非结构化的,其中只有5%的非结构化数据存储在数据库里)

2008-04-24

是分散风险?还是发挥资源集中的优势?

曾和朋友聊天谈起,凡大讲要进行科学管理的肯定不讲究科学的方法。

今天就听一位领导谈“创新团队建设”,当然这不是新闻,估计当前各高校中几乎都在搞创新团队建设吧。国家自然基金委的“创新团队”号角一吹,谁还敢不吹,风风火火吹九州啊。

搞创新团队建设,主要内容还是搞创新团队的评奖和评估,走的还是臭名昭著的“以评促建”的套路。从所谓的理念上看,创新团队建设一个突出目的:将有限的资源投放在有潜力的地方

然而,一个客观情况被忽略了,所说的情况就是:科学研究是一种高风险活动。科学研究的失败就是研究的代名词,中文的研究的“研”有“反复研磨”之意,英文的“research”有“re-”的“反反复复”的含义。既然承认是高风险活动,为什么投资上,不讲组合投资,却评出一个创新团队,造出一个篮子,将所有鸡蛋放在这个篮子里呢?

由“如何捉虱子”声明到反“藏独”声明

南桥先生太有才了(此处为褒义词),推荐阅读《外交部如何捉虱子》。此文幽默睿智,介绍其女儿所在学校的一份声明,作为校方它是如何应对“长虱子”传闻的。

联想外交部,为啥总处于被动地位呢?!外交部的工作思维该换换了。

2008-04-22

谨慎对待“评估”

“评估”与“计划”都是管理常见的工具。“评估”所引起的问题并不像“计划”那样显著,《英国科研评估浅析》一文简要谈及英国的科研评估(RAE)体系所存在问题和改进的方向。几乎任何评估都会有很直接的利益目标,即“英国的科研评估是根据研究质量的好坏来决定高等院校年度研究经费的分配方案,更加有针对性地加强专业人员的培训和基础设施的建设,促进科研工作的良性发展”。

该文指出:

  • 评估结果虚高。...事实上是因为各院系已经懂得如何去适应这种评估,他们只是拿最好的方面去评估,结果自然是整体虚高...。
  • 基础研究受影响。科研评估似乎也打击了周期长的基础研究。...不可能让他们在短期内完成高水平的成果,因此发表方式也出现短期行为,研究人员的职业失去它们的魅力。
  • 出现片面追求评估指标的倾向。科研评估的影响对大学产生的压力越来越大,...,忽视教学,对参与社会经济组织、地方或区域发展的研究不感兴趣,而片面追求把发表有科研著作的人员聘为大学教师。
  • 科研资助向少数高等院校集中。该项研究表明,没有任何证据证明这样的集中策略是正确的,相反它部分地造成了众多大学院系的关闭和地区间的不平衡。


相对“偏执”,“评估”具有理性的味道,何况自古就提倡“三思而行”。然而,当今创新成为时尚,创业得到社会的鼓励,在此潮流下值得玩味,若以“评估”的眼光看待“创业”,是否还会有“创业”的成功呢?

2008-04-21

陈竺誓将医疗体制二元化进行到“底”

陈竺在中国中西医结合学会第六次全国会员代表大会指出

在卫生部正在研究制定的“健康中国2020”战略规划中,中医药学和中西医结合是一个重要领域。希望中西医结合学会在继承创新传统医学、丰富发展现代医学,特别是促进中医药学现代化方面发挥应有的作用,从而为构建十七大提出的“人人享有基本医疗卫生服务”这样一个目标做出应有的贡献。


“创新传统医学、丰富发展现代医学”,好家伙!传统医学要创新(第一次听到),现代医学要发展,真不知道卫生部如何驾驭这两部车头。它们都要烧白花花的“银子”,互相还要掐架。靠传统医学吃饭的人们要活路,但现代医学天生地排斥传统医学的方法和理论,认为传统医学是文化不是医学,因为现代医学为了病人的安全、方法的可靠,只接受严格实证过的结果,要临床要双盲。

陈竺为事业不怕骂,这是卫生部的事。但老百姓只是关心,什么时候才能享受合算、安全、可靠的医疗服务呢?百姓也怕啊,就怕遇到不要命的,乱作为!花的可是百姓的血汗钱啊。

计划的宿命

始立于高效率之命,却结无效率之果

可叹!

2008-04-15

真佩服路易威登(LV)的傲慢

尽管个人认为在西藏问题上“抵制法货”不是一个好策略,而且也不赞同,但路易威登(LV)社会公关专业人员的反应却令人气愤:

本报记者随后联系了LV上海总部,公关人员表示LV只是LVMH集团的一个品牌,对于网友的批评记者应联系法国总部。但公关人员表示,网友的反应不会对LV产品的销售带来影响,毕竟产品定位是高端人士,而在网络上发帖声称抵制的只是普通的消费大众。


如果LV不想表态,回避话题的方法有千百个,但不幸LV却选择了最刺激的一种。我彻底无语了。



后记:4月17日,路易威登发表澄清说明
无论是本公司还是本公司的主要股东个人,我们从不支持任何与中国政府和中国人民利益相违背的组织与行为

2008-04-11

局限的理性

全面与片面、绝对与相对、静止与运动,除了体现辩论的技巧外,这些能有多大能力表达实际问题呢,何况还要给出解决方法。那些超越自我已知的正确、错误的大旗在头顶飞来飞去,除了热闹,还有什么价值呢?!现在看来,令自我谦慎,将自己的理性局限于自己的已知中,这是多么的艰难啊。

2008-04-10

到底谁“没有功劳有苦劳”?

读了茅于轼的《生活中的经济学:美国人如何看待“按劳分配”》一文,深佩其摆论据说道理的能力,忽来悠去的。


【1】在我国,按劳分配中的“劳”,大家都认为既包括体力劳动,也包括脑力劳动。但分配是取决于投入劳动的数量和质量,还是取决于劳动产生的效果,在这一点上看法似乎是有差别的。而这两者有时的确是不同的。【2】对于竞争性的商品而言,价格最终将趋近干成本。把这个理论推广到劳动这种商品,就会认为劳动的价格(或报酬)【取决于劳动的数量和质量】,包括劳动者维持家庭、生儿育女的开支,以及培养此劳动技能所必需的教育开支,【而与劳动所产生的效果无关】。【3】所以“没有功劳有苦劳”的人也应得到同样的报酬;而创出的价值大大地超过所支付的劳动价值的部分就成为没有原因的财富,谁得到这一部分谁就有剥削之嫌。【4】在美国,报酬是明确地取决于劳动创造的财富而不是投入劳动的成本。歌星凭他的歌喉,影星舞星凭他们的相貌身段,都可得到几十倍于常人的收入,这些收入与直接投入的劳动价值无关,但没有人说他们是剥削。【5】经理们的高收入也与支付的劳动关系不大,而主要与他们的创新精神,在不确定条件下做出决定并敢于承担风险的勇气以及他们的运气好坏有关。【6】这样一种分配观念有利于进取革新,提高社会的生产率,但显然并不公平。【7】好在美国人已习惯于这种是非观念,过高的收入又有累进所得税加以限制,所以这种分配原则还会继续下去。
这里有些疑惑来供讨论:
  1. 茅文中讨论报酬究竟是劳动价格?还是劳动力价格?或是劳动力市场上的价格?
  2. 劳动力市场上的劳动价格是否遵守供需关系?如果不遵守,那劳动力市场是否存在?
  3. 现在社会突出报酬不公平问题是由市场造成的,还是现有体制或制度造成的?如户口、医疗、社会保障、教育、垄断企业、政府和事业单位福利等突出问。
  4. 在【2】中苏即已承认“劳动的价格(或报酬)取决于劳动的数量和质量”,究竟凭什么理论或研究得出“与劳动所产生的效果无关”的结论,难道数量和质量不决定产出的结果吗?
  5. 在【3】中谈及“没有功劳有苦劳”问题,怎么会存在“有苦劳没有功劳”的现象,究竟谁将“苦劳”的“功劳”剥夺走了?!
  6. 在【5】中经理们的劳动力风险究竟起来什么作用?如果经理们没有实现自己允诺的预期,他在这个市场上会有何表现?眼光放在成功经理人上的同时,是否还要关注那些失败的经理人们的遭遇呢?
  7. 在【7】中税收的在劳动力市场的作用究竟有多大?


茅文最后有个结论:

劳动报酬并不取决于劳动的成本,而取决于它所创造出的价值。然而这引起了社会公平问题。

请问,当今社会公平问题究竟出在“取决于它所创造出的价值”还是出在对劳动所创造的价值的评价不公上或保护缺失上。

控制如毒品

为什么要吸毒?为了High,一开始是为了填补某种空缺或抗拒什么,到最终难以摆脱的生理欲求。“控制”也和毒品一样容易让人上瘾。原本就有很多行为或活动并不会立即见效,但在控制中人们对效果反馈却越来越急迫,预期越来越糟糕,频频出招,余波未消,新乱又起,混沌一体。

直面平静也是需要智慧和勇气的。

看《政府对财富的强大控制是个危险信号》有感。

2008-04-08

SOA终究是一场梦: SOA? WOA?

IT的革新是需要消耗大量的资本,资本要充当炮灰的,要扮演技术试验的小白鼠。为了让资本们能够心甘情愿的去当炮灰,这需要要创造一个又一个新概念,再编织一个又个梦,每一个都是似真似假。最终,最真实的还是历史。

SOA就是一场梦,它还在进行中。让我们回顾一下历史,大约在上世纪八十年代末到九十年代间,有一个非常流行的词汇,它就是企业流程重组(Business Process Reengineering),目的通过流程分析及改造,令企业各流程变得柔性(flexible)适应外界变化。在这个潮流内,尽管企业投入巨资,但效果并不明显,不但没有使企业的信息系统提高灵活性,反而建造一个又一个“烟道式”系统。当然也有惊喜,诸如工作流技术、组件技术以及电子数据交换技术等信息技术却得到了快速发展。

“烟道式”系统是一个比喻,在盖楼时图纸必须预留置烟道,完建后若要调整烟道,这个成本极高。可以想象一个场景,若有两个部门各自有一套办公自动化系统,各自都积累了相当数量的内容(如文件、纪要),也有相当数量的产品型号进行开发。如果将这两个部门合并,我们有两个方案,第一个是统一为一个系统,第二个是各自用各自的。对于第一个,文件各属性的导入、各流程的合并以及各访问控制规则的合并,就我们现有的计算技术基础,这足够令一个主管发狂。幸亏还有第二个方案,各自用各自的,走集成路线,原系统保留,各自有个接口,利用门户或交叉搜索。第二个方案所体现的就是SOA的卖点,尽管思路可行,执行上技术风险是可能,但它不是一个经济的方案,因为隐藏后期的维护成本,这是一条集成再集成的路。

SOA说我们除了接口和门户,我们还有服务编排,它可以重用服务组件,减少集成的成本。遗憾的的是服务编排(orchestration)并没有从实验室的草稿中走出,更没有见到成功范例。

历史总是真实的,回看SOA发展,与其说是面向服务的架构(service-oriented architecture),不如说是顺应了Web发展的大潮,这段称为面向Web的体系架构(WOA,Web-oriented architecture)更为合适。

2008-04-03

又解禁了

刚得知“伟大的防火墙(GFW)”在4月1日解禁了Wikipedia和blogspot,虽然不知道这次解禁的原因,但封封解解的多次,也习惯了。

究竟谁知道“正确的方向”?

正确的研究方向是从哪里来的?》一文发了问。这个问题不小,我也来问问自己,答案究竟是什么?沉默良久,我想这个问题的答案是没有的。

如果“方向正确”的含义是指:按这个方向的路走下去,你就可以得到一个正确的结果。就这样看来,选何方向的决策是存在的,因为只要有决策就有正确与错误。真的这样吗?

如果研究工作是对未知的探索和理解,那么就有不确定的东西。这不确定的东西又是如何拿来做决策的选择呢?!经常会遇到这样的境况,环绕四周,除了刚踏过的脚印还莹些闪光,周围一片漆黑。自大一些,回头看看走过的路,不禁自我评价一番,这条路正确吗?左看看,右望望,两侧还是一片漆黑。

研究方向只有一个,走下去。结果只有一个,选择只有一个。问题的方向就是眼前所看到的,就这一条,珍惜自己走过的每一步,将这点点滴滴积累起来,相信生命累积起来的直觉。

2008-03-30

为什么知识共享是一种幻想

当今互联网大潮下,“共享”是非常有魔力一个概念,对“知识共享(knowledge sharing)”的渴望也是自然。但“知识共享”终究是一个梦想,而非解决现实问题的手段。这是为什么?因为人们总是无意或有意的忽略共享它是有费用发生的,而且比想像的要多。

让我们看看在一个人想要共享时会发生什么:
  1. 共享这个活动是要消耗时间的;
  2. 在做共享时要面临一些列的决策,
    共享在哪?为谁共享?怎样共享?需要限制吗?他人能够得到吗?
  3. 共享后总有一些恐惧或担心,
    有意或无意的错误被发现怎么办?是不是共享的太多?他人的认可?
  4. 好心有时会面临尴尬,不是所需的?还不够?或看不懂?
任何共享出来的东西并不会保持原来的那个状态,会随时间而变得更为糟糕。所以将这些共享出来的东西维持在一个良好的状态,这是非常难的,也要耗费很大。

如今知识管理在国内开始热起来的,尤其在一些大型央企内,知识管理继项目管理后也成为企业内管理创新的一个突破口,自然也要大谈知识共享,上传资料,建立考评。这种粗糙的管理会有用吗?肯定不会,技术骨干的负担只会变重,资料的质量会更水。

如果共享这么麻烦,究竟什么维持了知识的延续呢?使得人们工作可以彼此进行合作。这个答案就是实践(practice)。然而不幸,这种管理是一种非常细腻的事情,以后再谈。

2008-03-25

传道

所谓传道:在某日,师者对我说,我与你走了有一段路程了吧,就此为止,下面的该你自己走了。

可怜,总有人认为人才是被培养出来的,有意无意的忽视人才是自己成长起来的这一种事实。

“将心比心”只对“相似者”有效?

这篇介绍的一项研究揭示:原来“将心比心”只对“相似者”有效,“换位思考”却是难以换到“异己者”的位置去思考,因为你我的脑子根本就罢工不去思考。

呵呵,对布道者来说,这是一个不幸的结论。

2008-03-24

大跃进,自然科学基金委开始集中讨论接收申请

显然,这又是一个拍脑瓜的政策,参见《化繁为简 井然有序——2008年度国家自然科学基金项目申请集中接收工作侧记》。

基金委把集中受理改为集中接收也算是相应制度创新的一种举措吧。

2008-03-20

决策是什么?

今天与朋友谈起博弈论,坦白说,直觉上我不是特别相信博弈论,认为它在个体理性决策上的假设太过纯粹。如果说博弈论是一组决策的寻求最优的特殊组合的话,那么搞清楚决策是什么显然很有有意思。决策是为了获得最大利益或者减少损失,还是其它,或许只是减少过程上所累积的不确定性。

审核,你有多大作用

人民日报:学术规范从论文审核开始》,其观点按文所述就是“效仿专利申请审查过程中的『查重』环节”。不禁问,审核的作用有这么大吗?何况,众所周知,专利的垃圾比率要论文还高。

作者是天真,还是不愿面对真实问题?

如果非要一个起点,那就从打击论文抄袭,作假开始。形成“伸手必被抓”的“畏惧”会更有效。

2008-03-19

联想啊,原来我自作多情,令人伤心

看到这篇对X300的差价的解释,心情由原来的无语变为愤怒,联想啊,你连社会公关都不认真做。


对于消费者关于定价质疑,联想大中华区商用事业部总经理仪晓辉表示,大部分电脑产品在不同国家都会有不同价差,这与一个品牌在区域市场不同的定位有关,也和劳动力成本等因素有关。仪晓辉强调,中国消费能力已经不比过去,国内有消费能力的人群越来越多。更何况Think几十年积累了大量的发烧友,对于 X300的销售前景,联想很有信心。


按上面的逻辑倒退:美国劳动力比中国劳动力贵,中国人比美国人有钱,购买力强,中国人更愿购买奢侈品。但至少有一条说对了,“这与一个品牌在区域市场不同的定位有关”,联想是不是把像老鼠一样把目光死死盯在政府采购上了。

群众虽然没有政令要求你如何做,但脚还是长在自己身上。

面对危机时,请信任群众

同样的错误总是不断的发生,由于信息封闭,非典导致一场社会危机,现在又遇西藏拉萨事件,情况不好。政府总是抱怨西方的媒体和政府偏见,小部分搞奥运政治化,为何不首先自省其身呢?

这里有一个博文评论

But more directly it's hard because of the attempt by the Chinese authorities to lock down every possible information source. It will come as no surprise that I don't think closing Tibet off from the rest of the world is a good idea - or indeed a good sign.

If the Chinese authorities were telling the truth about the violence allegedly carried out by Tibetans, then having external and independent observers is precisely what they would want. The fact that they don't means that their own stories must be viewed with suspicion, especially since they flatly contradict videos and images that have been smuggled out. Moreover, the fact that it won't even trust its own people - who seem inclined to condemn the Tibetans as "ungrateful" anyway - to judge events, and has blocked practically all external news sources, is yet more evidence that there is a massive coverup underway.


自古就有一条慧言:堵不如疏。通了也就自然融了。面对危机时,请信任群众。

2008-03-18

ThinkPad X300, RMB34999! 彻底无语

一直不清楚联想要如何面对ThinkPad在中国的市场,这次新推X300,按照报道

低配版售价24999人民币,高配版价格高达34999人民币,而国外对应机型价格分别为2476美元和3000美元(分别折合人民币17548元和21262元)。

应值得关注苹果公司新推出的全球最薄笔记本MacBook Air国内定价是16988元
听说,杨元庆这样说:

好产品就应该是高价格,如果定价太便宜,用户可能会觉得产品不好。



咱也知道,国情有特色,政府采购很凯很可爱,但也不能这么狠啊。

2008-03-16

究竟要怎样辩证?

当今社会存在着很多古怪的二元现象,城市户口和农村户口,中国传统医学和现代医学。中国传统医学简称中医,现代医学由于历史原因被我们习惯称为西医。中西医问题消耗了不少社会资源,越来越多的人提倡:中国传统医学应退出中国的医疗体系,建造一个统一中国现代医疗体系。这也导致了现在的中西医的争论。

张伯礼院士在最近一次访谈中认为“让中医退出医疗体制是无知表现”,他的论据:

中医学主要的构成有几个特点,一个是它强调天人合一,人和自然要协调,人要适应自然。这是中医学一个非常大的观点,我们简单叫天人合一,翻译成现在的话是人和自然和谐发展,它对人体不是说注重在某一个脏器的解剖,这个脏器是由什么细胞构成的,具体结构是什么,而是关注整体的脏器的功能是什么。

另一个特点是人体脏器之间是怎么联系的?怎么互相影响的。它强调了人是一个整体,强调了人体的各个部分都是围绕着整体服务的,各个脏器有自己独立的功能,但是之间又互相协调。

第三个特点它强调的是整个中医学要辩证论治,根据每个人具体有什么表现,来采取针对性的药物来治疗。因时、因地、因人而治,具体情况,具体分析,具体治疗。


第一个特点太复杂,对于这些有关“和谐”问题以现代的科学认知层次还无法搞清楚,就不在这里提了。第二、第三特点实际上就是一个意思,就是要注意联系。然而,想问张院士,如果系统中个体还没分清楚,个体间的联系是否能表述清楚呢?

不错,现代的科学还原论是主流,将现实存在的复杂系统还原成逐个的抽象个体,分析抽象个体间的关系,建立模型,最后再用模型回到现实解释那个复杂的系统。是的,只要使用还原论,这就是承认对复杂系统的全局的“无知”,然而这种“无知”却是谦慎的,局限或漏洞就清清楚楚的写在还原之初的假设上,清楚的告诫后人。

如果有人开始就宣称可以认清所谓“全局”,这难道不是哈耶克所指地“无知的狂妄”吗?张院士,难道现代医学不研究联系吗!当然,现代医学也是要研究系统,研究个体与个体间的关系,研究个体在系统中表现。但现代医学还是与中国传统医学的研究不同,前者是承认无知的。

如果对于两种“无知”状态,一种是“无知的谦慎”,一种是“无知的狂妄”,我想前者比后者要可靠吧。

2008-03-15

类聚定律

张五常在《讯息费用与类聚定律》发现:信息费用高会导致类聚现象。

例一:卖笑女子相貌平均:那是在某五星酒店的咖啡厅内,卖笑欢场女子的相貌一律不俗,没有仙女下凡,但一律有七八十分,平均得很。我的解释,是好此道者只知约价,但小姐们没有把价格挂在胸前,如果相貌水平不类聚,不好看的卖不出去,仙女下凡的要亏蚀。

例二:生产类聚。劳工与技术人材相聚在一起,找工、转工、聘用等都较为方便。更重要的是合作与竞争没有冲突

例三:展销类聚。可以减少顾客的找寻费用,而主要是那些单为选购某类物品而来的顾客


然而,《生产的类聚与不类聚》强调解释不类聚现象则困难的多。

2008-03-14

白芳礼老人还在

中国的很多评奖都了官味,总是盯着时代的所谓主流。引述这篇文章里的一段话:

“不凡的业绩”与“感动中国”还是有些微妙的差异的,“感动中国”不是先进事迹评选,它应该更倾向于扎根于普通人群中的人性闪光。

再引一位不知名网友的评论:

白首赤子心
芳华满乾坤
礼泽千万人
万古永长存
岁寒见精神

土地私有化从“土地指标换户籍”开始?

看了《代表建议允许农民工用土地指标换城镇户籍》一文,闻到了阳谋的怪味道,心中阵阵刺痛:

全国人大代表、杭州市人大常委会党组书记于辉达提出建议,“以土地指标换城镇户籍、换住房、换社保。”他认为,要实现农民工与流入地城市城镇居民“同城同待遇”,就应推进农民工市民化。

作为市人大常委会的官员总是亲身体验要解决一些社会关系问题,应该对当前社会的主要矛盾有自己的感悟吧。现在很多社会经济问题的都盯上了土地资源分配问题,无论在农村还是在城市,土地产权要自由交易,起码土地使用权要自由交易,核心就是土地私有化。

姑且不讨论土地自由交易是否有价值,我们就假设要做这件事。一个关键问题马上就砸过来,如何从现在土地制度过渡,“和平”的方式就是农民从政府手里“购买”,这也就涉及了土地初始定价。农民开始是没有这么多的资金,只能依靠低息贷款,使用优先权购买集体名下的土地,这个价格称为初始价格,农民在购得土地后,有两条路要选择,或可在更大的市场长进行自由交易还清贷款,或可继续收购土地整合土地资源进行农业生产。对于第一种选择,农民在市场上的自由交易价格,这个价格一定要大于政府的初始交易价格,产生的差价是对农民前半生的补偿。“暴力”方式是什么?或许就是利用国家机器使得农民丧失土地的使用权变为劳工,原集体变为法人。

至此或已显然,走“和平”方式,风险不小。在集体所有制下,农民已大量“占有”土地使用权,人越多,越困难。“城镇化”,“土地指标换户籍”,这些方式或许都是让农名失去土地的温和方式。在温水里煮蛙,虽然时间长,但至少平静些,这种嗜血的平和对部分人来说是必须的。

2008-03-12

数据存储的十条经验

在Grid Gurus上,总结十条使用数据的很有价值的经验,翻译如下:
  1. 多数情况下不会立即就要全部的输出数据,甚至不用考虑为了检验而将数据从网格移到桌面。
  2. 重建一个巨型文件的计算时间量是很大的。
  3. 应用多线程来进行读写数据的不是一个轻松的方法。
  4. 从网络移动数据需要花费很多时间。
  5. 同一时间仅能一个进程以读写方式打开文件,一个大型文件会比几个单个文件阻塞更多的修改操作。
  6. 完全备份文件是非常困难的。不能仅仅将复制到磁盘的内容烧制成DVD或复制到磁带,一旦需要恢复某个文件,这将耗费大量的时间。
  7. 存储设备上的文件碎块会越来越严重,这会导致数据寻找时间的增加。
  8. 可以不再使用内存映射文件。
  9. 永远要对大型文件进行校验。
  10. 最后,如果已经适当地将任务分布在网格上,不应当使用如此大型文件。

2008-03-08

集权化的代价

这里有一段数据:

西汉时期,7945人供养一个官员,隋朝官民比达到1∶3658,唐朝是1∶3927,元代为1∶2613,明太祖时这一数值为1∶2299,清康熙年间则升至1∶911——这一系列历史数据在政治研究者的论述里,套用现代用词被统一冠之为“吃财政饭”。往后延续,这一比例越来越大,1949年是 1∶297,1978年为1∶50,1996年则为1∶30。

2008-03-04

折腾人啦,要折腾打到十三级

教育部启动高校教师评级》,不管效果如何,至少有两个趋势可以肯定:(1)级别多了,意味各级别就要有相应的管理,自然管得人就多了,自然要有对应的管理委员会啊,这能解决不少就业岗位;(2)相对着,被管理者教师们也有了明确的奋斗目标,为“升级”贡献终身,日日打“升级”,没办法,在评级中“公正、民主”的原则就是“妥协、关系”的代名词。


“人生如牌”,无论何种花色,就有十三张,大小王通吃你。

Understanding Contemporary China

see it here

2008-03-03

税收征缴制度:生产型?还是消费型?

参看《许斌:改革税制,到了刻不容缓的时候》:

为什么会在机场里存在免税商店,可以向出国者销售免除消费税的商品呢?当然不是要送给购买者告别礼,而是根据税收原理:收税建立在提供公共服务基础上,购买者都要出国了,可能享受不到销售所在国政府提供的公共服务,所以不应该收他的税。
...
为什么GDP崇拜弥漫中国、为什么地方政府实际上的头等大事不是扶助民生而是招商引资呢?便是因为消费税为最主要的税种,掌握了征收消费税的主动权就掌握金库的钥匙。
...
在征收高额税率的行业,如烟、酒等,国内的地区封锁呈现出越来越严重的局面,在税制不公平的前提下,你不能说这样的行为没有现实意义上的合理性,反而是强调市场经济、统一市场成了“纸上谈兵”。
...
最重要的是,只有实行消费型税收征缴制度,才能将地方政府的利益与公众利益牢牢捆绑在一起,因为主要税收来自于公众消费,而公众是否更乐意于消费,则取决于收入状况、对商品的满意程度,以及对区域生活环境的满意程度。
...


2008-02-28

困惑的Semantic Web

语义网(Semantic Web)设想提出已有十年,在Web 2.0热火朝天的时候,站在前沿的人们开始思考Web 3.0的特性,目光投向自然地Semantic Web。现在Web页面仅是为了显示,并没有确切的内容结构和语义说明,正因如此,机器是无法理解内容的,机器可理解的含义极度缺乏。一个出路就是标记内容,通过附加信息,勾画出内容的结构,这些代表的技术如RDF和Topic Map,以及micro-format等。

由于信息种类多样,应用场合各异,这些标记技术都赋予极大灵活度,即使语义可以标准固定下来,但语法也争奇斗艳。目前,有合用的理论或技术将这些语义化的信息聚合或编织在一起吗?有实现跨应用的技术准备吗?很遗憾,答案是:没有。

信息的不确定性:无为亦有为

我们总是千方百计的获得更多的信息,减少决策的风险,令自己尽可能的活动更大收益。确定的信息使个体可以获得可靠的决策,而信息的不确定性本质使整体获得一个稳定的结果。

试想甲乙二人共一事,甲乙能力相近,事自身风险可以忽略不计,若甲不采取任何行动,乙会有何行动?尽管可能种种,但乙独揽此事独享其利的可能性极小,为何?原因就在于乙不知甲为何采取“无为”之策,无论君子行为还是小人行为,最“安全”的方法就是与其“共”事与其“分”利。

在管理上,“无为”是否就等价“放任不管”?更具体点,在自由状况下,如何避免有人得出可“肆意行之”的风险?

某人的不作为并不是说他没权利做。

2008-02-27

此生意美今时生
残花生盎路边争

2008-02-25

立足

在你的立足处深挖下去,一定会有“泉水”涌出,

别管蒙昧者们叫嚷: “下面是地狱啊!”

—— 尼采

教育管疯了

不知道教育主管部门被触动了那根神经,前年普及交际舞,今年普及京剧,也不知道后年是什么。

现今人才啊,白菜价,同质得厉害,物以稀为贵,白菜扎根红头绳,那个年代过去了,这可谓功劳一年。以前多累啊,人才难求,现在呢?嘿嘿,一句话,“干不干?不干!快滚,后面有的是排队的”。

人才同质了,也同性了,人人都“同志”了,面孔也冷漠起来,掖着藏着的,怕那点东西给抢了去。

“同志”久了,有些腻歪,毕竟根子还是那根子啊,世界还是那个两性世界啊。一看到异性,那个内心波澜,但碍着面子,要言顺,大喊:“要创新啊”,顺时搂了一个进了屋内,关了门。

创新个啥内容,屋子里那点事,似是而非,谁也看不到。


-----

人才不是教育出来的,自己成长起来的都是人才。

2008-02-24

实践社群

Etienne WengerJean Lave1991首先提出实践社群(community of practice)的概念,按照Wenger(1998)的定义,凭借可以一起做的事情,以及凭借通过互相参与这些事情而学到的内容,社群的成员被互相联系起来。“被共享的实践”是实践社群所特有特征,这与兴趣群体和地理上群体有所不同。实践社群因那些困扰人们的事情而发展,他们的实践反映了成员对于“什么是重要的”问题的自主理解(Peltonen & lamsa,2004)。一般性的社群(community)有三个要素:人、地点和事情(Lesser et al., 2000)Wenger(2000)谈到在社群内存在一个关键性的活动,即关于边界对象(boundary object)或事情的管理。事实上,实践社群到处都是(Peltonen & Lamsa, 2004),存在于任何组织内,Wenger(1998)也认为实践社群可以在(1)业务内;(2)跨组织单元;(3)跨企业等处被发现。

对于知识是组织一项关键资源的假设,无论任何组织,实践社群对于组织功能运作是重要的,一个有效的组织是由一个实践社群的群集(constellation)组成的,群集内各实践社群彼此相互联通,每个实践社群实现了组织竞争力的某些具体方面(Peltonen & Lamsa, 2004)Wenger(1998)认为社群具有以下作用:(1)交换与解释信息的节点;(2)以“鲜活”的方式保留知识,与数据库和手册不同;(3)掌管竞争力使组织可以刀尖上生存;(4)标识的源泉(home for identities),尤其在海量信息下,标识可以使我们挑选出“所需注意的”、“所需参与的”以及“所需回避的”。PeltonenLamsa(2004)相信实践社群观点可以使知识生成的理论化,将重点转移到学习过程的社会纬度。

在不同职业群体,即使同样知识的使用方式也相当不同 (Leonard & Sensiper, 1998)。实践社群的知识,会以隐性或显性的形式,交错地分布在集体的和成员们所共享的成果(artifact)中,而非被个体所持有或分割(Hutchins, 1995)。当两个社群的实践和“knowing-how”不同时,认知障碍就会发生,并且使分享“knowing-that”变得愈发的困难,即使不同实践集中在一个组织内同的情况也是这样(Bechky, 2003)。对知识的显性化和编码并不能解决这个问题(Duguid, 2005)。关于社群的所有权标准的伦理考虑可能会决定着人们是否可以共享(Duguid, 2005)。如果我们想理解个体在分享知识的能力(capacities)和动机,不应仅瞄准知识,还应注意所形成knowing-how的社群。

个人可以参与所在组织的知识生成进程或通过自己的知识生成进程获得组织所需的技能或者使自己认为所必要的技能。ChenEdgington(2005)研究表明当组织的任务与个人能力相一致时,才能达到一种有效的分配状态:组织目标得以实现,组织的竞争力得以加强,期望员工因其工作贡献与自己的能力协调而得到满足。

Duguid(2005)认为实践拥有认知和伦理两个纬度。一方面,“哪些是可以被有意图地共享”的问题是困难的,这种关于共享的被动障碍可以作为实践所承担的认知要求,另一方面,“哪些是可以共享”的问题也是困难的,局部社群可能不愿共享其所知道的,或者可能不愿隐藏其所知道的,这种主动在共享上的限制可以被作为实践所承担伦理要求,这些要求将“能/不能”与“可以/不可以”区分开来(Duguid, 2005)

对于实践社群的相关理论认为(Duguid, 2005),知识获取不是源自个体头脑的认知储藏,而是源自社群内的实践流。共享的意愿和共享的能力是不同的,这意味着人们不得不从事相似的或已分享的实践以能够分享这些实践。实践社群理论指出了一个不可见的边界,这是由实践形成的边界,将不同知识网络(knowledge network)区隔起来。