2008-10-30

信息本无价,只不过发生了一些费用

武夷山老师介绍了一篇论文,该论文谈及了几条的信息悖论。我仅看武老师翻译的部分,还未抽时间看原文,笼统想来,这几条悖论都可归于“信息到底有无价”这个基本命题上,这一命题变化,其它命题的讨论也都会有所影响。

我的观点:信息自身是没有任何价值的。在日常生活中,我们会“感”到信息有一定价值,这是因为,我们总是『期望』,或感到存在一种机会,获得那些又及时又正确信息的机会。我们相信凭借这些所『期望』的信息,决策的『可靠性』会得到提高。然而,现实中,获得这些所期望的信息,我们会观察到,这个过程的确很费劲,耗费了一些时间和东西,这些耗费主要发生在对信息的『选择』和『传递』过程上。除了那些因为支付不起所发生的费用而放弃获得信息的情况,那些想得而得不到的信息,只是期望,这类信息实体不存在,就如当期彩票的票号。

总之,我们在使用信息上存在『选择费用』和『传递费用』(信息产生费用是否存在,这就是另外一个极有意思的话题,或另作博文讨论)。降低这些费用,这自然也就成为组织改革和信息技术发展的动机之一。需要再说明一点,降低『选择费用』一个有效途径就是更为丰富提供『信息』的『背景信息』,换句话说,产生信息的组织要更公开、更透明,提供更多的背景信息,信息检索技术要能够提供更为丰富背景信息。

我想最近就有一个很典型的案例:政府最近针对一些谣言,所发布了『辟谣』的信息,然而这些信息没有起到作用,为什么?!『信息』的『背景信息』与群众『选择信息』费用之间的关系,这应是个原因。

2008-10-27

一个梦想:内容可以自由地移动

Mark Shuttleworth最近谈及可用性时候强调,用户理应关注的是内容(working with your content),活动的重点不是那些用来打开内容的各种应用程序:
We need a consistent experience across GNOME, KDE, OpenOffice and Firefox so that content can flow from app to app in a seamless fashion and the user’s expectations can be met no matter which app or environment they happen to use.(大意:应该让用户拥有一种连贯的体验,内容可以无缝的从一个应用流到另一个应用,用户的体验与何种环境何种应用无关)

内容在应用程序间可以自由的移动,可以方便的整合和分拆,这便是『内容的移动性』。这些要求,如果说是某个系统的建构目标,不如说是整个产业的挑战。问题复杂性超出想象,如果你熟悉剪贴板的『复制/粘贴』,如果你熟悉TeX系统的Tex Weave和Tangle,如果你熟悉Windows系统的OLE(如在Word里嵌入电子表格),那么你可以回想一下它们带了的方便和烦扰,如果你是软件设计师,可以回忆一下它们的实现机制。或许此时,你会感到它的复杂。

内容移动性,这一问题的解决方案,似乎超出目前的技术水平,这不是软件架构的接口问题能够根本解决的,更不是单纯开发工作量投入不足问题。在理论上,问题可归为两个:
  1. 内容的实体变化多样,如何标识内容存在和其实体存在;
  2. 内容常脱离实体(即所谓的灵魂出窍),这便涉及了内容状态与实体状态保持及一致性问题。

函式程序之美

偶然从这里看到一段Haskell程序,用来求解由任意两个三位数乘积组成的最大回文数(palindrome),摘录如下(该程序版权属原作者)。这段程序是相当的简洁、美丽绝伦。

euler4 = 
   maximum [a*b | a<-range, b<-range, palindrome (a*b)]

range :: [Int]
range = [100..999] -- three digits

palindrome :: Int -> Bool
palindrome n = 
    digits == (reverse digits)
       where digits = show n

2008-10-26

金融危机与风险管理系统(续)

在上一篇博文《金融危机与风险管理系统》 提到“我们总是制造、选择那些乐意看到的。想得到什么,就输入什么。结果却成了,输入的是垃圾,输出的是垃圾。”

今天看到一则新闻:美联储前主席艾伦·格林斯潘(Alan Greenspan)在美国众议院政府改革与监督委员会举行的听证会上作证时表示,数据不充分是这次金融危机爆发的原因之一:
格林斯潘在今天的听证会上表示,向计算机系统输入的数据都是垃圾。
...
格林斯潘说,金融服务机构的决定基于数学家和金融专家的缜密分析,并得到了计算机和通讯技术的支持。但是,整座金碧辉煌的金融大厦去年夏季坍塌了,原因是输入风险管理系统的数据都是过去二十年的数据。众所周知,过去二十年金融服务业务一直在高速发展,从没有遭遇大的危机。
...
格林斯潘还说,如果风险管理系统包含了过去金融危机期间的数据,信贷机构对借款人抵押财产的要求就会高得多,整个金融服务行业也不致于像目前这样惨不忍睹。


这则新闻
同时还引述美国证监会主席克里斯托弗·考克斯(Christopher Cox)的作证词:
考克斯表示,信用评级机构给予了一些抵押债券“AAA”评级,而这些债券本不应该得到这样的评级。

考克斯在一份书面证词中写道,这些评级不仅仅误导了投资者,也误导了计算机风险评估模式。

在决策上,我们为了得到可靠的结果,需要使用数据分析的工具增加可信度,然而,在很多场合下,为了某种企图,或为了维持某些关系,这些工具成了祭祀神坛的法器,不是去说服,而是去『震慑』人们,推销神秘变化莫测的未来,美好的前景,但过程有风险,令人们害怕、令人们再无法确定那些已经理解的,让人们去猜疑那些已经知道。谁标榜能控制这过程上的风险,人们就会臣服谁。

不是有一句笑话吗:
数据,只要你肆意地拷打,它就会招认你所愿意听到的


分析工具不当使用,就会成为凶器。打个比方,一个法制社会,程序正当性,它远比鉴定技术的先进性要重要的多。然而对于数据分析,我们错了,我更关注是它的结果,这些结果正是我们内心所要的,可信性由工具的先进性和复杂性代替了,越复杂的越可信。

这就是我们的错,『平庸的恶』,我们一个个都臣服在『复杂』的脚下,相信『复杂』的神秘,将『简单的真相』作为祭品,奉献给从未谋面的『神灵』,丢弃所已经知道的,不愿再受思考所累。

政府需直面群众的恐惧

谣言和群众的恐惧的关系,就像影子和实体的关系”,只要群众有恐惧,谣言就会顽强的生存。柑橘大实蝇疫情状况如此,科特迪瓦“绑架儿童”短信引发骚乱也是如此:

科国家电视台援引警方25日发表的公报说,日前部分阿比让市民收到一则匿名手机短信称,最近有一个犯罪集团的成员乘一辆深色玻璃的汽车在阿比让进行绑架儿童的活动,这在民众中引发恐慌。24日,阿比让的部分小学已经停课。

报道说,24日,在阿比让的阿博博区,部分愤怒的家长围攻了两名疑似罪犯的中年男子,并将其殴打致死,4名闻讯赶来的警察也被打伤;当天在尤布贡区,也有一名男子被误认为是绑匪而遭殴打,目前已被送往医院治疗。此外还有多辆汽车被烧毁。

查清、澄清谣言,这只是理应做的外表工作,而更实质的,是要消除群众的内心恐惧,这与谣言调查是完全不同性质的工作。唯一可行的方式,是让群众看到,政府有切实的行动正在执行,群众们看得见那些实实在在的保障,这就是消除黑暗的那丝亮光,只有这时人们的理性才有可能回归。

谁更可怕?

不作为 >> 乱作为 >> 谣言

2008-10-25

谣言止于智者:不『通告』,又何来『智』

根据邓秀新院士调查证实,柑橘大实蝇疫情只是四川省广元市旺苍县范围内,其它地区未发现。然而事情发展的现在,柑橘大实蝇疫情的影响却波及全国,柑橘市场萎缩,果农经济损失惨重。

对此,邓院士反思,指责有不实传言,恶意炒作。注意到邓院士提到,9月底发现疫情,占全县柑橘总数的8.9%,最终疫情得到了控制。邓院士也粗略的给出了谣言扩散的范围:
  • 10月4日,四川省某地方报刊对旺苍县柑橘大实蝇疫情进行了不实报道,此后被多家网站转载;
  • 10月中旬,有人利用手机短信进行恶意炒作,造成不良影响;
  • 10月21日,有媒体声称在山西太原发现四川产的生蛆柑橘,经山西省农业厅核实,太并未发现染病柑橘。
  • 10月22日,有人向农业部举报在北京某超市发现生蛆柑橘。农业部种植业司立即组织北京市植保站到包括该超市在内的海淀区、朝阳区、昌平区的12个超市、农贸批发市场和零售市场,在19个柑橘销售点抽取243个柑橘样本,并经中国科学院动物研究所专家鉴定,未发现柑橘大实蝇以及其它昆虫。
  • 10月23日,互联网转载重庆某媒体声称在重庆发现生蛆的柑橘,而且强调柑橘多产于广西。经重庆市部门进行市场调查,未发现蛆果。
正如邓院士描绘的,『谣言』的影响力是一点点持续扩大,但令人生疑的是,在这个过程里,政府的『通告』在哪里,为什么没有信息公开,为什么那些早就制定好了的一个个危机预案不见踪影,为什么民众没有感到政府在力行。

有一点很清楚,我们这些民众根本就是一个个普通的人,一盘散沙,我们辜负了政府的信任,因为我们根本就没有所期待的『大智慧』。那些所谓『不实』的传言,就是我们的恐惧,害怕自己受到伤害,害怕亲人受到伤害,不愿朋友也受到蒙蔽,受到伤害。面对危机,什么能够打破我们的心里恐惧,那是一种面对着漆黑黑的将来,不知何去何从的恐惧。只要一丝的亮光,这漆黑就有消散的可能,只要有及时的『信息』,有说服力的『证实』。

我们害怕黑暗,更愿跟随光亮。

2008-10-24

要求与习惯

今天我在电梯里,偶得了一段极具“洞察力”的对话:


“这是他的要求吗?”
“不,那是他的习惯”


『要求』或缘于一种应得的责任、或缘于一种主动的鞭策、或缘于一种客观的约束,或缘于防止发生某种不良状态的目的。无论如何『要求』这一行为关系,它缘于以往的经验,在执行具体行为时,又需要个体的主动性的决策。与『要求』相对的,『习惯』这一行为关系,类似于某种行为的“惯性力”。

『要求』与『习惯』有很大的不同,但人们对它的区分却不明显。有时,为了避免『要求』与『习惯』的模糊,我们会将『要求』变为『规定』。

2008-10-23

上天给了我两只眼睛

上天赋我两只眼睛,

一只是善良的眼睛,
观察已发生的变化,

一只是怀疑的眼睛,
审视已存在的另类。

睁一只,闭一只,
只窥尘世的争扰。

汇聚两眼的世象
尽得宇宙的幽静

辨析Responsibility和Accountability

南侨给的解释

英文中有两个词Responsibility 和Accountability,奇怪的是在中文中通常都被翻译成“责任”。其实这两种“责任”的不分,会造成很多问题。粗糙一点说,二者的区分是,前者是职权范围,后者是对结果的责任。很多时候,我们给了一个人responsibility, 却没有运用体制或者道德手段,给予对等的accountability. 责任范围和结果责任的脱节,就造成了在位管事的人不负责,负责的人却不在位不能管事这个局面。我们现在常说问责问责,通常的情况是没有人问,他就不负责任。甚至你去问责的时候,他去问别人的“责”。

2008-10-21

报告领导:『难题评价』和『难题预测』是最大的难题

为贯彻落实“十七大”精神和科学发展观,科技部现征集我国一万个技术难题,技术难题征集采用网上提交、受理、评估和入选发布方式。征集的技术难题经专家评估后,向社会公开发布。我也凑个热闹,报告一个:『对难题建模』、『对难题评价』以及『对难题预测』,它们是最大的难题。

难题之所以难,很大一点就是还没理解、看清它,看清了,表述清楚了,解决反而是自然而得。难道现在研究者们手里空闲的很,不知道还有啥题目要做。吃自己碗里的饭,知道其酸甜苦辣,何苦要折腾一把呢。不过有些人,尽管没事,但还是要找些事来做的。也不知道科技部是想抢教育部的饭碗还是学习教育部,也搞个题库啥的,弄个百万人才大临考的盛况。

一片秋天的枯叶,一个历史的符号

吃完晚饭,慢悠悠地散着步。无意间,一片枯叶滑入手中,那是一种轻轻的、很柔和的感觉,抬起手来,看了看,它很小,没有了水分,枯黄的很,已没有一丝绿意。原本就要飘落在路上的它,消失在这个世界,它却滑入我的手中,最后的留念,令我感受它那曾经细小短暂的生命。

历史需要一些符号用来记录历史。今天两千零八年十月二十日,在中国的法制进程上,出现了一个历史的符号——杨佳。无论他做了什么,他应得什么惩罚,已不重要,因为这个名字转变为一个符号,一个历史符号,也正是这个“符号”的所担负历史作用,它使那些无辜受害者、牵连者更加地痛苦。“符号”并不纯粹,它关联了一些人,一些事,有投机的,也有进取的,有正面的,也有反面的,这些也都因为这个符号成为历史的一部分。

2008-10-20

空即色

今天准备一个报告,突然意识的“空即色(Nothing is a thing)”的问题。“色”,有形,一物或多物,可见;“空”,无形,无一物,不可见。为何会有“空即色”呢?

不妨用一个简单的例子来说明:一盒粉笔,将里面的粉笔倒出来,此时问盒子是空的吗?显然是空的。再复杂一点,我们在粉笔盒壁上画一只粉笔,再问盒子是空的吗?画的是粉笔,但盒子里还是没有那些已经倒出的“实在”粉笔,因此答案依然是,盒子还是“空”的。

在这个例子里,所说的“空”是“实在”的粉笔,而不是那个画的粉笔,空是具体的。换句话说,究其所提供的信息量来说,“空”粉笔要小于一支(两或多支)粉笔提供的信息,也就是说,空粉笔是一个“最小固定点”。

2008-10-19

和谐的不平静

最近,听到和谐,脑袋就涨,似乎里面豆腐脑就要沸了。

如果遇到一个人,他的一举一动、一言一词都和你一模一样,的确很协调,很配合。你开始觉得好玩,你笑一下,他也笑一下;接着厌烦,你阴着着脸,他也阴着脸;你生气,骂他,他也骂你;你怒,打他,他也同样力道打你;最后你受不了,举枪杀他,他也举起枪,向你开了一枪。眼前一片漆黑,一切都结束了。

在一片漆黑里,努力睁开眼睛,还是一片漆黑。害怕,漆黑,什么都看不到,听到的是心跳,咚、咚、咚,周围的一切也开始,咚、咚、咚,声音越来越大,节奏越来越快。恐惧,心里还是恐惧。你举起双手,快速用力拍向双耳...

醒来,听不到,看不到。一切感觉都消失了,这时你才意识到,唯一可以做的是平静。你一点一点地尝试着,心平静慢慢下来。这时你才想起那些和你不同的,想念它们原是那么可爱,是那么的平静。

2008-10-18

一个生动有趣的Haskell教程

推荐一个Haskell入门教程,Learn You a Haskell for Great Good!,它尽力令学习Haskell、理解函式编程(functional programming,也可译为泛函编程)的过程变得生动。

2008-10-17

为何“争先恐后”?

这里介绍美国《侨报》10月15日的一篇文章,文章认为:“争先恐后”已经成了很多中国人的习惯。何时才能不争?显而易见的答案是资源不再稀缺,不过这个过程非一朝一夕之功,尤其是在中国这个人口众多的国度。在此之前,先要补课,从最基本的文明礼仪、有序排队做起,日积月累、滴水穿石,进而逐渐改变中国人的视野、心态和言行。

文章鞭策国人的初衷,理应谢之,但究其观点,“最根本的还是提高全民族的文明素养,重新审视价值观”,这可是“想灭火,却无心浇了油”。这个人人皆谈了两千年的“德”,难道还没够。

“资源稀缺,先到先得”,这是天理,没有错。难道还要用国家暴力将一切先得到的再抢了去,奖给那些“礼”让到最后有德之人,想想这两千年来“教化”历史,冷汗足可以洗澡。自然法则,是个萝卜就要占个坑,这没错。

“资源稀缺”,归根到底还是它。但为何我们总是逃离不了这“资源短缺”怪圈圈?非要到最后闹个大饥荒饿死一批人缓解压力。不该反思吗!悲惨的是,我们还没走出这两千多年来的礼教,集权的管制,人人都同质的厉害,彼此没多少分别。

有人认为中国人像散沙,缺乏协同精神,但我怎么左看右看,这个社会极有协同精神啊!可歌可泣!

英雄的人们早上集体的从郊区赶到市中心参加工作,为了一个共同的目的,赚钱养家,晚上又集体的从市中心赶到郊区,同样的中心,同样的小区,为了克服资源稀缺,算来一天路上就要两小时的肌肤相亲、磕磕碰碰,人们彼此容忍,这不是牺牲精神、礼让精神嘛,可叹啊。

我们的企业们也为了让利消费者,要上的“新”产品,专选那种“众乐乐”的技术,我可以做,你也可以做。有买卖大家一起来做,要做买卖就一定要打价格战,一打就达到底,还要打到国外,让利全世界的消费者,合作与牺牲,可敬!

教育系统也为了社会和谐,专拣那些基本的教,那些熟透了的教,那些谁也不知有何用途的教,决不让一个学生落下,决不让一个用人单位在“鱼和熊掌”问题上为难。

人人都一样,同样的路,同样技能,同样的生活,同样的价值观。
一个大同社会,怎能不能“争先恐后”。

是缘是份,如幻如影,亦实亦真

无论结果如何,祝福这两位苦命人
一17岁小伙高空作业时脚下一滑掉下楼去,直接砸在了一个18岁女孩刘燕的身上,结果两个人同时重伤入院。捡回一条命的小伙子表示,要照顾这个救命姐姐一辈子。

2008-10-16

两件投机性措施

  1. 北京首次进网吧须拍照存档。在北京1500多家网吧上网时,如果是第一次进入网吧,就要在网吧内的监管系统终端设备上拍照、扫描身份证,并且以此存档。文化执法总队新闻发言人李菲介绍,整个的控制终端是执法总队的管理平台上,网吧业主只是负责采集资料以及核对资料,无权对资料进行任何修改和使用。在监控平台上,工作人员可以实时对任意一家网吧的任意一个机位进行监控。某一个机位上的上网者的年龄、图像资料也可以快速查阅,确保进入网吧登记的资料与机位上上网者保持一致。
  2. 移动WiMAX还不能在中国使用,TD继续受扶持。工业和信息化部无线电管理局副局长谢飞波在“3G在中国”2008全球高层论坛上表示,移动WiMAX目前尚未通过中国通信标准委员会审定。这意味着针对中国的TD-SCDMA标准的一系列保护和倾斜政策正在不断实施。

2008-10-14

密集与压力

我理解克鲁格曼的国际贸易理论,理论揭示了全球化的一种趋向,生产制造基地的产品项目和其所在位置方面会进一步密集化。这二十年来,人们所感受到全球化,有了更丰富的产品选择,有廉价的、有咂舌的高档消费品,有物质的,也有精神的。然而,尽管人们生活的范围、层次得到了扩大,但人们也明显感到了城市生活的压力在持续的增加,而且更为疯狂的是,人们也越来越“心甘情愿”地(被期望所迫)要挤入密集区的中心地带,寻找机会,这已经是共识,那些逆向选择的人们已经会成为“异类”或者被当作失落者。

我信奉的是,社会关系一旦失去了“分散”,就会失去“自由”,这不是一中“自然”的趋势,它会压迫人性,令人失去“兼爱”,让人失去“好奇心”和“想象力”。或许,这仅仅是一种猜测,当前的金融危机并不简单的归于金融产品开发的失控,或者什么投资人的品德失落,我想更多的是这种密集化所驱使的“需求”,“密集”所要的不仅是资料流通的速度,而是速度的增量,一种持续的力量,当一切正常的生产机制不能满足时,必然会选择其它的“极端”。

或许可以进一步的猜想,我们是否可以将物质的生产的密集转化为信息的密集,毕竟人的需求在局限条件下是有限的,通过转换来减轻密集的压力。一切仅是开始。

恐怖组织的网络结构

普通人总是感到恐怖组织的网络结构很神秘,这里有一篇论文《The topology of dark networks》,文中介绍了对贩毒、军火交易、恐怖组织等组织网络的研究结果,这些网络不但依然有小世界的性质,而且也显示出了相当高的聚合度,注意到,由于存在一小部分节点要承担关键桥接的作用,这种类型网络也特别容易受到攻击,这自然是打击恐怖组织的一个策略。下图来自论文(版权归作者与本博客CC授权无关),图中绿色的节点是南亚地区的。

回到2001年,搜“三聚氰胺 奶粉”

巧合有时令人恐惧得很。从这里得知,在google推出一个特别纪念项目,搜索2001年,搜索“三聚氰胺 奶粉”,你会得到
看搜索结果第一个条目,“三聚氰胺”、“婴儿配方奶粉”和“三鹿集团”这三个敏感的关键词居然在一起。惊讶、恐怖。慢着!先别急的议论,看一下2001年时那个网页到底是什么,这要感谢web.archive.org项目,可以查到那时的结果
 奥,原来有两个招商项目的广告摘要离得的太近了。

 最后感谢AW用“如有雷同 纯属巧合”的实例来提醒,现实中一定要独立思考。

2008-10-13

“温水煮蛙”:道理与现实是有区别的

经常听到温水煮蛙的寓言,寓意提醒注意那些“微不足道”的变化,积累下来或许就是一场灾难。寓言和现实经常不一致,一位网友很较真,亲自做实验,结果是:
  • 将青蛙轻轻放入锅中,生火,生火后1分钟17秒时,青蛙开始多次往外跳跃,试图逃生;
  • 将大锅中的水烧开,水沸腾时,抓起一只,扔至锅中,青蛙挣扎4秒左右,烫死。

无论这事后其它网友怎么评论,我还是有些虚伪,挺同情那些不幸烫死的青蛙。寓言总归寓言,传达了要说明的道理,不用与现实太较真。

测试“自我意识”

下面文字摘自此处
自我意识在动物个体生存和发展中具有十分重要的作用,而产生自我意识关键的一步是理解自己的镜像(哦,那不是别人,是你自己!)。通过成功地相互比较试验,如工具的使用、情节性记忆和利用自身经验去判断伙伴的行为等,我们现在知道至少在某些鸟类中也存在类似于人类和猿类的思维能力。

对于非人类动物和人类儿童,“标记测试(mark test)”已经被作为测试自我意识的工具。在这些实验中,测试对象被放置在一面镜子前面,并且在被测试对象身上做一些标记(很显然,这些标记只能通过镜子看到),然后观察被测试对象是否能根据镜像中看到的标记表现相关的行为。

几句评价

礼教几千年,现在又全民爱国长跑,而且四百配一师。我们喜欢听评价,这里有几句,摘自萧瀚的追遠堂。它们尽管听着不舒服,但现在还是受用的:

(1)黑格尔说:“中国的显著特色就是,在实际上和理论上,绝对没有束缚的伦常、道德、情绪、内在的‘宗教’、‘科学’和真正的‘艺术’凡是属于‘精神’的一切一概离他们很远。”

(2)孟德斯鸠说:“中国人的生活完全以礼为指南,但他们却是地球上最会骗人的民族。”

(3)利玛窦神父说:“……还有一点不能容忍,就是在中国盛行撒谎和欺骗,谁都对此不以为耻,有地位的和知识分子也不例外,因此,谁也不信任他人,彼此猜疑,不只在朋友、乡里之间如此,就是在亲人之间,如兄弟姐妹、父母子女之间也都不绝对信任。中国人彼此之间的交往,只是动听的外交辞令表演,心里没有真情实义。……”

(4)韦伯说:“中国人彼此间典型的不信任已为所有观察者所证实,同清教诸教派中对信徒的诚实品质的信赖成为鲜明的对照,即使在宗教团体以外,也可以信赖清教徒的诚实。”

2008-10-12

自发性生产与投机性毁灭

自发性生产和投机性毁灭是一对过程,自发性强调了生产的客观性,而投机性强调了主体的主观性。凡是自发性的生产都会具有所谓的创造性或者创新性,只是这些创造性比较,有多有少的。然而,一个关键问题是经常将投机性的毁灭当作生产,这就更加混淆了创造性。因此,我们在主观上剥夺了创造性的客观性,认为创造性是可以补偿的,即创新动机是可以激励的,这只是一厢情愿,没有出路。

2008-10-10

一个面试官的感受

这里有一篇冯大辉在南大作为面试官的感受,无论如何,所说的这些是要面对的现实:
今天发现的一个事情是,现在大学的很多计算机专业的硕士生真的被一些王八蛋导师坑了。多数硕士生的功底反而不如本科生了(无论从昨天的阅卷还是今天的面试来看),尽管可能做硕士期间做过很多项目,但那些项目基本都是用 .net 之类的东西做的,或者就是"大作业"。研究生被用来用作赚钱工具,一两年下来,以前的很多东西基本也都丢掉了。他们很无辜。

另外是学校研究生的课程设置,真是有些骗人了。问所有研究生的研究生课程,多数都说不明白能研究生课程的内容,有的主打课程教材就是看导师弄的 PPT ... 教课的导师根本把握不住计算机行业的脉搏,真不知道都干什么吃的去了。


在冯大辉博客上还有一篇很中肯的建议《毕业生该怎么找互联网行业的工作?

想象力

匆匆地赶路,最惨就是将最宝贵的东西丢掉,这就是想象力。

知识的第一印象

昨天在校园路上散步,突然听到清脆的叫声,“爸爸,教我”,寻声望去,看到一对父女,女孩看着很兴奋、很迫切的样子。一声“教我”,这句话令我觉得它是多么的陌生。我们都从幼年过来,在这过程里越发感到知识的价值,对于研究者,“知识”作为“事物”的形态却越来越模糊。问题是“知识”一开始给我们的第一印象是什么呢?对“知识”的感觉究竟是什么?

“教我”,幼童看到那有趣而不能为的,总是有显得“过剩”的好奇心,觉得好玩,想试一把。“有趣而不能为”这或许就是对知识第一印象,或许正是这种朴素的感觉,它注定了“知识”的永远神秘性,人类对知识的无止尽向往。

很有意思,信息检索、人工智能或知识管理等所研究的知识是“已知的”,这与知识的第一印象不同,因为它是未知的。无论信息检索、人工智能或知识管理都是将知识局限在“已知”中,不能说这是漏洞,因为这是实践所必须的。

如果“已知”与“未知”有交互,那么在微观上,这个交互点令人感到神秘莫测。

2008-10-08

对称性破缺

今年的诺贝尔物理奖涉及的问题是对称破缺,John ArmstrongMark C. Chu-Carroll的博客上举了两个对称性破缺(symmetry-breaking)的简单例子:
The canonical example to define symmetry-breaking is a bunch of people seated around circular table. Each place setting has a plate, and there's a cup set between each pair of plates. The situation has a rotational symmetry (turn by one setting) and a reflection symmetry (draw a line across the center of the table, through a pair of plates).

But is the cup on your right side or your left side part of your setting? When everyone sits down, it doesn't matter, since everything is symmetric. But if I grab the cup on my right, the woman sitting there has to grab the cup on her right, and the man on the other side has to grab the cup on his right, and so on all round until we get to the woman on my left who grabs the cup on her right -- my left.

Now the reflection symmetry has been broken, but the rotational symmetry remains.
另一个例子是:
It strikes me I should say something about spontaneous symmetry-breaking.
The canonical example here is to consider a punted wine bottle. That is, the bottom isn't flat, but is domed up in the middle. It's rotationally symmetric. If you place a marble on the punt in the exact center, it will balance and the situation is still symmetric.

But that situation isn't stable. The slightest nudge will push the marble off the center (just like one person grabbing the left or the right cup). Then it will roll off in that directly until it comes to rest in the groove at the base of the punt. Now the rotational symmetry has been broken, since one direction from the center has been identified as different.

The important thing is that nobody made a "choice" here. Energetically, the non-symmetric configurations are all just as good as each other, but they're all better than the symmetric position. So the tendency of the universe to minimize energy is what "spontanously" breaks the symmetry without having to "intentionally" break it by making a choice to pick out one direction over the others.

2008-10-07

信息质量能否通过审查来提高?

到底要何种程度的信息质量,这取决于使用该类信息的要求。然而要求却是多种多样的,费用也有所不同,单一的信息质量规定是不现实的,对于大信息量,尤其像国家科技基础条件平台资源信息这类信息资源,必须有后级的各类加工,而且能够形成市场,允许将某些单位研究时加工的数据共享出来,并可获得一定的补偿,来降低整体信息质量相关的费用,更重要一点要有一个信号,来反映对信息对质量真实要求。

三年多前参加过一次与基础条件平台相关的技术讨论会议,觉得这类信息非常有价值,关键目前在国内也没有任何一家可以做这类型的事情。一直担心的就是信息质量和后期的运营。虽然国家会当成公益工作一直支持,但问题不仅是信息的产生、存储与共享。看到这则新闻更有些忧虑了:

科技部、财政部共同成立了国家科技基础条件平台资源信息质量核查专家组,专家组组长张泽院士表示:“国家科技基础条件资源平台信息质量核查工作使命崇高、责任重大、任务艰巨,专家们一定严格按照要求,站在国家全局的高度,认真履行职责,在工作中注意加强交流,严格自律,总结经验,发现问题,为国家科技基础条件平台资源信息质量核查工作献计献策”。

像国家科技基础条件平台资源信息这类信息,量如此的巨大,内容如此的专业,有的条目权威的专家,国内就那一两个专家,保证资源信息的质量,这已非是信息质量核查能解决的,这也不是在一两年内通过一两个工程可以为达到的。观点还是两条:现有平台功能上要减肥,去掉花哨;开始探索新的运营策略,维基百科、Creative Commons,以及刚出来的Google Knol等开放的互联网运营模式都值得参考。

金融危机与风险管理系统

由次贷危机引发当前金融危机,这个话题已经有很多。无论有什么阴谋论,我想每个人都不希望有这样个局面。抛开人性的责难,有一点令人深思,金融界不但花费巨资投入在风险管理上,而且从事这方面工作的都是聪明人,都是精英,他们有金融评论家,有数学家,有计算机专家,有经济学家。但这个系统失效了。

如果仅仅是资本家面对系统刺耳的警告,充耳不闻,有意掩盖,这个问题就简单多了。但问题没有这么简单,更不幸的,一切都失效了,投资家、评论家、数学家、计算机专家以及经济学家都在这个过程“迷失”了方向。

为什么?!

这篇评论《How Wall Street Lied to Its Computers》里有一句话,或许有些启发:
The people who ran the financial firms chose to program their risk-management systems with overly optimistic assumptions and to feed them oversimplified data.

我们总是制造、选择那些乐意看到的。想得到什么,就输入什么。结果却成了,输入的是垃圾,输出的是垃圾。

2008-10-05

增值税是“税”还是“租”?

张五常教授在《中国的经济制度》提出了一个问题,“增值税的本质:“税”还是“租”?”。有一点是清楚的,有“租”,就有“权”划分的问题,这是所谓的“中国特色”,还是中国在改革开放中“一不小心”地触及了一个一般性的经济性质。这越想越复杂,还是先放放,需要再学习,再思考。

2008-10-04

彻底无语的“长跑国策”

如果下面这则新闻是真的,这次真的对彻底教育部无语了:
由教育部、国家体育总局、共青团中央联合开展的“全国亿万学生阳光体育冬季长跑活动”将于10月26日正式启动。冬季长跑总里程以60公里为基数,象征新中国成立60周年。小学生为120公里,初中生为180公里,高中生、高校学生为240公里。

在10月26日至明年4月30日的半年时间里,全国学生将坚持每天长跑。10月26日起全国小学生每天跑1000米,初中生1500米,高中及以上2000米。

2008-10-03

经验与质疑

下面文字摘自“寻正”的《科学圈子里如何对待经验——答费思》(XYS20081002)


科学圈子里讲究证据原则,证据原则中有如下一些证据强弱的判断,双盲强于单盲,盲强于不盲,试验强于观察,随机试验强于不随机试验,有对照实验强于无对照实验,前瞻性观察强于回顾性观察,系统性观察强于非系统性观察(个案系列、个案、经验),个案系列强于个案,专业人员观察强于非专业人员观察。

......

相对而言,理论是最容易质疑的,其次是实践,再其次才是事实。你从个人经验来质疑专业人员对事实的描述,这在科学圈子里是不太可以思议的事情,由于中国学术造假问题严重,诚信缺失,的确有大量的专业人员的事实被质疑,但这些质疑,无不是存在逻辑上不洽或者是由专业人员作出来的。

......

当经验与理论不相附合时,如果理论的支持证据的强弱水平不显著高于经验的层次,普通人可以质疑理论,如果理论的支持证据显著高于经验,那么只有专业人员可以质疑理论的合理性,更多的是质疑其局限性,找出理论更恰当的适用条件,换一句说法,叫做灵感。

2008-10-01

虽云计算稍些有毒,但也没办法

Richard Stallman警告说“云计算是个陷进”。争论的焦点依然在争夺数据的控制权上,但现实问题是,尽管“云计算”是一些技术的“打包”,但这很实用,目前我们没有其它现成的技术,以廉价的成本处理那些海量的、相互连接的数据。

另外,还有人说“云计算”被过度营销了,的确,这是有点过分。没有超过1000个计算节点,不是云计算设施,这个观点我赞同,搭建云计算设施不是小民能玩的,若计算节点少了,运营成本优势、应用广度和深度就体现不出云计算特点了。但开发云计算的应用,这可不意味着非要搭建个啥平台的。找现成的,能在上跑就行了。目前一个缺点,这方面标准少,对于应用在各平台上的兼容成本,这自然就要自己承担了。

就长期来看,这种舍近求远,闲置桌面和移动的计算资源不用,这显然有问题。我也相信,问题核心还是需要在基础计算理论上的突破,为什么数据不是连续的呢?!为什么信息谷仓效应越来越突出?!问什么需要显性的连接数据呢?!为什么我们总是建了一个又一个的烟道式系统呢?!问题丛生,有一个梦,“如果记忆能够编织多好”,这也在情理中。