2008-07-14

顽皮的语言

计算机的自然语言处理,众所周知那是相当的呆板,其实作为实在的人,有时在“理解”上也会有所呆板,索性在反复怀疑和假设下,如果不在中途放弃的话,最终会理解的。下面是博主刘瑜在一篇博文使用的形式:

我“不明真相”,没多少看法,就12条:
1. ...。
4. ...。
12. ...。
仔细想来,这12个看法都跟...

我开始理解是博主的意见共有一十二条,但看到是三条意见。博主更“可恨”的,还这三条意见分别标注为“1、4、12”,在我看来,以十进制阿拉伯数字书写,这是“断”号了。我还以为是RSS系统的问题,自动摘取部分内,打开原网站一看,还是一样的内容,再看附后的评注。呵呵,才知“上当”了。

博文中的符号“12条”存在符号的困户,必然被重新理解:
  • 有的人解释为“一两条”,但博文给出了三条意见,一种选择就是将“一两条”的“一个或两个”含义放松为“几个,最好越靠近一个或两个越好”;
  • 有的人还理解为“1 + 2 = 3”,强调数量上的逻辑关系。

然而对于博文后面的标号“1、4、12”的理解,有人放弃了其原本的含义,直接当成一种纯符号,“第12条”就是一个名字而已。

这是一个很有意思的理解过程,起作用的不仅仅是所谓“语义”的东西,还有其它什么东西,那这是什么呢?

没有评论: