2011-12-08

两个月

分类: 生活


标题就是不用想事,数数就行了。上个月注意力还都在生活上面,现在都习惯了,新鲜感也已经过去,应该开始关心点别的了。

刚来时的动荡期已过,花钱开始比较稳定了,于是在ipad上弄了个记账的软件开始记录生活开销,12月碰上了圣诞和元旦,花钱自然要多一点,预算给了接近700,抵掉上课赚的100左右,纯支出就是600的样子,其他的月份估计还可以少100多,也就是说正常开销应该是一个月500。眼前看到实实在在的数字(其实还有更大的一笔没有算,就是德国政府号称平均每年为每个学生投入的上万欧)确实可以激励人思考,自己在这里的收获值不值这些钱。

第一个学期的基础课还是稍微有点没意思,数学和逻辑都是在国内学过的,虽然学得相当不好,但再看看书和课件也足以应付这边的各种作业、练习课和考试(我猜)了。这的编程基础课用的是Ada,好像德国很多学校都是这样,不知道为什么不教C语言,总之感觉Ada的语法挺丑陋的,吐着吐着就习惯了,也不难搞定。唯一的一门和专业直接相关的课就是MSV导论,每周一节课,纯粹的入门讲座,连作业都没有前,以至于有时候我都会疑惑自己在这学什么。从第二个学期开始专业课才会慢慢增多,也许那时才是正常状态吧。前一段时间就有点满足于这种完成了所有任务的状态,觉得这样不思进取的感觉很不爽,于是决定开始让自己每周定量看一本厚厚的Computerlinguistik教材。

一直以来我就像一个低主频却总想着多线程的单核小破CPU,总是同时看着好几本书,于是每一本书都拖得好长,并且有不少的书看着看着就半途而废了。好在现在不像在国内大学里,省下了一半做毫无意义的事的时间,于是同时看的书也达到了前所未有的规模,有必要好好分配一下了。

要看的书除了消遣的之外基本就分成两类,一个是语言类的,一个是专业类的。现在同时学的语言也有点太臃肿,可又都不想舍弃,其实我学一门语言,交流顶多是第二目的,更多的就是想知道语法的结构,人们怎么用它来表达同样的内容。从这个方面来看,德语和西语就足以代表其他的日耳曼语族和罗曼语族了,可由于对葡萄牙的某种执念和一个很好的荷兰交流项目,不得不也开始学习这两门有些“冗余”的语言。另外现在在学校里还上着世界语的课,进度挺慢的,毕竟这门课的目的是让人真正的能用这个语言交流,可我不是抱着这个目的学的,它的语法确实非常简练、精确而且友好,就像我刚开始接触Python时的感觉一样,两个字:可爱。另外纯从语言的角度来说我更想学的是土耳其语,之前在图书馆里翻了半个下午土耳其的语法,感受到的就是一个全新的语系,全新的世界观,不过稍微理性一点还是先让它拍着队,再多就实在顾不过来了。

和语言类的书比起来,专业类的占得比重倒是小了不少,一本Computerlinguistik und Sprachtechnologie,一本Programmieren in Prolog,和一本Ideen der Informatik,都不是那种艰深难懂的类型,还可以接受。

回想了自己在各种情况下的阅读状态后,给自己定的阅读方案差不多是这样:晚上睡前看需要好好思考的Prolog,这个时候头脑最活跃,Ideen der Informatik和Prolog的性质有些相似,干脆就等看完前一本再开始;CL und ST比较接近教材的类型,作为每周定量的书,不管什么时候看,反正要看完那么多;西语已经学得比较多了,只需要多认点单词和句子,这个可以自己在屋里用碎片的时间来看;葡语和荷语差不多都是从头开始,先看教材到一定程度再说,每周都有一到两个下午在语言中心的图书馆专门学这个;世界语的语法有个不错的pdf在ipad里,基本就是在地铁里看了,之前的地铁读物是乔布斯传和失控,我大概已经过了喜欢读传记的年龄,感觉后者倒是蛮不错的。

以前给自己定阅读计划之类,最后的目标总是要在什么什么时候完成什么什么,倒不如换一个简单的目标,不管什么时候读完,每一本都不要半途而废,就这样了。

2011-11-30

中文课(3,4)

分类: 中文课


上一周的课比较乏善可陈,于是懒得专门写,这回两周一起吧。

讲完了LiaoLiao的第一课,我对书上的课文非常有意见,难道就不能弄一点有意义的对话出来吗?像“妈妈,你好,你好吗?”之类的各种毫无意义的重复,我觉得要不就弄成各种例句的样子来多练一点表达方式,要不就弄一篇表达正常的课文,这种四不像的我直接就说是Syntaktisch richtige Unsinn了,教得也没感觉,学得也没兴趣。我看别的语言教材就觉得Pons的系列不错,比如葡萄牙语,整本书的课文就是一个复杂而怪异的故事,即使是第一课也一点都不简单,语法、单词等等都是从课文里进行引申讲解。美中不足就是一开始就用正常语速,而且语音的资料太少,非常难跟着读。

上周教了各个笔画的名称,以及笔画顺序的基本规则,然后在练习册上留了一些田字格练字的作业,看了两次作业以后感觉暂时还没脱离画画的阶段,不过也挺正常的,像我这种从小就不会好好写字的人(今年还有人跟我说你写字像画画一样,“很有风格”,说得多委婉啊),非常能理解外国人学写字的感觉。不过为了给学生一个努力的方向,我找了张比较清晰的《兰亭集序》的图给他看,可惜我也不知道该怎么讲解字体的优美啊之类的话题,只能说这是中国最有名的书法之一,文章也很好。他看了看,就开始读,etwas,etwas, 九, etwas…他对上面盖的印章很有兴趣,我之前倒是没想过还会有这个问题,就解释说因为这副字太有名了,辗转经过很多收藏家的手,也许大家都知道人生短暂,自己不能永远占有,于是盖一个自己名字的印章,表示某某到此一游。

然后开始讲第二课的课文,就是引进了昨天今天明天的时间概念,因为中文的动词没有Tempus的信息,必须靠这些时间副词。他又开始侃了,说他听说非洲有种语言里面就完全没有过去和未来的概念,大家都活在当下,大概是最幸福的人了吧。书里面的例句是“我今天不冷”之类的,没有真正的动词,为了讲清楚动词和时间副词,我就开始教真正的动词了。很多在英语和德语里的动词在汉语里常常是动词和名词的组合,比如吃饭(essen Reis),知道(wissen Wissen)等等,那些可分的动词和名词也常常是固定的搭配,比如德语的spielen可以跟很多东西,不管是游戏还是球还是乐器,而汉语里就很不一样,有些球是打的,有些球是踢的,有些琴是弹的,有些琴是拉的,不过这些都没让记,先知道一些就够了。倒是我这才知道,原来羽毛球在德语里是两个运动,用同样的球,Badminton是正经的严肃的比赛的羽毛球,Federball就是两个人出于娱乐性质的打来打去,如此说来我就只会Federball不会Badminton……说起乐器我倒是想起星期一的时候和Esperanto课上的人聊天,他听说我几乎不会乐器,踢球也是ab und zu之后,于是用一种很怜悯的眼神看着我,你的生活在哪里,唉,其实我也是这样觉得自己的。

回归正题,学了动词之后就讲了个最简单的现在进行时的表示,因为在德语里do sth和be doing sth都是一样的表达,不得不用英语来解释了。中文一个很常用的说法就是“在”+Verb+Nomen,另外“在”也可以用作引导地点状语,这就只稍微解释了一下,以后再细细说了。

之前还教了从一到十的数字,今天再补充了百千万,西方的数数是每一千倍就多一个词,而中文里是每一万倍就多一个词,这还真不好解释,我就说德语是3个0打一个点,中文是4个零打一个点。但是大数字怎么读我只讲了一点规则,也没有怎么练习,这个不太好,下次应该多练一下。

他说学校里学的拉丁语里最短的句子是“I”,就是祈使句“走吧!”,问我中文里最短的是什么,要一样短的话就只有“一”了(好巧啊,一样的笔画一样的读音),可是这是什么意思呢?于是灵机一动就给他讲《道德经》(我说这是中国的第一本哲学书,其实我也不太记得是不是了)里的“一生二,二生三,三生万物”,大部分字都认识了,比较好解释,刚说完意思他就说这差不多就是Chaostheorie吧,我勒个去,触类旁通帝啊。所以“一”这个句子比“I”要厉害多了……顺便看了下他们的课表,原来宗教是一门必修课,这个我倒觉得蛮意外的,我问他穆斯林同学怎么办,他说他们只学Ethik的内容,没有说得更详细,下次再慢慢问,我觉得这话题挺有意思的。

然后课就上完了,他突然对我的笔很感兴趣,就是国内买的一块钱一支的晨光中性笔,这的人好像都用圆珠笔,我非常不理解,我就把这支笔给他了,说再下次带点笔芯来,他特高兴的样子。回来我才发现,我带来的笔丢的丢送的送,只剩一支了,必须从书桌和书包里拿来拿去,买笔的时候还是高估了自己啊。

2011-11-25

一些乱想

分类: 生活


似乎很怕被别人窥视自己的内心,于是在国内时在本子上乱写乱画经常用德文,到德国了就开始写中文了。

脸盲是件很烦人的事,前些天认识了个穆斯林女生,过了几天她见我打招呼我就反应不过来了,因为换了个头巾……在只见几面的前提下我只记得住特胖的特瘦的特高的特矮的从来不换衣服的和发型特奇怪的人怎么办?

早睡晚起是快乐之本。

在车站扔烟头的地方发现,平均剩下至少三分之一没抽完就扔了,和教学楼门口的截然不同。德国的公交基本挺准时的,为什么不算好时间再抽烟呢?也有可能是时间到了车还没到,心里一急就点烟了吧。

人们要不就随意横穿马路,要不就老老实实等红灯,还没见过在人行道上闯红灯的,这大概属于脱了裤子放屁吧。

上Esperanto课时一个特简单的语法只是因为和德语不一样,于是大家纠结了半天,实在德语的语法比这个要复杂得多。看来他们从小习惯的和我们当外语学德语的思维过程确实很不一样,我猜德国人的对语法的注意远远比我们要少。

偶然想到一句用于对别人的言论的刻薄评价,与人们常说的logisch刚好相反,也适用于此:Syntaktisch richtig.

以上内容均不超过140字,我也不知道为什么不发到饭否上去。

-------------------------------------------------

顺便记两则笑话,真心笑了的:

辛稼轩作《永遇乐 京口北固亭怀古》,寄予岳珂,珂曰:“词甚好,惟用典太多。”稼轩回书曰:“国家未复,天下纷乱,岂不闻‘乱世用重典’,此其时也。” @马伯庸

鸭嘴兽既可以产卵又可以哺乳,是动物界中罕有的能独立制作蛋挞的奇葩。(补充,它还会分泌毒液,所以看到鸭嘴兽蛋挞也别真吃了)@不知是谁

2011-11-17

中文课(2)

分类: 中文课


果然第二次上课内容就无趣多了,都是一些简单的问候话语。从你好开始,从你字扩展开来讲了所有的人称代词,在此说明中文里的名词和人称代词没有格的概念,格只能通过顺序来表达,比如Ich schlage ihn, er schlägt mich,在中文就是简单的我打他,他打我。说道她字的时候又忍不住开始引用典故,从妇女地位讲到新文化运动,说起刘半农的教我如何不想她,费了好一般解释。

感觉教得有点急,一下子又把两个第三声在一起的音变、不字的两个读音等烦人的规矩都讲了,其实他多几个字连一起读就读不对声调了,就教这个确实太早。声调的掌握到底和乐感有没有关系呢?一个个读倒是差不多,连起来就乱了,可能多练练会好吧。

除了你好,还有早上好上午好一直到晚上好晚安,顺带着就全给教了,不过没让记怎么写,那任务就太重了。还问了一下,是想上课时多学点东西,课后自己做练习,还是一边学一边练,他选后者,跟我不是一个风格啊,得把节奏放慢下来。大概外国人学习都是这样的习惯吧,也不急着学到什么程度,也不心疼那点学费,学得轻松就好吧。还好我现在也在学校的语言中心每周也上一个半小时Esperanto的课,多观察一下Esperanto老师的讲课节奏吧,不过也不太好比,毕竟Esperanto本来就是为了快速学习而发明的。

然后讲了几个重要的字:不是nicht/nein,很是sehr,两个可以颠来倒去放一起,吗表疑问,一开始没说清楚,结果他问我,难道中文的Fragezeichen是一个字?囧了……有了这些基础的字,就可以说几个简单的句子,比如你/我/他 是 德国人/中国人/学生/老师等等,再加上吗变成疑问句,然后是和不是的回答。还是自己觉得好像很简单的几个字组合,让学生练起来就很困难,以后还是少教多练吧。

表达就教了这么多,然后是书写的方法,这个在教材里面倒是讲得蛮清楚的。那几个基本的笔画示范了一下,然后讲了几个字是按什么顺序写的。之前他抄我写的字总是结构怪怪的,因为我就是在草稿纸上写,不像书上有田字格可以作为参照。练习册上面有大概十个字,每个字抄二十遍的练习,就留做作业了,发现有两个字还没教什么意思,他说没事,就当画画了……回想童年这个过程蛮痛苦的,大人为了让我写的字能让人看懂费了一番苦心,现在也就停留在能让人看懂的阶段。

家里断网,还得跑到图书馆来写博客……饿了,回家吃饭去。

2011-11-09

中文课(1)

分类: 中文课


还是坚持着写完再睡吧,到明天肯定就有好多细节忘记了。今天是我教中文的第一节课,很多内容之前想得很好,但一说就磕磕巴巴了,就像以前在班上做的展示还有毕设答辩一样,不过好在学生Martin蛮配合的,这第一节课总还算是顺利结束了,就简短的记录一下讲课的内容,以后也许还用得上。

首先是选的教材,是一本用德语写的中文教材,名字叫Liao Liao(聊聊,了了),很文艺的感觉,除了配套CD里的声音特别矫情以外其他一切都好,不过第一节课就没翻开过书,纯粹靠我照着Skript的内容天马行空瞎讲了,一页Skript讲完刚好一个半小时过去,居然是现金支付学费啊,拿着27欧就回家了,要是银行转账或者一个月结算什么的还没什么感觉,直接拿到钱倒是有点惭愧了,我这水平真值这么多钱吗?

最开始先介绍了自己的名字,本来只是想给Martin看一眼,没想到他认认真真的抄了起来。然后他的名字倒是轻松很多,马丁,马是Pferd,丁是Mensch,他立刻就联想到难道马丁是Ritter?很遗憾,不是。丁的另一个意思是序数词甲乙丙丁,顺便再把德国也教了,德字也够难写的,但人家爱国热情高啊,还是认认真真抄了两遍,听说德国的意思是Tugendland之后特高兴,aber natürlich脱口而出,那就好好记住这个字吧,德字的右边有讲究,四士一心,就是Vier Ritter hat ein gemeinsames Herzen。然后“我是德国人”学起来也就顺理成章,顺便提了一下“是”字没有变位,你是我是他是都是这么写,多方便,中国人学德语最讨厌的就是Konjugation了。然后学中国,Reich der Mitte,其实全世界人都觉得自己的国家是Reich der mitte,但只有中国取了这名字。学了德字,又学了甲乙丙丁,德甲德乙就知道什么意思了吧,没好意思说中超,只是忘了说这里省略了联赛两个字,难怪他当时愣了半天为什么德国第一就是1. Liga。倒是今天看到斯图的一个标语,Niemals 2. Liga,俺们村也就这点追求了。

然后讲了讲文字的演变,日、月、明、人、从、众之类的,人字的小篆体动作特别猥琐,他还真跳下椅子去模仿了,然后表示,原来中国人早就知道人是猩猩变的。之后又介绍了传说中的五个元素金木水火土,它们可以作为偏旁来组成其他的字并且可以传递意义,各举了几个例子,像金银铜铁、江河湖海、桌椅床柜之类的,说到“坦”是形容词表示flach, eben之后,他突然问我,荷兰在中文里是不是叫“坦国”,囧,这个思维真心宽广啊……每一个词他都痛苦的抄了一遍,我准备得不太够,横竖撇捺点总是坑坑巴巴说半天,后来干脆就说so, so, danach so…

之后再说语音,一个Silbe由Anlaut, Auslaut和Ton组合而成,于是理论上说有20*30*4=2400种可能性,而日语只有50个Silbe(插曲:他说,擦,这么简单,早知道学日语了……),50*50=2500,也就是说日语平均要用两个音节才能表达汉语的一个音节。举了个例子是斯图加特的球员冈崎慎司,冈崎两个字日语是Okazaki,刚好四个音节,他说自己只打橄榄球,不怎么认识足球队的人……既然提到日本了,他就说起在ZDF里看到的30年代中国和日本的战争,觉得日本人太残忍了,谁说德国电视台净反华来着。

再接着是音节、字和意义的关系,一个音节可以对应多个字,一个字也可以对应多个音节,在数据库里这叫多对多的关系;同样,一个字可以对应多个意义,一个意义也可以对应多个字,不错综复杂那怎么能叫Relation呢是吧。此外还有字和词的关系,古文中一个字就是一个词,现在的词常常由两三个字组成,所以古文特别简洁,但白话文更好理解。接下来有个小点就忘了说:可以把每个字看成一个意义的集合,里面有多个元素,当两个字取交集的时候,如果得到一个通常只有一个元素的集合,那就是一个词了。(我也不知道这样说他能不能理解,下次试试吧)。然后就是最具中文特色的四字成语了,举了个例子是愚公移山,我记得是太行王屋两座山,于是给他翻译成Herr Dumm bewegt die Berge,他以前在学校里学过一丁点中文,所以问我为什么Berge不是山们,像同学们一样,我想了想说,只有人可以用们,东西是不用的,这个回答是对的吧。讲故事还是蛮轻松的,但是成语的用途倒是不好解释,只能比较牵强的说,某个人提到一个成语,就可以表达成语故事里的道理,用于比喻。比如愚公移山的寓意是standhaftes Geist,可是有人曲解为人多好办事,于是不顾经济自然人性的规律乱搞一气,共铲主义就是这东西,愚公最终也是靠感动上帝来把山移走的,现实中可没人能帮你。

接下来是一点技术性的东西,即在电脑中如何输入中文。基本上有两种主流的方法,一个是五笔,这个我自己也不会,解释起来也蛮困难的,总体评价就是老式、高效、难学。另一个就是拼音了,最初的拼音输入法是一个字一个字输入,每次都要在一堆同音字里找需要的字,非常慢。后来有了整句拼音输入,由软件从词库里自动查找最有可能的搭配,夹带私货提到了Statistik, Corpus之类的概念,不过毕竟是中学生,半懂不懂的,我说我学的就跟这个有关系,他只能说祝你好运了。

最后就是一点学习建议,可以看看中国电影,千万不能给烂片,要是看了无极什么的,估计就把中国人都当疯子看了。他说自己看过末代皇帝,既然不觉得无聊那就可以放心大胆的推荐霸王别姬了,我说图书馆里的这部被借走了,而且很有可能是德语配音的,还是下次给你拷个盗版吧,他嘿嘿好啊。我突然想这片是什么级的啊,不过这年头的小孩爱情动作片都随意看,这片gay得那么文艺应该不会有心理阴影吧。

然后,就是下周二见了。Quatsch今天都讲完了,以后就得照着书一页页讲了,感觉准备起来没这么有意思,不过难度也可以小一些了。

2011-11-08

一个月

分类: 生活


一不留神就来斯图加特一个月了,也一不留神十个月没写过博客了,生个孩子都够了啊,人真的可以懒死的。重新开始写也是因为刚刚偶然看到了在Evernote里面同步的去年七月写的德语日记,边看边感慨,居然有那么多细节一年之后都忘记了,还不留下点什么以后会后悔的吧。

在这的生活感觉就在家里一样自在,准确点说是像宅在家里一样自在,尽管在这常常要出门各种走路,公交罢工终于达成协议告一段落,应该不用再没事就走山路上学了。上课也觉得没什么问题,虽然和国内的方式很不一样,但我好像也没需要什么过渡的时期就习惯了,或许这里的方法更符合人性,不需要习惯就能习惯吧。越发相信自己的选择是正确的,在自己喜欢的课程里每天都有收获。唯一让我觉得担心的是这的饮食,暂时还没做上中餐,各种德国食品好吃倒是好吃,但太容易变胖了,我总有一天会追上王玄桑的,想着都怕啊。感情嘛一年的等待终于可以见面,虽然从异校到异国到异地,总是有那么一点地理距离,但心越来越近,这种快乐就不足为外人道也。此外还特别幸运的找到了一个中文家教的工作,和学生他爹聊了半个上午,很说得来,等了两天果然就要我了,收入相当不错,可以解决去见女友的路费还有余,而且教人中文可以发现很多以前从来没有认真想过的语言问题。刚刚写完讲课的skript,明天去学生家第一次上课,但愿暑假在家里教德语的那一点经验能帮上忙,祝自己好运了。这学期除了正常的基础课还选了个Esperanto的课,这语言确实非常小众,所以班也很小,六七个人的规模,很快就熟了,老师也很不错,因为世界语不分Sie和du,于是学生和老师之间也用du称呼,亲近多了。这语言确实是最容易学的语言,非常有系统,特别注意避免歧义,很适合和计算机联系起来。看了学校的Erasmus的交流项目后,发现乌特勒支蛮不错的,想第5学期去交换个半年,有足够的时间准备,下学期开始正式学荷兰语,有德语英语基础,学个中间的语言应该不难,只是看球时经常看荷兰某电视台的信号,觉得说话很难听就是了,基本就是把法语和德语最难听的部分凑到一起。

先写这么多吧,试着慢慢找回写博客的感觉。

2011-01-10

殊途同归

分类: 红与黑


最近看完了一季英剧(其实也只有六集)《Accused》,中文译名很有深意又很误导人,叫《殊途同归》。之前看过的美剧英剧基本都是情景喜剧或者喜剧性质的,还有《迷失》这种拍着拍着编剧自己都迷失了的,这是头一次看悲剧,或许是这个原因,我觉得这是我看过最特殊的一个剧集。每一集的开头都是一个新的主角被庭警带着走上被告席,然后再开始讲述他/她是如何来到这里的,最后再进行判决,所以译名叫殊途同归,连同剧情的模式一样,都像是古希腊的悲剧,有很强的宿命的味道。不过之所以说译名误导人,是因为并非所有人最终都有罪,当每一集到最后的时候,主角会做一个简短的陈述,然后陪审团决定有罪或无罪,往往发言的那个陪审团成员会停顿一两秒,再说出决定主角接下来几十年生活的词,很难说这一秒钟有多少悬念,结果都不难猜到,但在这停顿中等待的是观众对自己所作出的判决的最后审视。

剧中涉及了各种犯罪的原因,有一念之差,有复仇,有出轨,有过失后的掩饰,有伪证,而并非每一个案件中道德上相对无辜的人都获得豁免或者被判得比别人更轻,看上去有一点普法教育的意思,可是到第三集就颠覆了这种模式,也是最感人的一集,实在是想剧透。大概内容是女主角的儿子Rob在工厂实习时操作机械意外死亡,却无意中发现工厂是没有安全培训,儿子的朋友当天在一起实习,被工厂笼络不愿作证,后来在主角的恳求之下同意,但主角多次控告工厂都败诉,已经负债累累无力再打官司,于是主角纵火烧了厂房,终于成了被告。在她的陈述中,直接表达了对法律的不屑,而一直不支持她打官司的丈夫,此时也穿上了小丑的服装,冲进法庭抗议,被拉下去后高唱Desperado(这首歌确实很能煽情……)。她对陪审团的最后陈述有这么一句话:I’m asking you to reach a verdict based not on LAW, but on something i’ve been thirsting for, something that Rob deserved and never got, something i’m frightened may no longer exist, JUSTICE. 即使法官试图给陪审团强调她的行为有多么严重的后果,她还是被陪审团宣判无罪释放。

我觉得到这里,这个剧集已经超越了简单的说教,至少引人开始有一点更深层的思考,比如法律和正义的冲突,而它作为类似于电影的艺术又夹杂着难以摆脱的宿命感和偶然性,如果换一批人做陪审团结果又会如何?在看剧情的时候,观众已经自发的进入了陪审团的角色(然而某些时候知道的信息要比片中实际的陪审团要多),也许会做出和片中不同的裁决,也可能设身处地想像根据片中陪审团得到的信息的判断,甚至想像如电影《十二怒汉》中那样与其他成员的辩论,也许哪天自己就会成为陪审团的一员,如果说这部剧集有教育意义,就在这里吧。

2011-01-07

关于钱村长,关于统计,关于错觉

分类: 红与黑


钱村长的惨案大概已经人尽皆知,没必要再复述了,我当然没见过所谓的真相,也没去过现场,物理也学得愧对师长,所以对于孰是孰非的猜测自觉闭嘴,这里只是想说说调查团出动之后的事。当网民组成的调查团带回了结果之后,两大著名博客韩寒老师李承鹏老师少见的表达了相反的观点,就此也引发了网民的各种议论。韩老师表示相信独立调查团的结果,大家应该就事论事,不应该把立场凌驾于真相之上;李老师则认为调查团也无法发现真相,虽然调查团成员的人品还是有保障的,但不他们也不是福尔摩斯,这种事太违背常理。我也没准备评论韩老师和李老师孰对孰错,只是发现这个现象可以套用一个简单的统计模型来解释。如下图所示。

TP 

这个模型中,Expert Truth即惨案的真相,不是指这一次,而是数年以来发生的多起被各种渠道报道过的可疑事件(强拆、上访等),其中有些是事实(T),有些是谣言(F)。这个AP Detection Algorithm(原图里面的东西,与本模型相似但无关)是指网民对此的态度,认为有些事件是政府所为(T),有些不是(F)。于是就有了这4种结果:TP是明察秋毫,FP是捕风捉影,FN是漏网之鱼,TN是相安无事。基于这些结果有如下几个相关指标:

   tp1

其中前两个指标比较有意义,precision指的是网民的所有怀疑中的正确率,sensitivity指的是所有的政府黑手事件中被网民认定的比率。由于网民容易激动的特质,通过观察分母不难发现,precision自然会偏低,而sensitivity偏高,于是成了两种常见的观点的主要论据。前者批评网民草木皆兵,一发生非正常事件就怀疑政府有问题,结果很多都怪罪错了;后者则赞扬网民消息灵通,思维广泛,很多冤案都在网上被广泛传播最终曝光。

那么有没有可能将precision和sensitivity都提高呢?显而易见,提高TP就行了嘛,如果网民都是狄仁杰福尔摩斯黑猫警长,当然是可以的。可这个属于智力和技术因素,是比较客观的东西,有自己的发展规律,无法通过价值取向的选择来改变。就像玩CS,你的枪法有限,点射还是扫射就看你的个人爱好了。倒不妨来翻译一下这个价值取向:你是愿意更加理智,让所有的指责都有根有据,还是愿意更加嫉恶如仇,让更多人都去关注你觉得可疑的事?似乎我到这里还没有表明态度,那换一种说法就清楚了,你是心疼我们的政府怕它承受不实的指责,还是心疼我们周围的人,怕他们死得不明不白,无处申冤?

还没有结束,最后要提到的才是最大的变量。首先要注意的一点是,这个模型其实是一个半黑箱,并不像其原版一样有标签可以用于检验,虽然TP,FP,FN,TN都是实实在在的,但我们并不知道结果是多少,只有部分被允许报道或者证据确凿无可辩驳的事件可以让我们管中窥豹。因为我们伟大的裆有一种条件反射,只要发生有负面影响的事件,就一定先捂着,捂臭再说。而最近在网民的压力之下,开放了部分事件,允许网民组织独立的调查团,而且往往都是比较有名气的人,因为大家都信得过。假设独立调查团得出的结果都是正确的,那么他们确实可以使得黑箱更加透明一点点,但是吊诡之处恰恰在此:请问政府是如何决定让不让网民组织和参与调查的?是掷骰子吗?当然不是,选择权完完全全在政府手上,他们也是唯一知道黑箱内部真实结果的一方,如果他们是“理性”的话,当然会做出有利于自己的选择。当调查团以非正常的比例反馈了更多提高FP观测值的真实结果时,再参照公式不难发现,我们观察到的sensitivity并没有改变,而precision却降低了。

我并不是否认调查团的作用,但事实就是,在半透明的情况下他们的结果会带来错觉,如果不允许所有合情合理的调查,那么黑箱永远是黑箱,还是个魔法黑箱。

2011-01-05

语言学笔记和瞎想(一)

分类: 语言学


在《语言引论》里看到一句引用于一个世纪以前的话:”There seems to have been in every period in the past, as there is now, a distinct apprehension in the minds of very many worthy persons that the English tougue is always in the condition approaching collapse and that arduous effort must be put forth persistently to save it from destruction.” 大意是说,总是有人杞人忧天的担心着英语的发展,担心如果没有小心翼翼的保护,它就会崩塌,毁于一旦。

这里批判的是所谓的规定性语法(prescriptive grammar),即一种主观的语法研究的趋势,并非描述人们如何使用一门语言,而是自己规定这门语言应该如何使用。1762年主教Robert Lowth结合自己的口味写了本语法书,“纠正”了一些当时各个阶层的人都习惯于使用的语法。比如I don’t have nothing. 他说这是不对的,双重否定应该是肯定;还有He is younger than me. 这也不对,应该是than I, 等等,很多地方都是源于拉丁语的语法而进行的修改。有意思的是人们确实照他的意愿改变了自己的语言习惯,因为人们希望通过这种“更正确”的语法来显示自己的上流社会身份。

不妨提一个问题,在如此规定之前和修改之后的英语是否进步了呢?在《语言引论》中提出了一个观点:所有的语言都是平等的,即使一个民族的科技水平大相径庭,却不能说哪一门语言更加高级,没有一门语言是初级的或者不正常的,它们的语法都具有足够的丰富和复杂程度。其实我总觉得这个论断的提出有一点“政治正确”的感觉,因为如果不这么说,就会有人追问:那哪一门语言比英语初级呢?是不是那个民族又也不如盎格鲁撒克逊民族呢?是不是你认同殖民主义?blablabla…这里推荐一篇很有意思的文章《译文:Does your language shape how you think?》。回到开始的问题,我觉得如果根据这个理论,可以强词夺理的说,连两门截然不同的语言都不能比较孰优孰劣,何况是一门语言在语法修改之前和之后的版本呢。这种说法强词夺理之处在于,两门语言在不同的方面的复杂度不同,最常见的例子是爱斯基摩人的语言中有几十个表达雪的词汇,但并不代表爱斯基摩语在整体上比英语发达,但单单在雪这个方面,它确实比英语描述得更精确,或者说在北极的生活环境中,爱斯基摩语比英语好用。

语言平等论认为,所有的语言都可以比较准确的描述任何其他语言能描述的事物,只是有时要用更多词而已。假设有一群使用英语的人在北极生活,为了描述不同的雪,最开始用冗长的形容词组合来描述某种类型,但由于经常会提到这种雪,显得特别啰嗦,就给它取个“昵称”,很快这种昵称就会成为一个标准的名词,那么到后来,他们也会有那么多关于雪的“英语”词汇。语言学里面有个很重要的定律叫齐普夫定律(Zipf’s Law),即使用频率越高的词,长度越短。那么我也冒昧的给这种语言演变的现象取个昵称叫“齐普夫化”,即人们总会试图将高频出现的长词变成短词。(当然也有一些“反齐普夫化”的现象,比如把伏地魔称为“那个连名字都不能提的魔王”)

再次回到之前的问题,我觉得这群生活在北极的人的那些新词很好的发展了某种方言,而主教规定的语法变化却很难说带来了什么样的进步,修改后的语法并没有丰富语言的内涵,也没有使语言变得更加简洁准确,至于优美与否那完全是个人的感受。

说起新词,很容易联想到层出不穷的网络语言以及有关部门对此的态度。禁止新语言元素的创造和使用无疑是可笑的,然而滥用新词也很无聊。一个词所能承载的意义有限,如果大量使用,那么不难想象有很多情况下根本没有意义,这种缺乏意义的滥用使得一个词在一瞬间由新鲜变得陈旧乃至消失。著名的傲娇派媒体人王小峰老师就是保卫词语意义的先行者,多次在其博客里更新自己要屏蔽的关键词,从以前的“沙发”“呵呵”到最近的“给力”“浮云”等等。最后,以魏武挥老师的一条饭否结束第一篇笔记吧:“一般说来,当一个网络用语出现在某些所谓“大典”、“盛会”或“高峰论坛”的主持人或嘉宾嘴里的时候,这个用语就到了“滥俗”的时候了”。

2011-01-01

新年展望

分类: 生活


 

想起来好像只做了简单的总结,还没做什么展望的,再补充一篇吧。很多不得不完成的任务摆在那,这倒没什么好说的,反正也改变不了,去做就是了,就列一些自己定的目标吧。

书:

  英文:Python自然语言处理

         牛津计算语言学手册(这个实在太厚了,能看多少算多少)

         An Introduction to Language(如果有时间的话,这本书里面有大量史努比的插画,which非常吸引我……)

  德文:德语语言学教程

         苏菲的世界

  中文书就随便了,总是很难静下心来看小说,稍微不吸引人一点的就会很快扔到一边,技术类的主要就是Python和网站方面了。

 

公开课:

  斯坦福:自然语言处理

  斯坦福:人机交互研讨

  再找个有意思点的文科课,先到处听听,觉得有意思的再追到底

 

语言:

  西语至少能顺利看懂简单的小说吧,我这天生的口语残障水平也不指望能流利交流了

  至于葡语,就看还有没有空余的时间了

 

已经够多了,再多的话也只能说说而已,一年后再回来检视看自己完成了多少吧。

TopBottom