Mar 8

    Mathematica 提供了一个看上去毫无用途的无厘头函数 Rasterize ,它可以以图片的格式输出运算结果。比如,下面这个句子可以打印出 (x+1)^n 的展开式的“倒影”:

   

    今天我突然想到,我们可以利用这个函数很方便地分析汉字在图象上的性质。函数 Binarize 可以把图象转换为单色单通道, ImageData 则可以把图象转换成数组的形式,以便我们定量分析。因此,下面这句话就可以把一个汉字转换成 12*12 的 01 矩阵:

   

查看更多 »

Mar 3

>>> http://www.matrix67.com/ideagen <<<

    在小学应用题里面,师徒二人的工作除了做衣服就是加工零件,百货商场里卖的永远是彩电和冰箱,村里的工程队不是修路就是挖水渠。长大了后,我才惊讶地发现,编出一道背景有新颖一些的应用题并不是一件容易事儿。在冰冷的键盘和屏幕前面,能够进入我们脑子里的东西并不多。在我写文章时,我经常需要想出一些贴近实际生活的例子,或是恰当而又有新意的比方;环顾四周,却发现身边的物品并没有带给我什么启发。此时,我竭尽全力去捕捉生活中的各种小事,却发现那些平时司空见惯的琐事很难被思维触及。
    于是,我写了一个小程序。每刷新一次,程序便会自动从近千个形容词和上万个名词中随机挑选出一对显示出来。当你在写文章、出题目、做策划时想不到什么好点子了,不妨用这个小工具来帮你打开思路。
 

Feb 23
汉字版Alphametic征集
icon1 Matrix67 |icon2 Brain Storm | icon4 2010-02-23 12:20 | icon324 Comments »

    Alphametic 是指这样一种有趣的文字游戏。在一个用字母组成的加法算式中,相同的字母代表相同的数字,不同的字母代表不同的数字。如果算式成立,那么这个数字谜有唯一解。而 Alphametic 的精髓就在于,整个算式本身也必须“有意义”。最经典的 Alphametic 可能是这个:

        SEND + MORE = MONEY

    它的唯一解是 9567 + 1085 = 10652 。

    就像灯谜、对联一样,作为一种文字游戏, Alphametic 也有很多异常牛 B 的,比如:

        EARTH + AIR + FIRE + WATER = NATURE

    1969 年,有人发现了这样一个有趣的 Alphametic:

        THREE + THREE + TWO + TWO + ONE = ELEVEN

    这样的 Alphametic 叫做 Doubly-True Alphametic 。可以证明上面这个 Doubly-True Alphametic 是合法的 Alphametic 中“最小的”一个。一个稍微大一点的 Doubly-True Alphametic 为:

        SEVEN + SEVEN + SIX = TWENTY

查看更多 »

Jan 14

    语言统计分析期末大作业要求我们统计全唐诗中的对偶字,并用所得到的统计结果反过来评判出对仗最工整的诗句。我在数据处理过程中突然想到,鉴于互成对偶的两个字之间有一定的语义联系,我们便有了一个庞大的汉字语义关联库;如果把所有汉字之间的关联画成一张图会是什么样子呢?于是我用 Mathematica 7 提出了全唐诗中处在对偶位置上的所有字对,得到了 464448 个可能的对偶关系;再利用一些算法得到了最稳定、最常用的 2000 个对偶关系,把它们都描绘在一张大图上,于是便有了上面的这个图。点击这里查看高清无码大图,1600x1600 像素。可以看到,有语义关联的汉字自动地聚合到了一起。

查看更多 »

Aug 26

上面这张图片里隐藏了不少与爱情相关的单词,你能找出几个来?
图片来源:http://www.bantjes.com/index.php?id=221

May 23

    转眼间又到期末了,各科的课程都差不多结束了。回顾这个学期的课程,音韵学毫无疑问成为了最不科学的课,而语义学和虚词研究则成为了本学期最具科学性的两门课。这学期我在沈阳老师的语义学课程中学到了不少东西,有几节课尤其精彩,以至于当时我就拍案叫绝,发誓一定要把它们写到Blog上。最精彩的一节课是关于“把”字句分析的专题讲解,其科学性、趣味性和大众性远远超过了这里这里的例子,成为了我向别人介绍语言学时引入的最佳例子。从对“把”字句的分析中我们可以看到更多语言学研究方法,其论证思想绝不亚于数理学科。

    小学语文变“把”字句“被”字句时无外乎“风把小树刮倒了”、“解放军把敌人打败了”、“大水把铁牛冲走了”,这无形之中给人带来了这样一种错觉:“把”字后面的名词是动词的宾语。例如,“小树”就是“刮”的宾语,“敌人”就是“打”的对象,“水”冲走的当然也就是“铁牛”。事实上,确实也有很多学术文章指出,“把”后名词就是动词的宾语。“宾语说”的支持者们提出了一个直观的、强有力的证据:你可以把“把”字句重新还原回主动宾结构。例如,“风把小树刮倒了”的意思就是“风刮倒了小树”,“解放军把敌人打败了”就相当于“解放军打败了敌人”,“大水把铁牛冲走了”无异于“大水冲走了铁牛”。这种说法虽然适用于绝大多数“把”字句,但也并非毫无破绽。例如,“妈妈把钱存在银行里”怎么还原为主动宾结构?妈妈存钱在银行里?妈妈存在银行里钱?都不对。这一反例足以对“宾语说”构成威胁。事实上,我们能举出很多例子来驳斥“宾语说”。一种听来奇怪但我们日常生活里常常使用的句子就是“别把自己病倒了”,这里“自己”明显只能是“病”的主语。类似的句子不止一个,像“他把老伴儿死了”、“把犯人跑了”等等,感觉虽然奇怪,但实际生活中用得不少。另一类句子更奇怪,动词和“把”后名词间根本没有直接联系,像“把肚子笑疼了”,“肚子”一词既不是“笑”的主语,也不是“笑”的宾语,事实上它与“笑”没有任何关系。“把眼睛哭肿了”、“把手帕哭湿了”也是如此,“眼睛”和“手帕”与动作“哭”没有任何结构上的联系。“宾语说”至此已完全破产。

查看更多 »

Apr 16

(拜托转载时请用红色加粗字体标明,这是我古今数学思想课的期中论文,免得老师以为我是反过来抄的网上的文章。这门通选课的期中论文要求写数学与自己所在专业之间的联系。)

    我们每天都在说话,每天都在用语言进行交流。语言文字对我们是如此的平常,以至于绝大多数人都不会注意到语言中一些非常难以解释的现象。昨天的汉语虚词研究课上,我们就谈到了这样一个有趣的问题:在表示“仅仅”的含义时,什么时候能够用“只”,什么时候能够用“光”?若不细想的话,大家或许会认为两者的用法完全一样。“我只吃苹果”可以说成“我光吃苹果”,“光有知识还不行”也可以说成是“只有知识还不行”。我们还可以举出更多的例子来,如“别光坐着”/“别只坐着”,“光说不做”/“只说不做”等等。凭借天生的归纳性思维,一个正常人有充分的理由猜想,在表示“仅仅”的含义时,“只”和“光”是通用的。而事实上,现代汉语词典中正是把“光”字解释为“只”。有趣的是,在我们质疑只找了四个例子是否足以说明二者等价时,殊不知这句质疑本身就成了一个反例:“只找了四个例子”不能换成“光找了四个例子”。类似地,“大会只来了748个人”也不能说“大会光来了748个人”。我们继续猜想,是不是“光”不能用在数量词前面呢?也不见得。当数量词不是实指而是虚指时,我们有时也能用“光”来修饰带有数量词的名词。例如,在表示“只吃几个苹果”、“只吃一些苹果”的意义时,“光吃两个苹果”的说法是很顺口的。另一些例子则表明,“光”的用法似乎与它所修饰的名词无关。“我只当到团长”不能说成是“我光当到团长”,但怪就怪在“我只认识团长”却又偏偏可以说成是“我光认识团长”。“当到团长”和“认识团长”有什么不同呢?仔细揣摩两者的意思,我们似乎体会到了一些微妙的差别:“当到团长”是一个阶段性的、进度性的、里程碑性的概念,它必须事先经过“当到连长”、“当到营长”等事件;但“认识团长”就不一样了,没有任何规定限制我们在“认识团长”之前必须“认识连长”。同样的,“找出四个例子”是以“找了三个例子”为前提的,“来了748个人”也不是一下子就能实现的。

    问题算是想通了,但怎么来阐述它呢?在这个问题上,语言学陷入了一个困境。此时,引入数理逻辑语言对于解释这种语言现象出乎意料的方便。我们说,在副词“只”修饰的事件所处的“域”中如果存在蕴含关系,则这里的“只”不能用“光”来替代。例如,提起“吃两个苹果”,我们脑海中形成的事件集合一定是“吃一个苹果”、“吃两个苹果”、“吃三个苹果”等等,而后者必然蕴含前者,因此“只吃两个苹果”不能说成“光吃两个苹果”。类似的,“当到团长”必然推出“当到连长”,但有“认识团长”不见得有“认识连长”,因此两者与“只”和“光”的搭配情况是不同的。

查看更多 »

Mar 8

昨天晚上躺在床上发呆,想了几则数学字谜。下面每个式子都对应一个英文单词,例如的意思就是tank。
你能猜出多少个来呢?

1.

2.

3.

4.

5.

查看更多 »

« 更早的日志