简述汉字容量极限定律
【正确答案】:还有一个反映语言数学面貌的重要的信息论参数,叫熵。熵本来是物理学中的一个术语,表示热力学系统中分子混乱的程度,在信息论中,就把随机试验结局的不肯定程度的大小叫做熵。在接收到语言符号之前,因语言符号的数目和出现概率的不同而有所不同。在接受到语言符号之后,不肯定性被消除,熵等于零。可见,信息量等于被消除的熵,我们只要测出了语言符号的熵,就可以了解到语言符号所负荷的信息量是多少。由于汉字数量太大,出现概率又不同,因此计算起来十分复杂。冯志伟用逐渐扩大汉字容量的办法,计算出在不同汉字容量时,包含在一个汉字中的熵。当汉字容量是12370时,值是9.65,当汉字容量超过12370以后,随着汉字容量的继续扩大,请值不会再有显著的增加。冯志伟称此为“汉字容量极限定律”。