不是VIP会员,不能显示答案

题目解答

题目:
现有一段文言文,要通过二进制哈夫曼编码进行压缩。简单起见,假设这段文言文只由4个汉字“之”、“乎”、“者”、“也”组成,它们出现的次数分别为700、600、300、400。那么,“也”字的编码长度可能是( )。
  • A.1
  • B.2
  • C.3
  • D.4
考点: 0
分析:
解答: 解析:初赛常考的哈夫曼编码。
给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman tree)。
哈夫曼树的构造方法:
  假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:
  (1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
  (2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
  (3)从森林中删除选取的两棵树,并将新树加入森林;
(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。

哈夫曼编码是一种很犀利的编码,把使用频率高的编为短一点的编码,使用频率低的长一点。一般方法是建一棵哈弗曼树,然后左子树为0右子树为1,从上到下的一条路为这个叶子结点的编码。把所有东西放到一个集合F中,在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树的根结点的权值为其左右子树的根结点的权值之和。 从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合F中。这样,从这题来看,先弄300和400的两个,变成一个根为700的树。然后现在就有600,700,700,选600和其中一个700再做一颗树。这样就会有两种情况,“也”可能是2位也可能是3位,所以选BC。
评论:
老师: 0