答:从数组(直接寻址表T[0...m-1])中最后一个元素开始,向前查找第一个不为空的。最坏情况是数组里只有第一个位置存储了最小的元素,O(n)。
请说明如何用一个位向量来表示一个包含不同元素(无卫星数据)的动态集合。字典操作的运行时间应该是O(1)。
答:0表示对应index的元素不存在,1表示存在。适合用来表示不包含卫星数据的数字元素。
答:代码见DirectAddressTable
有三个注意点,有点意思。
答:对链表中每一个元素,先比较该元素与待查关键字的散列值。若一样,在比较字符串值。(感觉和Java的HashSet处理思路一样!先比较hashcode,再比较equals)
由于它被当做以128为基数的数来处理,就要占用若干个机器字。假设应用除法来计算一个字符串的散列值,那么如何才能除了该串本身占用的空间外,只利用常数个机器字?
答:其实考察的是,如何快速高效地生成string的hashcode。
原始算法为:字符串第i位的散列码=(ASCII码乘上128^i),最终散列码为各位的散列码加和。这里可能有整数溢出。以下2种处理方案:
- 让最终散列码自由溢出; 这种肯定低效,如果字符串很长的话,那么超过一定长度时溢出是一定的,这样多次128乘法是没有必要的。
- 让每个char的散列码都mod(m),最后加和还mod(m)。 然后最后结果超过m时自由溢出。感觉也不好。
- 采用字符串分组的思想。以128为基数,当字符串长度达到一定长度时一定会导致32位整数溢出,设这个长度为MAX。那么对于一个给定的字符串,当字符串长度不超过MAX时,就按照各位正常的基数加和来计算哈希值; 当字符串长度超过了MAX时,把字符串分组,每组视为一个字符串,一组的ASCII码为这组内所有字符串ASCII码之和。
证明:如果串x可由串y通过其自身的置换排列导出,则x和y具有相同的散列值。给出一个应用例子,其中这一特性在散列函数中是不希望出现的。 答:不证明了。这个题目本身挺值得注意的。说明散列值的设计是很需要注意的。
11.3-4 考虑一个大小为m=1000的散列表和一个对应的散列函数h(k)=floor(m(kA mod 1)),A=(sqrt(5)-1)/2。计算关键字61、62、63、64和65被映射到的位置。
答:A=0.6180339887
61: 700
62: 318
63: 936
64: 554
65: 172