数据结构---哈希表（散列表）

楼主^#

更多发布于：2019-10-16 16:56

1.哈希表的概念和思想
哈希表是唯一的专用于集合的数据结构。可以以常量的平均时间实现插入、删除和查找

哈希表的思想是：用一个与集合规模差不多大的数组来存储这个集合，将数据元素的关键字映射到数组的下标，这个映射称为“散列函数”，数组称为“散列表”。查找时，根据被查找的关键字找到存储数据元素的地址，从而获取数据元素。

由于任何类型的数据都能转化为一个整数型，我们假设所有的数据元素的关键字都是较小的非负整数，就可以用一个简单的数组Data保存这个集合，数据类型就是集合中的元素的类型。
开始时，给数组的每个元素赋空值，NULL。当要在集合中插入一个关键字为Key的数据元素时，就检查Data[Key]是否为空。如果为空，则吧插入的元素存储在Data[Key]中；如果不为空，则表示遇到重复元素，插入失败。
当要查找某个数据元素时，只需要根据查找的关键字Key直接取出Data[Key]的值，如果Data[Key]的值为空，则表示关键字对应的元素不存在。否则，Data[Key]就是要查找的元素。删除时，只需要将对应数组的元素设为NULL即可。每种操作的时间为一个常量。
散列函数函数的应用带来一个复杂的问题：
因为散列函数的定义域范围比值域大，两个或更多的数据元素可能被映射到同一个位置，称为“冲突或碰撞”。这种情况是不可避免的。因此，实现散列表的两个最基本的问题是：如何设计散列函数，如何解决碰撞。

2.散列函数

在散列表中。插入、删除和查找都会用到散列函数。散列函数的计算速度直接影响散列表的性能。好的散列函数的一个标准就是：计算速度快。另一点就是：结点的散列地址尽可能均匀。使得冲突的机会尽可能少。
常用的散列函数包括直接定址法、保留余数法、数字分析法、平方取中法和折叠法等。

个人理解：最近对散列函数，进行了一个详细了解，hash（哈希）的形式，有点像我们平时所对的键值对的形式，如果我们的数据是使用哈希存储（即键值对）操作，那查找，添加，删除都时间复杂度都为O(1), 非常完美。
但是，有下面几个问题也是需要我们去考虑
1. 每一个数据元素，都对应一个键，我们需要存储这个键值关系，即我们的哈希表（或散列表）
2. 用什么样的方法，给数据元素对应设置不同的键（散列函数的工作），特别是数据较多时，如何让生成的键不重复（即冲突），这是我们要考虑的一个重点。
而上述的散列函数的种类，就是采用不同的算法来生成我们的对应关系。

ps: 以上是我个人的一个理解，用于帮助自己的理解，如有不一样的，欢迎讨论

各种方法的详解参考：
https://www.cnblogs.com/zhuweiheng/p/8207255.html

喜欢1

数据结构---哈希表（散列表）

最新喜欢：