浅谈 equals() 和 hashCode()

本文最后更新于 2025年5月20日 14:18

equals()==

== 可以用来判断基本数据类型和引用数据类型:

  • 对于基本数据类型来说,== 比较的是值。
  • 对于引用数据类型来说,== 比较的是对象的内存地址。

equals() 只能用来判断两个对象是否相等。 equals() 方法存在于 Object 类中,所以所有类都有 equals() 方法。

Object 类中 equals() 方法的实现:

1
2
3
public boolean equals(Object obj) {
return (this == obj);
}

equals() 方法存在两种使用情况:

  • 类没有重写 **equals()**方法:通过equals()比较该类的两个对象时,等价于通过 == 比较这两个对象,使用的默认是 Objectequals()方法。
  • 类重写了 **equals()**方法:一般我们都重写 equals()方法来比较两个对象中的属性是否相等;若它们的属性相等,则返回 true(即,认为这两个对象相等)。

hashCode() 方法的作用

hashCode() 方法的作用是获取哈希码(或者叫散列码)。这个哈希码的作用是当该对象被存储到哈希表中,确定其在哈希表中的索引位置。hashCode() 定义在 JDK 的 Object 类中,这就意味着 Java 中的任何类都包含有 hashCode() 函数,并且 hashCode() 是本地方法(也就是用 C 或 C++ 实现的)。

hashCode() 的底层实现

Java 中 hashCode() 方法的底层实现通常与对象的内存地址相关,但具体实现依赖于 JVM 。对象的 hashCode 只有在首次调用 hashCode() 方法时才会进行计算,并存储到 MarkWord 中。以 HotSpot JVM 为例,其提供了多种哈希生成策略,开发者可通过 JVM 参数 -XX:hashCode=n 来选择:

  • 0:使用 Park-Miller 随机数生成器。
  • 1:基于对象地址和全局状态的函数。
  • 2:所有对象的哈希值为常数 1。
  • 3:使用序列计数器。
  • 4:直接使用对象地址。
  • 5:基于线程状态的 Xorshift 算法。

hashCode() 存在的意义

原文链接:https://javaguide.cn/java/basis/java-basic-questions-02.html

当你把对象加入 HashSet 时,HashSet 会先计算对象的 hashCode 值来判断对象加入的位置,同时也会与其他已经加入的对象的 hashCode 值作比较,如果没有相符的 hashCode,HashSet 会假设对象没有重复出现。但是如果发现有相同 hashCode 值的对象,这时会调用 equals() 方法来检查 hashCode 相等的对象是否真的相同。如果两者相同,HashSet 就不会让其加入操作成功。如果不同的话,就会重新散列到其他位置。这样我们就大大减少了 equals 的次数,相应就大大提高了执行速度。

其实, hashCode() 和 equals()都是用于比较两个对象是否相等。

那为什么 JDK 还要同时提供这两个方法呢?

这是因为在一些容器(比如 HashMapHashSet)中,有了 hashCode() 之后,判断元素是否在对应容器中的效率会更高(参考添加元素进HashSet的过程)!

我们在前面也提到了添加元素进HashSet的过程,如果 HashSet 在对比的时候,同样的 hashCode 有多个对象,它会继续使用 equals() 来判断是否真的相同。也就是说 hashCode 帮助我们大大缩小了查找成本。

那为什么不只提供 hashCode() 方法呢?

这是因为两个对象的hashCode 值相等并不代表两个对象就相等。

那为什么两个对象有相同的 hashCode 值,它们也不一定是相等的?

因为 hashCode() 所使用的哈希算法也许刚好会让多个对象传回相同的哈希值。越糟糕的哈希算法越容易碰撞,但这也与数据值域分布的特性有关(所谓哈希碰撞也就是指的是不同的对象得到相同的 hashCode )。

总结下来就是:

  • 如果两个对象的hashCode 值相等,那这两个对象不一定相等(哈希碰撞)。
  • 如果两个对象的hashCode 值相等并且equals()方法也返回 true,我们才认为这两个对象相等。
  • 如果两个对象的hashCode 值不相等,我们就可以直接认为这两个对象不相等。

为什么重写 equals() 时必须重写 hashCode() 方法?

因为两个相等的对象的 hashCode 值必须是相等。也就是说如果 equals 方法判断两个对象是相等的,那这两个对象的 hashCode 值也要相等。

如果重写 equals() 时没有重写 hashCode() 方法的话就可能会导致 equals 方法判断是相等的两个对象,hashCode 值却不相等。

思考:重写 equals() 时没有重写 hashCode() 方法的话,使用 HashMap 可能会出现什么问题。解答可以参考:Java hashCode() 和 equals()的若干问题解答 - 如果天空不死 - 博客园

总结

  • equals 方法判断两个对象是相等的,那这两个对象的 hashCode 值也要相等。
  • 两个对象有相同的 hashCode 值,他们也不一定是相等的(哈希碰撞)。

浅谈 equals() 和 hashCode()
http://example.com/2024/12/05/浅谈 equals() 和 hashCode()/
作者
Moonike
发布于
2024年12月5日
更新于
2025年5月20日
许可协议