1.7是 數(shù)組+鏈表 1.8是 數(shù)組+鏈表【超過閾值會變成紅黑樹】
如何解決Hash沖突問題擴容條件- 鏈表長度超過8
- 元素個數(shù)超過數(shù)組個數(shù)的75%
- 鏈表長度超過8
- 此時看看數(shù)組長度是否超過64,超過就進行樹化,否則只是單純擴容
其實一般正常的元素,都是不會超過閾值的,只有插入一堆重復的元素,hash值一樣,才可能達到閾值,這個簡稱Dos攻擊 而元素一旦多起來,鏈表查找的效率就遠不及紅黑樹了
?♂?樹化一定更好嗎?不是的,維護紅黑樹需要占用比鏈表更多的空間,而且當鏈表長度足夠短的時候,鏈表查找的效率反而比紅黑樹更高??
為什么選擇0.75和8root、root.left、root.right、root.left.left 有一個為 null ,也會退化為鏈表(看的是移除之前的情況)
為什么需要二次哈希先獲得key的hashCode的值 h,然后 h 和 h右移16位 做異或運算。
實質上是把一個數(shù)的末x位低16位與他的高16位做異或運算,因為在前面 (n - 1) & hash 的計算中,hash變量只有末x位會參與到運算。使高16位也參與到hash的運算能減少沖突
只有2的n次方,去-1,才能用 & 替代 %
為了方便擴容擴容時重新計算索引效率更高: hash & oldCap == 0 的元素留在原來位置 否則新位置 = 舊位置 + oldCap (oldCap:原始的容量)
因為HashMap的初始容量是2的次冪,擴容之后的長度是原來的二倍,新的容量也是2的次冪,所以,元素,要么在原位置,要么在原位置再移動2的次冪。
看下這張圖,n為table的長度 圖a表示擴容前的key1和key2兩種key確定索引的位置 圖b表示擴容后key1和key2兩種key確定索引位置。
元素在重新計算hash之后,因為n變?yōu)?倍,那么n-1的mask范圍在高位多1bit(紅色),因此新的index就會發(fā)生這樣的變化:
所以在擴容時,只需要看原來的hash值新增的那一位是0還是1就行了【直接 hash & oldCap,就能知道是0還是1了】 是0的話索引沒變,是1的話就變成原索引+oldCap
不用2的n次方可以嗎可以的,因為2的n次方也會有缺陷,比如給定的值全是偶數(shù),無論如何hash之后取模,都是偶數(shù),分布就不均勻
注意此時如果用質數(shù)作為容量的話,就會分布得比較均勻
二次 hash 是為了配合 容量是 2 的 n 次冪 這一設計前提,如果 hash 表的容量不是 2 的 n 次冪,則不必二次 hash
容量是 2 的 n 次冪 這一設計計算索引效率更好,但 hash 的分散性就不好,需要二次 hash 來作為補償,沒有采用這一設計的典型例子是 Hashtable
并發(fā)擴容丟失數(shù)據(jù)問題主要是第一個節(jié)點才會吧?因為第一個是new Node出來的
jdk1.7 并發(fā)擴容死鏈問題jdk1.7中,采用的是頭插法,用一個e指針表示當前要擴容的節(jié)點,next表示接下來要擴容的節(jié)點,一直頭插e更新e為next,直到e為null
假設現(xiàn)在有兩個線程1和2,要擴容一個Map
- 線程1的局部變量e,指向了a節(jié)點,next指向b節(jié)點
- 線程2的局部變量也是如此,此時線程2先進行擴容,由于是頭插法,最終結果變成了 b->a
- 但此時來到線程1先進行,局部變量不會受改變,e還是指向a,next還是b,所以把a頭插,并且更新e為next,也就變成了b
- 線程1繼續(xù)頭插b,沒問題,結果變成了[b->a],看起來是沒問題了,但是接下來判斷e還沒有next:
- 發(fā)現(xiàn)e的next是a,又要繼續(xù)頭插a,插完a之后,發(fā)現(xiàn)a的next又是b,寄了這下,無限循環(huán)了
原文鏈接:https://juejin.cn/post/7160661444143841288