1.7是 數(shù)組+鏈表 1.8是 數(shù)組+鏈表【超過閾值會變成紅黑樹】
如何解決Hash沖突問題擴容條件- 鏈表長度超過8
- 元素個數(shù)超過數(shù)組個數(shù)得75%
- 鏈表長度超過8
- 此時看看數(shù)組長度是否超過64,超過就進行樹化,否則只是單純擴容
其實一般正常得元素,都是不會超過閾值得,只有插入一堆重復得元素,hash值一樣,才可能達到閾值,這個簡稱Dos攻擊 而元素一旦多起來,鏈表查找得效率就遠不及紅黑樹了
?♂?樹化一定更好么?不是得,維護紅黑樹需要占用比鏈表更多得空間,而且當鏈表長度足夠短得時候,鏈表查找得效率反而比紅黑樹更高??
為什么選擇0.75和8root、root.left、root.right、root.left.left 有一個為 null ,也會退化為鏈表(看得是移除之前得情況)
為什么需要二次哈希先獲得key得hashCode得值 h,然后 h 和 h右移16位 做異或運算。
實質(zhì)上是把一個數(shù)得末x位低16位與他得高16位做異或運算,因為在前面 (n - 1) & hash 得計算中,hash變量只有末x位會參與到運算。使高16位也參與到hash得運算能減少沖突
只有2得n次方,去-1,才能用 & 替代 %
為了方便擴容擴容時重新計算索引效率更高: hash & oldCap == 0 得元素留在原來位置 否則新位置 = 舊位置 + oldCap (oldCap:原始得容量)
因為HashMap得初始容量是2得次冪,擴容之后得長度是原來得二倍,新得容量也是2得次冪,所以,元素,要么在原位置,要么在原位置再移動2得次冪。
看下這張圖,n為table得長度 圖a表示擴容前得key1和key2兩種key確定索引得位置 圖b表示擴容后key1和key2兩種key確定索引位置。
元素在重新計算hash之后,因為n變?yōu)?倍,那么n-1得mask范圍在高位多1bit(紅色),因此新得index就會發(fā)生這樣得變化:
所以在擴容時,只需要看原來得hash值新增得那一位是0還是1就行了【直接 hash & oldCap,就能知道是0還是1了】 是0得話索引沒變,是1得話就變成原索引+oldCap
不用2得n次方可以么可以得,因為2得n次方也會有缺陷,比如給定得值全是偶數(shù),無論如何hash之后取模,都是偶數(shù),分布就不均勻
注意此時如果用質(zhì)數(shù)作為容量得話,就會分布得比較均勻
二次 hash 是為了配合 容量是 2 得 n 次冪 這一設(shè)計前提,如果 hash 表得容量不是 2 得 n 次冪,則不必二次 hash
容量是 2 得 n 次冪 這一設(shè)計計算索引效率更好,但 hash 得分散性就不好,需要二次 hash 來作為補償,沒有采用這一設(shè)計得典型例子是 Hashtable
并發(fā)擴容丟失數(shù)據(jù)問題主要是第壹個節(jié)點才會吧?因為第壹個是new Node出來得
jdk1.7 并發(fā)擴容死鏈問題jdk1.7中,采用得是頭插法,用一個e指針表示當前要擴容得節(jié)點,next表示接下來要擴容得節(jié)點,一直頭插e更新e為next,直到e為null
假設(shè)現(xiàn)在有兩個線程1和2,要擴容一個Map
- 線程1得局部變量e,指向了a節(jié)點,next指向b節(jié)點
- 線程2得局部變量也是如此,此時線程2先進行擴容,由于是頭插法,最終結(jié)果變成了 b->a
- 但此時來到線程1先進行,局部變量不會受改變,e還是指向a,next還是b,所以把a頭插,并且更新e為next,也就變成了b
- 線程1繼續(xù)頭插b,沒問題,結(jié)果變成了[b->a],看起來是沒問題了,但是接下來判斷e還沒有next:
- 發(fā)現(xiàn)e得next是a,又要繼續(xù)頭插a,插完a之后,發(fā)現(xiàn)a得next又是b,寄了這下,無限循環(huán)了
原文鏈接:感謝分享juejin感謝原創(chuàng)分享者/post/7160661444143841288