這次跟大家分享一些優(yōu)化神技，當(dāng)你工作中遇到如下問(wèn)題，那就使出今天學(xué)到的絕招，一招定乾坤！

?

如何用更少的內(nèi)存保存更多的數(shù)據(jù)？

我們應(yīng)該從 Redis 是如何保存數(shù)據(jù)的原理展開(kāi)，分析鍵值對(duì)的存儲(chǔ)結(jié)構(gòu)和原理。

從而繼續(xù)延展出每種數(shù)據(jù)類(lèi)型底層的數(shù)據(jù)結(jié)構(gòu)，針對(duì)不同場(chǎng)景使用更恰當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)和編碼實(shí)現(xiàn)更少的內(nèi)存占用。

為了保存數(shù)據(jù)， Redis 需要先申請(qǐng)內(nèi)存，數(shù)據(jù)過(guò)期或者內(nèi)存淘汰需要回收內(nèi)存，從而拓展出內(nèi)存碎片優(yōu)化。

最后，說(shuō)下 key、value 使用規(guī)范和技巧、 Bitmap 等高階數(shù)據(jù)類(lèi)型，運(yùn)用這些技巧巧妙解決有限內(nèi)存去存儲(chǔ)更多數(shù)據(jù)難題……

這一套組合拳下來(lái)直接封神。

具體詳情，且看「碼哥」一一道來(lái)。

主要優(yōu)化神技如下：

鍵值對(duì)優(yōu)化；
小數(shù)據(jù)集合的編碼優(yōu)化；
使用對(duì)象共享池；
使用 bit 比特位或 byte 級(jí)別操作
使用 hash 類(lèi)型優(yōu)化；
內(nèi)存碎片優(yōu)化；
使用 32 位的 Redis。

在優(yōu)化之前，我們先掌握 Redis 是如何存儲(chǔ)數(shù)據(jù)的。

Redis 如何存儲(chǔ)鍵值對(duì)

redis 以 redisDb為中心存儲(chǔ)，redis 7.0 源碼在 https://github.com/redis/redis/blob/7.0/src/server.h：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

redisDb

dict：最重要的屬性之一，就是靠這個(gè)定義了保存了對(duì)象數(shù)據(jù)鍵值對(duì)，dcit 的底層結(jié)構(gòu)是一個(gè)哈希表。
expires：保存著所有 key 的過(guò)期信息.
blocking_keys 和 ready_keys 主要為了實(shí)現(xiàn) BLPOP 等阻塞命令
watched_keys用于實(shí)現(xiàn)watch命令，記錄正在被watch的一些key，與事務(wù)相關(guān)。
id 為當(dāng)前數(shù)據(jù)庫(kù)的id，redis 支持單個(gè)服務(wù)多數(shù)據(jù)庫(kù)，默認(rèn)有16個(gè)；
clusterSlotToKeyMapping：cluster 模式下，存儲(chǔ)key 與哈希槽映射關(guān)系的數(shù)組。

Redis 使用「dict」結(jié)構(gòu)來(lái)保存所有的鍵值對(duì)（key-value）數(shù)據(jù)，這是一個(gè)全局哈希表，所以對(duì) key 的查詢能以 O(1) 時(shí)間得到。

所謂哈希表，我們可以類(lèi)比 Java 中的 HashMap，其實(shí)就是一個(gè)數(shù)組，數(shù)組的每個(gè)元素叫做哈希桶。

dict 結(jié)構(gòu)如下，源碼在 https://github.com/redis/redis/blob/7.0/src/dict.h：

struct dict { // 特定類(lèi)型的處理函數(shù) dictType *type; // 兩個(gè)全局哈希表指針數(shù)組，與漸進(jìn)式 rehash 有關(guān) dictEntry **ht_table[2]; // 記錄 dict 中現(xiàn)有的數(shù)據(jù)個(gè)數(shù)。 unsigned long ht_used[2]; // 記錄漸進(jìn)式 rehash 進(jìn)度的標(biāo)志， -1 表示當(dāng)前沒(méi)有執(zhí)行 rehash long rehashidx; // 小于 0 表示 rehash 暫停 int16_t pauserehash; signed char ht_size_exp[2];};

dictType：存儲(chǔ)了hash函數(shù)，key和value的復(fù)制等函數(shù)；
ht_table：長(zhǎng)度為 2 的數(shù)組，正常情況使用 ht_table[0] 存儲(chǔ)數(shù)據(jù)，當(dāng)執(zhí)行 rehash 的時(shí)候，使用 ht_table[1] 配合完成。

key 的哈希值最終會(huì)映射到 ht_table 的一個(gè)位置，如果發(fā)生哈希沖突，則拉出一個(gè)哈希鏈表。

大家重點(diǎn)關(guān)注 dictEntry 類(lèi)型的 ht_table，ht_table 數(shù)組每個(gè)位置我們也叫做哈希桶，就是這玩意保存了所有鍵值對(duì)。

?

碼哥，Redis 支持那么多的數(shù)據(jù)類(lèi)型，哈希桶咋保存？

哈希桶的每個(gè)元素的結(jié)構(gòu)由 dictEntry 定義：

typedef struct dictEntry { // 指向 key 的指針 void *key; union { // 指向?qū)嶋H value 的指針 void *val; uint64_t u64; int64_t s64; double d; } v; // 哈希沖突拉出的鏈表 struct dictEntry *next;} dictEntry;

key 指向鍵值對(duì)的鍵的指針，key 都是 string 類(lèi)型。
value 是個(gè) union（聯(lián)合體）當(dāng)它的值是 uint64_t、int64_t 或 double 類(lèi)型時(shí)，就不再需要額外的存儲(chǔ)，這有利于減少內(nèi)存碎片。（為了節(jié)省內(nèi)存操碎了心）當(dāng)然，val 也可以是 void 指針，指向值的指針，以便能存儲(chǔ)任何類(lèi)型的數(shù)據(jù)。
next 指向另一個(gè) dictEntry 結(jié)構(gòu)，多個(gè) dictEntry 可以通過(guò) next 指針串連成鏈表，從這里可以看出， ht_table 使用鏈地址法來(lái)處理鍵碰撞：當(dāng)多個(gè)不同的鍵擁有相同的哈希值時(shí)，哈希表用一個(gè)鏈表將這些鍵連接起來(lái)。

哈希桶并沒(méi)有保存值本身，而是指向具體值的指針，從而實(shí)現(xiàn)了哈希桶能存不同數(shù)據(jù)類(lèi)型的需求。

而哈希桶中，鍵值對(duì)的值都是由一個(gè)叫做 redisObject 的對(duì)象定義，源碼地址：https://github.com/redis/redis/blob/7.0/src/server.h。

typedef struct redisObject { unsigned type:4; unsigned encoding:4; unsigned lru:lru_BitS; int refcount; void *ptr;} robj;

type：記錄了對(duì)象的類(lèi)型，string、set、hash 、Lis、Sorted Set 等，根據(jù)該類(lèi)型才可以確定是哪種數(shù)據(jù)類(lèi)型，使用什么樣的 API 操作。
encoding：編碼方式，表示 ptr 指向的數(shù)據(jù)類(lèi)型具體數(shù)據(jù)結(jié)構(gòu)，即這個(gè)對(duì)象使用了什么數(shù)據(jù)結(jié)構(gòu)作為底層實(shí)現(xiàn)保存數(shù)據(jù)。同一個(gè)對(duì)象使用不同編碼實(shí)現(xiàn)內(nèi)存占用存在明顯差異，內(nèi)部編碼對(duì)內(nèi)存優(yōu)化非常重要。
lru:LRU_BITS：LRU 策略下對(duì)象最后一次被訪問(wèn)的時(shí)間，如果是 LFU 策略，那么低 8 位表示訪問(wèn)頻率，高 16 位表示訪問(wèn)時(shí)間。
refcount ：表示引用計(jì)數(shù)，由于 C 語(yǔ)言并不具備內(nèi)存回收功能，所以 Redis 在自己的對(duì)象系統(tǒng)中添加了這個(gè)屬性，當(dāng)一個(gè)對(duì)象的引用計(jì)數(shù)為 0 時(shí)，則表示該對(duì)象已經(jīng)不被任何對(duì)象引用，則可以進(jìn)行垃圾回收了。
ptr 指針：指向?qū)ο蟮牡讓訉?shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)，指向值的指針。

如下圖是由 redisDb、dict、dictEntry、redisObejct 關(guān)系圖：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

redis存儲(chǔ)結(jié)構(gòu)

「碼哥」再嘮叨幾句，void *key 和 void *value 指針指向的是 redisObject，Redis 中每個(gè)對(duì)象都是用 redisObject 表示。

知道了 Redis 存儲(chǔ)原理以及不同數(shù)據(jù)類(lèi)型的存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)后，我們繼續(xù)看如何做性能優(yōu)化。

1. 鍵值對(duì)優(yōu)化

當(dāng)我們執(zhí)行 set key value 的命令，*key指針指向 SDS 字符串保存 key，而 value 的值保存在 *ptr 指針指向的數(shù)據(jù)結(jié)構(gòu)，消耗的內(nèi)存：key value。

第一個(gè)優(yōu)化神技：降低 Redis 內(nèi)存使用的最粗暴的方式就是縮減鍵（key）與值（value）的長(zhǎng)度。

在《Redis 很強(qiáng)，不懂使用規(guī)范就糟蹋了》中我說(shuō)過(guò)關(guān)于鍵值對(duì)的使用規(guī)范，對(duì)于 key 的命名使用「業(yè)務(wù)模塊名:表名:數(shù)據(jù)唯一id」這樣的方式方便定位問(wèn)題。

比如：users:firends:996 表示用戶系統(tǒng)中，id = 996 的朋友信息。我們可以簡(jiǎn)寫(xiě)為：u:fs:996

對(duì)于 key 的優(yōu)化：使用單詞簡(jiǎn)寫(xiě)方式優(yōu)化內(nèi)存占用。

對(duì)于 value 的優(yōu)化那就更多了：

過(guò)濾不必要的數(shù)據(jù)：不要大而全的一股腦將所有信息保存，想辦法去掉一些不必要的屬性，比如緩存登錄用戶的信息，通常只需要存儲(chǔ)昵稱(chēng)、性別、賬號(hào)等。
精簡(jiǎn)數(shù)據(jù)：比如用戶的會(huì)員類(lèi)型：0 表示「屌絲」、1 表示「VIP」、2表示「VVIP」。而不是存儲(chǔ) VIP 這個(gè)字符串。
數(shù)據(jù)壓縮：對(duì)數(shù)據(jù)的內(nèi)容進(jìn)行壓縮，比如使用 GZIP、Snappy。
使用性能好，內(nèi)存占用小的序列化方式。比如 Java 內(nèi)置的序列化不管是速度還是壓縮比都不行，我們可以選擇 protostuff，kryo等方式。如下圖 Java 常見(jiàn)的序列化工具空間壓縮比：序列化工具壓縮比?靚仔們，我們通常使用 json 作為字符串存儲(chǔ)在 Redis，用 json 存儲(chǔ)與二進(jìn)制數(shù)據(jù)存儲(chǔ)有什么優(yōu)缺點(diǎn)呢？json 格式的優(yōu)點(diǎn)：方便調(diào)試和跨語(yǔ)言；缺點(diǎn)是：同樣的數(shù)據(jù)相比字節(jié)數(shù)組占用的空間更大。一定要 json 格式的話，那就先通過(guò)壓縮算法壓縮 json，再把壓縮后的數(shù)據(jù)存入 Redis。比如 GZIP 壓縮后的 json 可降低約 60% 的空間。

2. 小數(shù)據(jù)集合編碼優(yōu)化

key 對(duì)象都是 string 類(lèi)型，value 對(duì)象主要有五種基本數(shù)據(jù)類(lèi)型：String、List、Set、Zset、Hash。

數(shù)據(jù)類(lèi)型與底層數(shù)據(jù)結(jié)構(gòu)的關(guān)系如下所示：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

編碼與數(shù)據(jù)結(jié)構(gòu)

特別說(shuō)明下在最新版（非穩(wěn)定版本，時(shí)間 2022-7-3），ziplist 壓縮列表由 quicklist 代替（3.2 版本引入），而雙向鏈表由 listpack 代替。

另外，同一數(shù)據(jù)類(lèi)型會(huì)根據(jù)鍵的數(shù)量和值的大小也有不同的底層編碼類(lèi)型實(shí)現(xiàn)。

在 Redis 2.2 版本之后，存儲(chǔ)集合數(shù)據(jù)（Hash、List、Set、SortedSet）在滿足某些情況下會(huì)采用內(nèi)存壓縮技術(shù)來(lái)實(shí)現(xiàn)使用更少的內(nèi)存存儲(chǔ)更多的數(shù)據(jù)。

當(dāng)這些集合中的數(shù)據(jù)元素?cái)?shù)量小于某個(gè)值且元素的值占用的字節(jié)大小小于某個(gè)值的時(shí)候，存儲(chǔ)的數(shù)據(jù)會(huì)用非常節(jié)省內(nèi)存的方式進(jìn)行編碼，理論上至少節(jié)省 10 倍以上內(nèi)存（平均節(jié)省 5 倍以上）。

比如 Hash 類(lèi)型里面的數(shù)據(jù)不是很多，雖然哈希表的時(shí)間復(fù)雜度是 O(1)，ziplist 的時(shí)間復(fù)雜度是 O(n)，但是使用 ziplist 保存數(shù)據(jù)的話會(huì)節(jié)省了內(nèi)存，并且在少量數(shù)據(jù)情況下效率并不會(huì)降低很多。

所以我們需要盡可能地控制集合元素?cái)?shù)量和每個(gè)元素的內(nèi)存大小，這樣能充分利用緊湊型編碼減少內(nèi)存占用。

并且，這些編碼對(duì)用戶和 api 是無(wú)感知的，當(dāng)集合數(shù)據(jù)超過(guò)配置文件的配置的最大值， Redis 會(huì)自動(dòng)轉(zhuǎn)成正常編碼。

?

數(shù)據(jù)類(lèi)型對(duì)應(yīng)的編碼規(guī)則如下所示

String 字符串

int：整數(shù)且數(shù)字長(zhǎng)度小于 20，直接保存在 *ptr 中。
embstr：開(kāi)辟一塊連續(xù)分配的內(nèi)存（字符串長(zhǎng)度小于等于 44 字節(jié)）。
raw：動(dòng)態(tài)字符串（大于 44 字節(jié)的字符串，同時(shí)字符串小于 512 MB）。

List 列表

ziplist：元素個(gè)數(shù)小于hash-max-ziplist-entries配置，同時(shí)所有的元素的值大小都小于 hash-max-ziplist-value配置。ziplist
linkedlist：3.0 版本之前當(dāng)列表類(lèi)型無(wú)法滿足 ziplist 的條件時(shí)，Redis會(huì)使用 linkedlist 作為列表的內(nèi)部實(shí)現(xiàn)。
quicklist：Redis 3.2 引入，并作為 List 數(shù)據(jù)類(lèi)型的底層實(shí)現(xiàn)，不再使用雙端鏈表 linkedlist 和 ziplist 實(shí)現(xiàn)。

Set 集合

intset 整數(shù)集合：元素都是整數(shù)，且元素個(gè)數(shù)小于 set-max-intset-entries配置
hashtable 哈希表：集合類(lèi)型無(wú)法滿足intset的條件時(shí)就會(huì)使用hashtable 編碼。

Hash 哈希表

ziplist：元素個(gè)數(shù)小于 hash-max-ziplist-entries配置，同時(shí)任意一個(gè) value 的占用字節(jié)大小都小于hash-max-ziplist-value 。
hashtable：hash 類(lèi)型無(wú)法滿足 intset 的條件時(shí)就會(huì)使用hashtable。

Sorted Set 有序集合

ziplist：元素個(gè)數(shù)小于 zset-max-ziplist-entries 同時(shí)每個(gè)元素的value小于“zset-max-ziplist-value`配置。
skiplist：當(dāng)ziplist條件不滿足時(shí)，有序集合會(huì)使用skiplist作為內(nèi)部實(shí)現(xiàn)。

以下是 Redis redis.conf 配置文件默認(rèn)編碼閾值配置：

hash-max-ziplist-entries 512hash-max-ziplist-value 64zset-max-ziplist-entries 128zset-max-ziplist-value 64set-max-intset-entries 512

下圖是 reidsObject 對(duì)象的 type 和 encoding 對(duì)應(yīng)關(guān)系圖：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

type 與編碼

?

碼哥，為啥對(duì)一種數(shù)據(jù)類(lèi)型實(shí)現(xiàn)多種不同編碼方式？

主要原因是想通過(guò)不同編碼實(shí)現(xiàn)效率和空間的平衡。

比如當(dāng)我們的存儲(chǔ)只有100個(gè)元素的列表，當(dāng)使用雙向鏈表數(shù)據(jù)結(jié)構(gòu)時(shí)，需要維護(hù)大量的內(nèi)部字段。

比如每個(gè)元素需要：前置指針，后置指針，數(shù)據(jù)指針等，造成空間浪費(fèi)。

如果采用連續(xù)內(nèi)存結(jié)構(gòu)的壓縮列表(ziplist)，將會(huì)節(jié)省大量?jī)?nèi)存，而由于數(shù)據(jù)長(zhǎng)度較小，存取操作時(shí)間復(fù)雜度即使為O(n) 性能也相差不大，因?yàn)?n 值小與 O(1) 并明顯差別。

數(shù)據(jù)編碼優(yōu)化技巧

ziplist 存儲(chǔ) list 時(shí)每個(gè)元素會(huì)作為一個(gè) entry，存儲(chǔ) hash 時(shí) key 和 value 會(huì)作為相鄰的兩個(gè) entry。

存儲(chǔ) zset 時(shí) member 和 score 會(huì)作為相鄰的兩個(gè)entry，當(dāng)不滿足上述條件時(shí)，ziplist 會(huì)升級(jí)為 linkedlist, hashtable 或 skiplist 編碼。

由于目前大部分Redis運(yùn)行的版本都是在3.2以上，所以 List 類(lèi)型的編碼都是quicklist。

quicklist 是 ziplist 和 linkedlist 的混合體，它將 linkedlist 按段切分，每一段使用 ziplist 來(lái)緊湊存儲(chǔ)，多個(gè) ziplist 之間使用雙向指針串接起來(lái)。

考慮了綜合平衡空間碎片和讀寫(xiě)性能兩個(gè)維度所以使用了新編碼 quicklist。

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

ziplist 的不足

每次修改都可能觸發(fā) realloc 和 memcopy, 可能導(dǎo)致連鎖更新(數(shù)據(jù)可能需要挪動(dòng))。

因此修改操作的效率較低，在 ziplist 的元素很多時(shí)這個(gè)問(wèn)題更加突出。

優(yōu)化手段：

key 盡量控制在 44 字節(jié)以內(nèi)，走 embstr 編碼。
集合類(lèi)型的 value 對(duì)象的元素個(gè)數(shù)不要太多太大，充分利用 ziplist 編碼實(shí)現(xiàn)內(nèi)存壓縮。

3. 對(duì)象共享池

整數(shù)我們經(jīng)常在工作中使用，Redis 在啟動(dòng)的時(shí)候默認(rèn)生成一個(gè) 0 ~9999 的整數(shù)對(duì)象共享池用于對(duì)象復(fù)用，減少內(nèi)存占用。

比如執(zhí)行set 碼哥 18; set 吳彥祖 18; key 等于「碼哥」和「吳彥祖」的 value 都指向同一個(gè)對(duì)象。

如果 value 可以使用整數(shù)表示的話盡可能使用整數(shù)，這樣即使大量鍵值對(duì)的 value 大量保存了 0~9999 范圍內(nèi)的整數(shù)，在實(shí)例中，其實(shí)只有一份數(shù)據(jù)。

靚仔們，有兩個(gè)大坑需要注意，它會(huì)導(dǎo)致對(duì)象共享池失效。

Redis 中設(shè)置了 maxmemory 限制最大內(nèi)存占用大小且啟用了 LRU 策略（allkeys-lru 或 volatile-lru 策略）。?碼哥，為啥呀？因?yàn)?LRU 需要記錄每個(gè)鍵值對(duì)的訪問(wèn)時(shí)間，都共享一個(gè)整數(shù) 對(duì)象，LRU 策略就無(wú)法進(jìn)行統(tǒng)計(jì)了。
集合類(lèi)型的編碼采用 ziplist 編碼，并且集合內(nèi)容是整數(shù)，也不能共享一個(gè)整數(shù)對(duì)象。?這又是為啥呢？使用了 ziplist 緊湊型內(nèi)存結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)，判斷整數(shù)對(duì)象是否共享的效率很低。

4.使用 Bit 比特位或 byte 級(jí)別操作

比如在一些「二值狀態(tài)統(tǒng)計(jì)」的場(chǎng)景下使用 Bitmap 實(shí)現(xiàn)，對(duì)于網(wǎng)頁(yè) UV 使用 HyperLogLog 來(lái)實(shí)現(xiàn)，大大減少內(nèi)存占用。

?

碼哥，什么是二值狀態(tài)統(tǒng)計(jì)呀？

也就是集合中的元素的值只有 0 和 1 兩種，在簽到打卡和用戶是否登陸的場(chǎng)景中，只需記錄簽到(1)或未簽到(0)，已登錄(1)或未登陸(0)。

假如我們?cè)谂袛嘤脩羰欠竦顷懙膱?chǎng)景中使用 Redis 的 String 類(lèi)型實(shí)現(xiàn)（key -> userId，value -> 0 表示下線，1 – 登陸），假如存儲(chǔ) 100 萬(wàn)個(gè)用戶的登陸狀態(tài)，如果以字符串的形式存儲(chǔ)，就需要存儲(chǔ) 100 萬(wàn)個(gè)字符串，內(nèi)存開(kāi)銷(xiāo)太大。

String 類(lèi)型除了記錄實(shí)際數(shù)據(jù)以外，還需要額外的內(nèi)存記錄數(shù)據(jù)長(zhǎng)度、空間使用等信息。

Bitmap 的底層數(shù)據(jù)結(jié)構(gòu)用的是 String 類(lèi)型的 SDS 數(shù)據(jù)結(jié)構(gòu)來(lái)保存位數(shù)組，Redis 把每個(gè)字節(jié)數(shù)組的 8 個(gè) bit 位利用起來(lái)，每個(gè) bit 位表示一個(gè)元素的二值狀態(tài)（不是 0 就是 1）。

可以將 Bitmap 看成是一個(gè) bit 為單位的數(shù)組，數(shù)組的每個(gè)單元只能存儲(chǔ) 0 或者 1，數(shù)組的下標(biāo)在 Bitmap 中叫做 offset 偏移量。

為了直觀展示，我們可以理解成 buf 數(shù)組的每個(gè)字節(jié)用一行表示，每一行有 8 個(gè) bit 位，8 個(gè)格子分別表示這個(gè)字節(jié)中的 8 個(gè) bit 位，如下圖所示：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

8 個(gè) bit 組成一個(gè) Byte，所以 Bitmap 會(huì)極大地節(jié)省存儲(chǔ)空間。 這就是 Bitmap 的優(yōu)勢(shì)。

關(guān)于 Bitmap 的詳細(xì)解答，大家可移步 -> 《Redis 實(shí)戰(zhàn)篇：巧用 Bitmap 實(shí)現(xiàn)億級(jí)數(shù)據(jù)統(tǒng)計(jì)》。

5. 妙用 Hash 類(lèi)型優(yōu)化

盡可能把數(shù)據(jù)抽象到一個(gè)哈希表里。

比如說(shuō)系統(tǒng)中有一個(gè)用戶對(duì)象，我們不需要為一個(gè)用戶的昵稱(chēng)、姓名、郵箱、地址等單獨(dú)設(shè)置一個(gè) key，而是將這個(gè)信息存放在一個(gè)哈希表里。

如下所示：

hset users:深圳:999 姓名碼哥hset users:深圳:999 年齡 18hset users:深圳:999 愛(ài)好女

?

為啥使用 String 類(lèi)型，為每個(gè)屬性設(shè)置一個(gè) key 會(huì)占用大量?jī)?nèi)存呢？

因?yàn)?Redis 的數(shù)據(jù)類(lèi)型有很多，不同數(shù)據(jù)類(lèi)型都有些相同的元數(shù)據(jù)要記錄（比如最后一次訪問(wèn)的時(shí)間、被引用的次數(shù)等）。

所以，Redis 會(huì)用一個(gè) RedisObject 結(jié)構(gòu)體來(lái)統(tǒng)一記錄這些元數(shù)據(jù)，用 *prt 指針指向?qū)嶋H數(shù)據(jù)。

當(dāng)我們?yōu)槊總€(gè)屬性都創(chuàng)建 key，就會(huì)創(chuàng)建大量的 redisObejct 對(duì)象占用內(nèi)存。

如下所示 redisObject 內(nèi)存占用：

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

redisObejct

用 Hash 類(lèi)型的話，每個(gè)用戶只需要設(shè)置一個(gè) key。

6. 內(nèi)存碎片優(yōu)化

Redis 釋放的內(nèi)存空間可能并不是連續(xù)的，這些不連續(xù)的內(nèi)存空間很有可能處于一種閑置的狀態(tài)。

雖然有空閑空間，Redis 卻無(wú)法用來(lái)保存數(shù)據(jù)，不僅會(huì)減少 Redis 能夠?qū)嶋H保存的數(shù)據(jù)量，還會(huì)降低 Redis 運(yùn)行機(jī)器的成本回報(bào)率。

比如， Redis 存儲(chǔ)一個(gè)整形數(shù)字集合需要一塊占用 32 字節(jié)的連續(xù)內(nèi)存空間，當(dāng)前雖然有 64 字節(jié)的空閑，但是他們都是不連續(xù)的，導(dǎo)致無(wú)法保存。

?

內(nèi)存碎片是如何形成呢？

兩個(gè)層面原因?qū)е拢?/span>

操作系統(tǒng)內(nèi)存分配機(jī)制：內(nèi)存分配策略決定了無(wú)法做到按需分配。因?yàn)榉峙淦魇前凑展潭ù笮?lái)分配內(nèi)存。
鍵值對(duì)被修改和刪除，從而導(dǎo)致內(nèi)存空間的擴(kuò)容和釋放。

碎片優(yōu)化可以降低內(nèi)存使用率，提高訪問(wèn)效率，在4.0以下版本，我們只能使用重啟恢復(fù)：重啟加載 RDB 或者通過(guò)高可用主從切換實(shí)現(xiàn)數(shù)據(jù)的重新加載減少碎片。

在4.0以上版本，Redis提供了自動(dòng)和手動(dòng)的碎片整理功能，原理大致是把數(shù)據(jù)拷貝到新的內(nèi)存空間，然后把老的空間釋放掉，這個(gè)是有一定的性能損耗的。

因?yàn)?Redis 是單線程，在數(shù)據(jù)拷貝時(shí)，Redis 只能等著，這就導(dǎo)致 Redis 無(wú)法處理請(qǐng)求，性能就會(huì)降低。

手動(dòng)整理碎片

執(zhí)行 memory purge命令即可。

自動(dòng)整理內(nèi)存碎片

使用 config set activedefrag yes 指令或者在 redis.conf 配置 activedefrag yes 將 activedefrag 配置成 yes 表示啟動(dòng)自動(dòng)清理功能。

這個(gè)配置還不夠，至于啥時(shí)候清理還需要看下面的兩個(gè)配置：

active-defrag-ignore-bytes 200mb：內(nèi)存碎片的大小達(dá)到 200MB，開(kāi)始清理。
active-defrag-threshold-lower 6：表示內(nèi)存碎片空間占操作系統(tǒng)分配給 Redis 的總空間比例達(dá)到 6% 時(shí)，開(kāi)始清理。

只有滿足這兩個(gè)條件， Redis 才會(huì)執(zhí)行內(nèi)存碎片自動(dòng)清理。

除此之外，Redis 為了防止清理碎片對(duì) Redis 正常處理指令造成影響，有兩個(gè)參數(shù)用于控制清理操作占用 CPU 的時(shí)間比例上下限。

active-defrag-cycle-min 15：自動(dòng)清理過(guò)程所用 CPU 時(shí)間的比例不低于 15%，保證清理能有效展開(kāi)。
active-defrag-cycle-max 50：表示自動(dòng)清理過(guò)程所用 CPU 時(shí)間的比例不能大于 50%，一旦超過(guò)，就停止清理，從而避免在清理時(shí)，大量的內(nèi)存拷貝阻塞 Redis執(zhí)行命令。

7. 使用 32 位的 Redis

使用32位的redis，對(duì)于每一個(gè)key,將使用更少的內(nèi)存，因?yàn)?2位程序，指針占用的字節(jié)數(shù)更少。

但是32的Redis整個(gè)實(shí)例使用的內(nèi)存將被限制在4G以下。我們可以通過(guò) cluster 模式將多個(gè)小內(nèi)存節(jié)點(diǎn)構(gòu)成一個(gè)集群，從而保存更多的數(shù)據(jù)。

另外小內(nèi)存的節(jié)點(diǎn) fork 生成 rdb 的速度也更快。

RDB和AOF文件是不區(qū)分32位和64位的（包括字節(jié)順序）,所以你可以使用64位的Redis 恢復(fù)32位的RDB備份文件，相反亦然。

參考文獻(xiàn)

[1]https://redis.io/docs/reference/optimization/memory-optimization/

[2]《Redis 核心技術(shù)與實(shí)戰(zhàn)》

[3] https://segmentfault.com/a/1190000041771534

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）

Redis 如何存儲(chǔ)鍵值對(duì)

1. 鍵值對(duì)優(yōu)化

2. 小數(shù)據(jù)集合編碼優(yōu)化

String 字符串

List 列表

Set 集合

Hash 哈希表

Sorted Set 有序集合

數(shù)據(jù)編碼優(yōu)化技巧

ziplist 的不足

3. 對(duì)象共享池

4.使用 Bit 比特位或 byte 級(jí)別操作

5. 妙用 Hash 類(lèi)型優(yōu)化

6. 內(nèi)存碎片優(yōu)化

手動(dòng)整理碎片

自動(dòng)整理內(nèi)存碎片

7. 使用 32 位的 Redis

相關(guān)新聞

Redis 內(nèi)存優(yōu)化神技，小內(nèi)存保存大數(shù)據(jù)（redis 如何做內(nèi)存優(yōu)化-）