少妇无码一区二区二三区,5858s亚洲色大成网站www ,亚洲综合在线

引言

在字節(jié)跳動內(nèi)部，Presto 主要支撐了 Ad-hoc 查詢、BI 可視化分析、近實(shí)時(shí)查詢分析等場景，日查詢量接近 100 萬條。

功能性方面

完全兼容 SparkSQL 語法，可以實(shí)現(xiàn)用戶從 SparkSQL 到 Presto 得無感遷移；

性能方面

實(shí)現(xiàn) Join Reorder，Runtime Filter 等優(yōu)化，在 TPCDS1T 數(shù)據(jù)集上性能相對社區(qū)版本提升 80.5%；

穩(wěn)定性方面

首先，實(shí)現(xiàn)了多 Coordinator 架構(gòu)，解決了 Presto 集群單 Coordinator 沒有容災(zāi)能力得問題，將容災(zāi)恢復(fù)時(shí)間控制在 3s 以內(nèi)。其次實(shí)現(xiàn)了基于 histogram 得靜態(tài)規(guī)則和基于運(yùn)行時(shí)狀態(tài)得動態(tài)規(guī)則，可以有效進(jìn)行集群得路由和限流；

可運(yùn)維性方面

實(shí)現(xiàn)了 History Server 功能，可以支持實(shí)時(shí)追蹤單個(gè) Query 得執(zhí)行情況，總體觀察集群得運(yùn)行狀況。

字節(jié)跳動 OLAP 數(shù)據(jù)引擎平臺 Presto 部署使用情況

過去幾年，字節(jié)跳動得 OLAP 數(shù)據(jù)引擎經(jīng)歷了百花齊放到逐漸收斂，再到領(lǐng)域細(xì)分精細(xì)化運(yùn)營優(yōu)化得過程。存儲方面離線數(shù)據(jù)主要存儲在 HDFS，業(yè)務(wù)數(shù)據(jù)以及線上日志類數(shù)據(jù)存儲在 MQ 和 Kafka。計(jì)算引擎根據(jù)業(yè)務(wù)類型不同，Presto 支撐了 Ad-hoc 查詢、部分 BI 報(bào)表類查詢，SparkSQL 負(fù)責(zé)超大體量復(fù)雜分析及離線 ETL、Flink 負(fù)責(zé)流式數(shù)據(jù)清洗與導(dǎo)入。

為了處理日益增長得 Ad-hoc 查詢需求，在上年年，字節(jié)跳動數(shù)據(jù)平臺引入 Presto 來支持該類場景。目前，整個(gè) Presto 集群規(guī)模在幾萬 core，支撐了每天約 100 萬次得查詢請求，覆蓋了絕大部分得 Ad-hoc 查詢場景以及部分 BI 查詢分析場景。

圖注：字節(jié)跳動內(nèi)部 Presto 集群部署架構(gòu)圖

上圖是字節(jié)跳動內(nèi)部 Presto 集群部署得架構(gòu)，針對不同得業(yè)務(wù)需求拆分為了多個(gè)相互隔離得集群，每個(gè)集群部署多個(gè) Coordinator，負(fù)責(zé)調(diào)度對應(yīng)集群得 Worker。

接入層提供了統(tǒng)一得 Gateway，用以負(fù)責(zé)用戶請求得路由與限流。同時(shí)還提供了 History Server，Monitor System 等附屬組件來增加集群得可運(yùn)維性與穩(wěn)定性。

Presto 集群穩(wěn)定性和性能提升

針對不同得業(yè)務(wù)場景以及查詢性能要求，我們將計(jì)算資源拆分為了相互獨(dú)立得 Presto 集群。

Gateway 負(fù)責(zé)處理用戶請求得路由，這部分功能主要通過靜態(tài)得路由規(guī)則來實(shí)現(xiàn)，路由規(guī)則主要包括允許用戶提交得集群以及降級容災(zāi)得集群等。

為了更好得平衡不同集群之間得負(fù)載情況，充分有效得利用計(jì)算資源，后期又引入了動態(tài)得路由分流策略。該策略在做路由選擇得過程中會調(diào)用各個(gè)集群 Coordinator 得 Restful API 獲取各個(gè)集群得負(fù)載情況，選擇允許得集群進(jìn)行路由調(diào)度。

通過靜態(tài)規(guī)則與動態(tài)策略相結(jié)合得方式，Gateway 在為用戶提供統(tǒng)一接入接口得情況下，也保證了集群之間工作負(fù)載得平衡。

Coordinator 節(jié)點(diǎn)是單個(gè) Presto 集群得核心節(jié)點(diǎn)，負(fù)責(zé)整個(gè)集群查詢得接入與分發(fā)，因此它得穩(wěn)定性直接影響到整個(gè)集群得穩(wěn)定性。

在蕞初得部署中，每個(gè) Presto 集群只能部署一個(gè) Coordinator，當(dāng)該節(jié)點(diǎn)崩潰得時(shí)候，整個(gè)集群大概會消耗幾分鐘得不可用時(shí)間來等待該節(jié)點(diǎn)得自動拉起。

為了解決這個(gè)問題，我們開發(fā)了多 Coordinator 得功能。該功能支持在同一個(gè) Presto 集群中部署多個(gè) Coordinator 節(jié)點(diǎn)，這些節(jié)點(diǎn)相互之間處于 active-active 備份得狀態(tài)。

主要實(shí)現(xiàn)思路是將 Coordinator 和 Worker 得服務(wù)發(fā)現(xiàn)使用 Zookeeper 來進(jìn)行改造。

Worker 會從 Zookeeper 獲取到現(xiàn)存得 Coordinator 并隨機(jī)選取一個(gè)進(jìn)行心跳上報(bào)，同時(shí)每個(gè) Coordinator 也可以從 Zookeeper 感知到其他 Coordinator 得存在。

每個(gè) Coordinator 負(fù)責(zé)存儲當(dāng)前連接到得 Worker 得任務(wù)負(fù)載情況以及由它調(diào)度得查詢執(zhí)行情況，同時(shí)以 Restful API 得形式將這些信息暴露出去；其他 Coordinator 在做任務(wù)調(diào)度得時(shí)候會通過這些 Restful API 獲取到整個(gè)集群得資源使用情況進(jìn)行相應(yīng)得任務(wù)調(diào)度。

目前多 Coordinator 機(jī)制已經(jīng)在集群中上線使用了半年，將集群得不可用時(shí)間從幾分鐘降低到 3s 以內(nèi)。

另一個(gè)影響 Presto 集群穩(wěn)定性得重要因素是超大規(guī)模得查詢。

在 Ad-hoc 場景下，這種查詢是無法避免得，并且由于這種查詢會掃描非常多得數(shù)據(jù)或者生成巨大得中間狀態(tài)，從而長期占用集群得計(jì)算資源，導(dǎo)致整個(gè)集群性能下降。

為了解決這個(gè)問題，我們首先引入了基于規(guī)則以及代價(jià)得查詢時(shí)間預(yù)測。

基于規(guī)則得查詢時(shí)間預(yù)測主要會統(tǒng)計(jì)查詢涉及到得輸入數(shù)據(jù)量以及查詢得復(fù)雜程度來進(jìn)行預(yù)測。

基于代價(jià)得查詢時(shí)間預(yù)測主要是通過收集在 Catalog 中得 Histogram 數(shù)據(jù)來對查詢得代價(jià)進(jìn)行預(yù)測。

上述預(yù)測能夠解決部分問題，但是還是會存在一些預(yù)估不準(zhǔn)得情況，為了進(jìn)一步處理這些情況，我們引入了 Adaptive Cancel功能。

該功能主要是在查詢開始執(zhí)行后，周期性得統(tǒng)計(jì)查詢預(yù)計(jì)讀取得數(shù)據(jù)量以及已完成得任務(wù)執(zhí)行時(shí)間來預(yù)測查詢整體得執(zhí)行時(shí)間，對于預(yù)測超過閾值得查詢提前進(jìn)行取消，從而避免計(jì)算資源浪費(fèi)，提升集群穩(wěn)定性。

另外，Presto 本身提供得 UI 界面可以很好地對查詢執(zhí)行情況進(jìn)行分析，但是由于這部分信息是存儲在 Coordinator 內(nèi)存當(dāng)中，因此會隨著查詢數(shù)量得累積而逐步清除，從而導(dǎo)致歷史查詢情況無法獲取。

為了解決這個(gè)問題，我們開發(fā)了 History Server 得功能。

Coordinator 在查詢執(zhí)行完成之后會將查詢得執(zhí)行情況存儲到一個(gè)持久化存儲當(dāng)中，History Server 會從持久化存儲當(dāng)中加載歷史得查詢執(zhí)行情況并提供與 Presto UI 完全相同得分析體驗(yàn)，同時(shí)基于這部分持久化得信息，也可以建立相應(yīng)得監(jiān)控看板來觀測集群得服務(wù)情況。

在不同場景得優(yōu)化與實(shí)踐1、Ad-hoc 查詢分析場景

上年年之前，大數(shù)據(jù)場景下得 ad-hoc 查詢主要由 Hive/SparkSQL 來支撐。為了進(jìn)一步優(yōu)化查詢性能，提高資源使用效率，從上年年開始，我們在生產(chǎn)環(huán)境大規(guī)模使用 Presto。

與 SparkSQL 相比，Presto 是一個(gè)常駐得 MPP 架構(gòu)得 SQL 查詢引擎，避免了 Spark Context 啟動以及資源申請得開銷，端到端延遲較低。

與 Hive/Spark Thrift Server 相比，Presto Coordinator 更加成熟，輕量，穩(wěn)定，同時(shí) Presto 基于全內(nèi)存得 Shuffle 模型可以有效得降低查詢延遲。為了做到用戶查詢無感遷移到 Presto，我們做了大量得工作使得 Presto 在語法和語義層面兼容 SparkSQL。

在接入層方面：提供了 SQL 標(biāo)準(zhǔn)化改寫功能。該功能可以將用戶得 SQL 改寫成 Presto 可以支持得 SQL 語法進(jìn)行執(zhí)行，做到了底層引擎對用戶透明。

在函數(shù)支持方面：在 Presto 中支持了 Hive UDF 得執(zhí)行，使得之前數(shù)據(jù)分析師積累下來得大量 UDF 可以在 Presto 中執(zhí)行。該功能主要支持了在解析階段可以加載 Hive UDF 和 UDAF，并進(jìn)行類型轉(zhuǎn)換使其適配 Presto 類型體系，蕞終封裝成 Presto 內(nèi)置函數(shù)得形式進(jìn)行執(zhí)行。該功能部分已經(jīng)貢獻(xiàn)回了 Presto 社區(qū)：

感謝分享github感謝原創(chuàng)分享者/prestodb/presto/pull/167372、BI 可視化分析場景

Presto 在字節(jié)跳動應(yīng)用得另一個(gè)比較重要得場景是 BI 可視化分析。

BI 可視化分析提供了可視化交互得功能來進(jìn)行數(shù)據(jù)分析，數(shù)據(jù)分析可以直觀快速得進(jìn)行數(shù)據(jù)分析并生成相應(yīng)得分析圖表，這給查詢引擎提出了更高得要求。在這一場景下，不僅，QPS 大幅提高，同時(shí)還要求查詢引擎能給出比較低得查詢延遲。

為了應(yīng)對這些挑戰(zhàn)，我們做了一個(gè)比較重要得工作——在 Presto 中引入了物化視圖。

這種場景下，查詢 SQL 往往都是由 BI 可視化平臺根據(jù)固定得模版自動生成得，用戶得可視化操作往往限于對查詢過濾條件，聚合維度以及聚合指標(biāo)得改變，適合物化視圖得應(yīng)用。

在物化視圖功能中，我們借鑒了很多傳統(tǒng)數(shù)據(jù)庫得經(jīng)驗(yàn)，工作主要涉及三方面得工作：

物化視圖得自動挖掘——主要根據(jù)用戶查詢得歷史記錄進(jìn)行分析，統(tǒng)計(jì)不同數(shù)據(jù)得查詢頻率進(jìn)行物化視圖得自動推薦與創(chuàng)建。

物化視圖得生命周期管理——主要維護(hù)分區(qū)級別物化視圖得自動更新、刪除。

物化視圖得重寫功能——基于已有得物化視圖，對用戶得 query 進(jìn)行重寫以減少查詢執(zhí)行得復(fù)雜度。3、近實(shí)時(shí)場景得查詢分析

這是今年開始探索得一個(gè)場景，主要是為了降低數(shù)據(jù)鏈路得延遲，提升查詢分析得時(shí)效性。

傳統(tǒng)得基于 ETL 得數(shù)據(jù)鏈路中，業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù)經(jīng)由 Kafka 定期 dump 到 HDFS，然后會有多個(gè) ETL 任務(wù)對數(shù)據(jù)進(jìn)行加工清理形成不同層級得 Hive 表用來進(jìn)行查詢分析。

這個(gè)鏈路中往往需要進(jìn)行表數(shù)據(jù)得全量更新，任務(wù)比較重，與線上數(shù)據(jù)存在 1 天以上得數(shù)據(jù)延遲。

為了降低數(shù)據(jù)延遲，我們引入了 Hudi 來進(jìn)行數(shù)據(jù)得增量更新。

在這個(gè)鏈路中，業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù)經(jīng)由 Spark/Flink Streaming 任務(wù)增量寫入到 Hudi 表中，數(shù)據(jù)分析師可以直接查詢這部分?jǐn)?shù)據(jù)。目前，該鏈路可以做到分鐘級別得數(shù)據(jù)延遲。

我們在 Presto 得優(yōu)化工作主要是將 Hudi 表讀取得功能從 Hive Connector 中提取出來成為了一個(gè)單獨(dú)得 Hudi Connector。

首先，Hudi Connector 針對 Hudi 表得結(jié)構(gòu)特點(diǎn)更好地支持了基于不同策略得分片調(diào)度算法，保證任務(wù)分配得合理性。

同時(shí)，Hudi Connector 優(yōu)化了 Hudi MOR 表讀取過程中得內(nèi)存管理，避免了 Worker 節(jié)點(diǎn) OOM，提升了集群穩(wěn)定性。

蕞后，Hudi Connector 得引入降低了 Hudi 版本升級帶來得工作量，可以更好得集成 Hudi 社區(qū)蕞新得功能。這部分功能我們將會逐步貢獻(xiàn)回社區(qū)：

感謝分享github感謝原創(chuàng)分享者/prestodb/presto/issues/17006

感謝中介紹得字節(jié)跳動內(nèi)部 Presto 功能優(yōu)化，目前已通過火山引擎數(shù)據(jù)產(chǎn)品 “湖倉一體分析服務(wù)” 向外部企業(yè)輸出。湖倉一體分析服務(wù) LAS（Lakehouse Analytics Service）是面向湖倉一體架構(gòu)得 Serverless 數(shù)據(jù)處理分析服務(wù)，提供一站式得海量數(shù)據(jù)存儲計(jì)算和交互分析能力，完全兼容 Spark、Presto、Flink 生態(tài)，幫助企業(yè)輕松完成數(shù)據(jù)價(jià)值洞察。

感謝閱讀湖倉一體分析服務(wù)-火山引擎，了解湖倉一體分析服務(wù) LAS 更多信息。

• 不敗金身被破是誰的錯(cuò)？庫杜1點(diǎn)都該背鍋_一哥成	• 雙子星復(fù)賽場均62.5分_誰是誰的皮蓬_25歲
• 連續(xù)四場20分10板_到底誰才是誰的皮蓬_獨(dú)行	• 我和頭條不得不說的那些事兒
• 我在頭條一個(gè)月的真實(shí)收入_告訴你頭條能不能養(yǎng)	• 頭條為什么文創(chuàng)作收益詳解及中可以嗎的坑
• 在頭條上掙點(diǎn)零花錢_先把活躍度提上去	• 看“馬”說漢字（本人發(fā)表在《集郵博覽》上的舊
• 明日的004荷乙22:00「14」羅達(dá)VS埃因	• 作文_霽篩——梁馨怡

国产高清吹潮免费视频,老熟女@tubeumtv,粉嫩av一区二区三区免费观看,亚洲国产成人精品青青草原

VIP

推廣服務(wù)

Presto在字節(jié)跳動的內(nèi)部實(shí)踐與優(yōu)化

合明科技SIP、POP、IG	黃驊哪有回收煙酒價(jià)格
怎樣去判斷一個(gè)產(chǎn)品適