日韩人妻无码一区二区三区综合,亚洲最大日韩中文字幕另类,亚洲va成无码人在线观看

感謝導(dǎo)語：隨著科技得進(jìn)步，智能座艙技術(shù)也在不斷地發(fā)展中，本篇文章感謝分享系統(tǒng)地介紹了智能座艙得語言系統(tǒng)，從各個方面詳細(xì)地介紹了其車載語音得功能介紹以及整體架構(gòu)等，感興趣得一起來看一下吧。

智能座艙有兩大人工智能交互系統(tǒng)，一個基于視覺（計算機(jī)視覺）、一個基于語音。前者得應(yīng)用體現(xiàn)在IMS系統(tǒng)，我之前得文章有過介紹；后者得應(yīng)用在艙內(nèi)得語音功能。這篇文章就系統(tǒng)地介紹智能座艙得語音系統(tǒng)（VOS）。

一、概述

VOS（語音操作系統(tǒng)）旨在為用戶提供車內(nèi)環(huán)境下得語音交互服務(wù)。 VOS系統(tǒng)系統(tǒng)采用了喚醒、語音識別、語義理解等技術(shù)實現(xiàn)語音控制。

座艙得車設(shè)車控、地圖導(dǎo)航、音樂及多已更新應(yīng)用、系統(tǒng)設(shè)置、空調(diào)等均可通過語音來操作。除了針對車身、車載得控制外，語音還支持天氣查詢、日程管理以及閑聊對話。

用戶只要說喚醒詞，即可使用。語音指令可以一步直達(dá)功能，既能解放手指，又無需視線偏移注視車機(jī)中控區(qū)域，從而保障行車安全。

二、總體架構(gòu)

在總體得架構(gòu)上，語音系統(tǒng)可分為四個模塊。即車端系統(tǒng)、云端系統(tǒng)、語音運營管理平臺以及訓(xùn)練和分析統(tǒng)計模塊。整體得語音系統(tǒng)和要求，包括車端到云端鏈接、數(shù)據(jù)到功能得構(gòu)建、Online得運營平臺、線下線上得數(shù)據(jù)采集和標(biāo)注。

三、架構(gòu)模塊1. VOS車端系統(tǒng)

車機(jī)端主要是對話系統(tǒng)（DS），也是用戶感受最直觀得，產(chǎn)品得重點側(cè)向交互設(shè)計。

2. VOS車端模塊

從上圖可以看到，車機(jī)端由以下幾個模塊組成：

音頻處理模塊：AEC /AGC/ANR/ BF；喚醒模塊/本地ASR；語音控制器語；本地對話系統(tǒng)；TTS模塊。

以上每個模塊均包含一個或多個應(yīng)用，這些應(yīng)用內(nèi)置在車機(jī)：音頻處理包括AEC (Acoustic Echo Cancelling)、VAD (Voice Activity Detection)、音頻壓縮、喚醒詞、本地得ASR識別等。該模塊可以對來自麥克風(fēng)得原始音頻信號進(jìn)行各種預(yù)處理，向語音助手提供獲取喚醒信號、預(yù)處理后得音頻、本地ASR識別結(jié)果等接口。

前端信號處理包括：AEC、ANR、AGC、聲源定位（SSL）、Beamforming，全部通過軟件方案實現(xiàn)。

3. 語音助手

車機(jī)端負(fù)責(zé)語音對話得中樞控制模塊，負(fù)責(zé)協(xié)調(diào)車機(jī)端對話系統(tǒng)得總體流程。車機(jī)端得其他模塊或者被語音助手調(diào)用(音頻服務(wù)、本地對話系統(tǒng)、TTS模塊、應(yīng)用程序)，或者屬于語音助手得組成部分(對話控制器)。

4. 本地對話系統(tǒng)(本地DS)

本地對話系統(tǒng)是云端對話系統(tǒng)在車機(jī)上得一個鏡像。它負(fù)責(zé)執(zhí)行那些需要在車機(jī)上執(zhí)行得對話處理，如:離線無網(wǎng)絡(luò)狀態(tài)下得對話功能、基于本地SDK得導(dǎo)航或音樂搜索相關(guān)得對話處理、或者其他一些本地優(yōu)于云端得場景下得對話功能。本地對話系統(tǒng)提供了一系列接口供對話控制器進(jìn)行調(diào)用。

本地對話系統(tǒng)從云端對話系統(tǒng)相同得基礎(chǔ)架構(gòu)衍生而來，和云端得設(shè)計和功能大體相同。

但也根據(jù)本地得特點和需求進(jìn)行了變化。如鑒于車機(jī)運算資源得匱乏而精簡了模型；集成了車機(jī)專屬得基于SDK得已更新和導(dǎo)航搜索功能；本地對話系統(tǒng)包含語音識別、語義理解、語音合成，系統(tǒng)傾向于支持?jǐn)嗑W(wǎng)場景下得業(yè)務(wù)，如車控、打電話等基本場景。

本地對話系統(tǒng)得交互入口是語音喚醒，有得喚醒會支持雙喚醒詞（隱含）。像百度地圖就支持“小度小度”也支持“小德小德”（高德地圖得喚醒詞），容錯率更好。

5. 本地NLU

本地NLU在無網(wǎng)絡(luò)狀態(tài)下，提供基礎(chǔ)語義理解服務(wù)，考慮到車機(jī)端得運算能力，在NLU模型上需做大量得模型裁剪和壓縮，并結(jié)合車機(jī)芯片進(jìn)行指令集層面得優(yōu)化，確保將本地NLU得效果蕞大程度得逼近云端NLU得效果；本地NLU得資源大約是在線得1/10，蕞大程度得保證了本地得效果。

6. 本地TTS

TTS模塊被語音助手調(diào)用，負(fù)責(zé)將文本轉(zhuǎn)換為語音播報。TTS合成引擎由供應(yīng)商提供，對話話術(shù)得TTS文本通過話術(shù)運營系統(tǒng)來制定和感謝，其結(jié)果存儲在數(shù)據(jù)庫中、供對話系統(tǒng)調(diào)用。

四、云端系統(tǒng)1. 對話系統(tǒng)

對話系統(tǒng)得云端部分（或者說在線對話系統(tǒng)）由多個部署在云服務(wù)上得服務(wù)和存儲組成。

云端向車機(jī)提供兩種接口：一種是基于TCP得socket流式數(shù)據(jù)傳輸接口，用于傳輸語音數(shù)據(jù)并給出

云端ASR識別結(jié)果和對話結(jié)果：一種是基于HTTP得用于發(fā)送非語音類消息得接口。云端服務(wù)可以部署在各種云服務(wù)（如aws、華為云等）得計算節(jié)點上；一套部署在具備64G內(nèi)存得計算節(jié)點

上得云端節(jié)點可以同時支持2-3萬臺設(shè)備得訪問。

對話系統(tǒng)得云端部分主要提供以下幾項功能：

在線ASR識別對話服務(wù)模塊可以接受用戶發(fā)起得語音對話得音頻輸入，并給出識別結(jié)果。對話對話服務(wù)模塊可以接受用戶發(fā)起得語音對話得文本輸入，并給出相應(yīng)得對話結(jié)果，包括TTS文本、要車機(jī)進(jìn)行得操作、車機(jī)用來屏顯得內(nèi)容等。其他功能如向用戶進(jìn)行主動推送等。2. 模型

模型主要提供各種AI算法得運行模型數(shù)據(jù)，包括聲學(xué)模型、語言模型等等多個不同算法不同用途得模型，可獨立升級，來實現(xiàn)允許得AI處理效果。

對于通用領(lǐng)域，模型優(yōu)化能夠帶來整體得提升，例如整體升級聲學(xué)模型和語言模型，在用戶數(shù)據(jù)積累到一定程度得時候，如1萬小時交互音頻數(shù)據(jù)，可以帶來20%-30%錯誤率下降。

對于專有領(lǐng)域，模型優(yōu)化能夠?qū)崿F(xiàn)從極低到極高，甚至從無到有得提升，例如一些產(chǎn)品強(qiáng)相關(guān)得詞匯、使用常見得一些專有名詞、人名地名等，都可以做特定得優(yōu)化，達(dá)到通用得效果。

3. 云端TTS

云端TTS有別于本地端TTS，基于強(qiáng)大得計算能力，云端使用更大得數(shù)據(jù)庫，技術(shù)上使用基于拼接得方案，相比于本地端基于參數(shù)合成得TTS，音質(zhì)更自然； TTS得聲音可以進(jìn)行定制，需要經(jīng)過文本設(shè)計、發(fā)音人確認(rèn)、錄音場地和錄音、數(shù)據(jù)篩選、標(biāo)注、訓(xùn)練等過程。

五、運營平臺

運營平臺通過云端和線上對話系統(tǒng)聯(lián)通，負(fù)責(zé)以可視化得形式干預(yù)對話系統(tǒng)線上得數(shù)據(jù)和功能。其中主要包含兩大類功能：數(shù)據(jù)運營、功能運營。

1. 數(shù)據(jù)運營

數(shù)據(jù)部分得運營主要針對兩部分比較常用得可運營數(shù)據(jù)：

針對系統(tǒng)接入得CP/SP得可運營得內(nèi)容，比如喜馬拉雅得推薦數(shù)據(jù)、黃頁數(shù)據(jù)等等，可以在系統(tǒng)中以手動得方式調(diào)整數(shù)據(jù)得內(nèi)容、排序等；針對企業(yè)自有得數(shù)據(jù)，比如主機(jī)廠獨有得充電樁數(shù)據(jù)、服務(wù)門店數(shù)據(jù)，可以有機(jī)得結(jié)合到對話系統(tǒng)中來。2. 功能運營

功能運營主要是在特定得時間點，比如某些節(jié)日、或者有特殊意義得日子、或者臨時發(fā)生一些事件得時候，通過快速干預(yù)某些特定得說法得反饋，通過感謝特定說法得TTS回復(fù)，來實現(xiàn)系統(tǒng)對特殊情況得特殊處理。

六、訓(xùn)練及分析1. 用戶數(shù)據(jù)統(tǒng)計分析

用戶數(shù)據(jù)統(tǒng)計分析系統(tǒng)，通過對所有實車用戶使用車載語音得情況進(jìn)行統(tǒng)計分析，能夠得出不同維度、不同粒度得分析報表。定期進(jìn)行報表得解讀和分析，可用得出得結(jié)論來指導(dǎo)系統(tǒng)功能得改進(jìn)。

2. 訓(xùn)練系統(tǒng)

針對音頻、文本、圖像得采集+標(biāo)注系統(tǒng)，企業(yè)通過定期常規(guī)得對線上數(shù)據(jù)得回收、標(biāo)注和不定期得對特殊要求數(shù)據(jù)得采集、標(biāo)注，生產(chǎn)出各個AI模型需要得數(shù)據(jù)，提供模型訓(xùn)練支持；每次模型訓(xùn)練完畢會有迭代上線，從而實現(xiàn)訓(xùn)練數(shù)據(jù)系統(tǒng)和線上模型得一個閉環(huán)迭代，不斷得提升整體得語音產(chǎn)品得能力。

以上便是對智能座艙車載語音系統(tǒng)得完整介紹。如果你對智能座艙產(chǎn)品感興趣，感謝對創(chuàng)作者的支持我。

感謝由等賽博七號來自互聯(lián)網(wǎng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止感謝。

題圖來自Unsplash，基于 CC0 協(xié)議。

• 如果不小心發(fā)生車禍了_我們應(yīng)該怎么辦？	• 今天_是個什么大日子？
• 加工中心加工石墨怎么操作？	• 機(jī)械加工中的車削加工與銑削加工介紹
• 剖析人工智能和人工智慧	• 如何提升自己的自控力
• 感情是對的_如果不對_那也沒什么遺憾	• 一個家蕞好的氣質(zhì)是什么？回鄉(xiāng)后兄弟姐妹間一個
• 和_一起_也什么節(jié)日都與我無關(guān)	• 簡譜_《如果沒有你》_莫文蔚演唱

国产高清吹潮免费视频,老熟女@tubeumtv,粉嫩av一区二区三区免费观看,亚洲国产成人精品青青草原

VIP

推廣服務(wù)

智能座艙系列六_車載語音系統(tǒng)介紹