當前位置：首頁 > 新聞資訊 > 人工智能應用 > 多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數(shù)調用或結構化輸出連接后端系統(tǒng)

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數(shù)調用或結構化輸出連接后端系統(tǒng)

來源：聲網(wǎng)研究院編輯：創(chuàng)澤時間：2025/11/21 主題：其他 [加盟]

對話式 AI 的核心職責是聽懂人類講話的內容和情感，并以語音對話的方式作出回應，然后重復這個循環(huán)。

當前，幾乎所有的J聯(lián)對話式 AI 產(chǎn)品都普遍采用相似的架構：對話式 AI Agent 服務部署于云端，協(xié)調端到端語音對話（Speech-to-Speech）的交互閉環(huán)，整體采用 RTC 技術實現(xiàn)超低延遲雙全工人機對話。支持行業(yè)主流 AI 模型接入，并通過 LLM 函數(shù)調用或結構化輸出連接后端系統(tǒng)。

整個循環(huán)流程如下：

◇ 用戶設備麥克風捕獲語音信號，編碼后經(jīng)實時傳輸網(wǎng)絡傳輸至云端代理程序

◇ 將用戶語音實時轉換（ASR）為高準確率的文字，作為 LLM 的輸入

◇ 文本被整合為上下文提示（Prompt），由大語言模型（LLM）進行推理生成響應。

◇ LLM 生成的文本發(fā)送至文本轉語音（TTS）模型合成音頻

◇ 合成音頻通過實時傳輸網(wǎng)絡傳回用戶設備完成交互

對話式 AI 的整個服務全部在云端運行，包括 ASR、LLM 和 TTS。從長遠來看，人們期望有更多的 AI 服務可以在端側運行，但云端仍是未來很長一段時間的Z佳方案。

◇ 對話式 AI 程序需調用高性能模型（ASR、LLM、TTS）以實現(xiàn)低延遲的復雜流程。當前終端設備算力不足，無法在可接受延遲內運行Z優(yōu)模型。

◇ 當前，仍有大量商用場景用戶是需要通過電話進行呼叫的，在此類場景中，服務無法部署到用戶的終端設備上，也迫使服務集中于云端。

◇ 對話式 AI 需要跨終端使用，也導致云端部署成為Z高效的方案。

如果你正在開發(fā)一個對話式 AI 產(chǎn)品或應用，你可能已經(jīng)發(fā)現(xiàn)對話式 AI 并沒有想象中的簡單，我們會面臨并思考以下問題：

◇ 對話式 AI 該選擇哪些大語言模型和 TTS？

◇ 如何降低人機對話的端到端延遲？

◇ 如何讓 AI 對話與人類一樣自然？

◇ 如何在長會話中管理對話上下文？

◇ 如何將對話式 AI 集成到現(xiàn)有應用中？

◇ 如何評估對話式 AI 的性能表現(xiàn)？

老年人陪伴機器人關注的重點：表達能力＞理解能力

聲音和表達方式是否溫暖、自然、有情感,且語速、音量是否適合老年用戶 ,能夠理解老人的話語及隱含情感,交互的流暢舒適比絕對速度更重要

2025對話式AI發(fā)展白皮書-技術模塊,產(chǎn)品方案及生態(tài),對話體驗質量評估方法,應用實踐落地等發(fā)展現(xiàn)狀與未來趨勢

系統(tǒng)地梳理了對話式 AI 的發(fā)展現(xiàn)狀與未來趨勢,為行業(yè)打造了一本可落地的實踐指南,開啟了人與 AI 互動的新紀元，硬件、教育、社交等各個領域的應用場景也隨之而來加速裂變

AI工具深度測評與選型指南V1-5大類別 - 39個AI工具 - 92個實例測評

文本生成與處理類AI工具測評：代碼生成,文案創(chuàng)作,長文摘要,專業(yè)問答等核心能力;圖像生成與編輯類AI工具測評：語音合成質量,音色調節(jié),視頻生成效果等

2025基于DeepSeek的詳細規(guī)劃智能管控體系創(chuàng)新與實踐-智能助手‌ 編制‌ 審查‌ 管理‌

基于AI知識庫的嵌入式集成應用,實現(xiàn)全場景業(yè)務需求的準確響應;智能識別審查標準,形成標準化的審查知識庫,提高審查效率;智能選址,規(guī)劃條件生成、低效用地篩查等高效推進城市發(fā)展落地的應用

以DeepSeek為代表的AI在能源行業(yè)的應用前景預測-精準預測風光發(fā)電功率,實時監(jiān)測與故障診斷

精準預測風光發(fā)電功率（如某省電網(wǎng)棄光率從19%降至3.2%，預測精度達94.7%）;省間新能源交易電量1711億千瓦時（+22.5%）;零售市場用戶達114.9萬家，售電公司5229家

DeepSeek驅動下的地圖生成-構建地圖智能體實現(xiàn)自動化制圖,虛實融合場景生成

利用LLM工具（如DeepSeek、ChatGPT）構建地圖智能體，集成知識圖譜與數(shù)據(jù)工具，實現(xiàn)自動化制圖;結合GAN/GCN生成符合制圖規(guī)則的地圖,賦能智慧城市、游戲娛樂等新興領域

DeepSeek核心技術白話解讀-學習策略創(chuàng)新，模型結構創(chuàng)新，五段位進階指南

萬億Token訓練時間壓縮至3.7天;動態(tài)8位浮點量化提升訓練速度30%;優(yōu)化計算效率與負載均衡，突破傳統(tǒng)Transformer限制;文生圖/圖生文任務中仍需提升生成準確性

DeepSeek應用場景梳理-理論+實踐的結合，智能化轉型的實戰(zhàn)指導手冊

通過理論+實踐的結合，展現(xiàn)了DeepSeek作為新一代AI技術在產(chǎn)業(yè)升級和個人效能提升中的關鍵作用，是智能化轉型的實戰(zhàn)指導手冊

DeepSeek等大模型工具使用手冊-實戰(zhàn)篇:文本類,圖片類,語音類,視頻類應用實踐,在輔助編程中的應用

如何通過DeepSeek進行文本生成、文檔處理等操作;介紹圖片類AIGC的定義和應用場景;視頻類AIGC應用實踐列舉國內外代表性的視頻類AIGC大模型

疾控工作者應該怎么利用DeepSeek等Al大模型-輿情監(jiān)測預警智能體、疫情預測與傳播模擬智能體等

疾控領域包括輿情監(jiān)測預警智能體、疫情預測與傳播模擬智能體等;具體場景包括醫(yī)防協(xié)同信息通‌ 監(jiān)測分析‌ 預警預測‌ 風險評估‌ 流行病學調查‌ 應急處置‌ 免疫規(guī)劃‌ 監(jiān)督執(zhí)法‌

從DeepSeek爆火看2025年AI的發(fā)展-具備邏輯推理能力,重新定義算法優(yōu)化邊界

一是神經(jīng)符號系統(tǒng)融合，或讓 AI 具備邏輯推理能力;二是量子計算實用化，或重新定義算法優(yōu)化邊界;AI 領域快速變革,推動 AI 技術更好發(fā)展

內蒙古DeepSeek模型地方政府部署進展

實現(xiàn)城市大腦與DeepSeek大語言模型的初步集成;與“根數(shù)據(jù)庫”應用平臺實現(xiàn)互聯(lián)互通;本地化私有部署DeepSeek-R1模型，推動其與12345熱線結合

五月av在线|一区二区三区日韩|婷婷在线观看视频|国产精品黄网站,最近的2019中文字幕国语在线,亚洲GV猛男GV无码男同短文,国产成人AV一区二区三区在线观看

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數(shù)調用或結構化輸出連接后端系統(tǒng)

老年人陪伴機器人關注的重點：表達能力＞理解能力

2025對話式AI發(fā)展白皮書-技術模塊,產(chǎn)品方案及生態(tài),對話體驗質量評估方法,應用實踐落地等發(fā)展現(xiàn)狀與未來趨勢

AI工具深度測評與選型指南V1-5大類別 - 39個AI工具 - 92個實例測評

2025基于DeepSeek的詳細規(guī)劃智能管控體系創(chuàng)新與實踐-智能助手‌ 編制‌ 審查‌ 管理‌

以DeepSeek為代表的AI在能源行業(yè)的應用前景預測-精準預測風光發(fā)電功率,實時監(jiān)測與故障診斷

DeepSeek驅動下的地圖生成-構建地圖智能體實現(xiàn)自動化制圖,虛實融合場景生成

DeepSeek核心技術白話解讀-學習策略創(chuàng)新，模型結構創(chuàng)新，五段位進階指南

DeepSeek應用場景梳理-理論+實踐的結合，智能化轉型的實戰(zhàn)指導手冊

DeepSeek等大模型工具使用手冊-實戰(zhàn)篇:文本類,圖片類,語音類,視頻類應用實踐,在輔助編程中的應用

疾控工作者應該怎么利用DeepSeek等Al大模型-輿情監(jiān)測預警智能體、疫情預測與傳播模擬智能體等

從DeepSeek爆火看2025年AI的發(fā)展-具備邏輯推理能力,重新定義算法優(yōu)化邊界

內蒙古DeepSeek模型地方政府部署進展

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人底盤

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數(shù)調用或結構化輸 出連接后端系統(tǒng)

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人底盤

多輪對話的基本原理：采用 RTC 技術低延遲雙全工人機對話,LLM 函數(shù)調用或結構化輸出連接后端系統(tǒng)

服務機器人(迎賓、講解、導診...)