三期同輝,收官閃耀!基調聽云協辦的“智能觀測進化論”第三期沙龍精彩回顧
2025年開年以來,國產Al DeepSeek、Manus在中國、美國的科技圈受到廣泛關注,成為大模型行業的“黑馬”,DeepSeek 憑借其獨特的技術架構和低成本訓練方案迅速成為行業焦點,全球主流的技術公司紛紛接入DeepSeek模型,這不僅改變了AI大模型的研發格局,也在加速可觀測性技術向更加智能的形態演進。
在此背景下,由中國信通院穩定性保障實驗室主辦、基調聽云協辦的“智能觀測進化論”系列沙龍拉開帷幕,邀請行業資深專家和相關技術負責人就智能可觀測性領域的實踐經驗、發展趨勢、痛點問題進行分享討論,引發業內廣泛關注。
01 前情回顧
“智能觀測進化論”首期于2月28日成功召開,來自中國信通院、基調聽云、華為云、科來網絡的專家進行了分享,基調聽云 AI 負責人韋遠奎分享了《聽云AI落地實踐-Text2NBQL》。上千人線上觀看直播。
(詳情鏈接:
https://mp.weixin.qq.com/s?__biz=MzA5NTkwMzkwNQ==&mid=2650446908&idx=1&sn=e2dc19c36c2761efa0b625330abb5391&chksm=89a4924679b19cd3ffc03c754db11b86fd022c23b39437b349c757b66b078d63eb3b45b70f4e&mpshare=1&scene=1&srcid=0305RyViHOY9RFPmjdZx4L1A&sharer_shareinfo=2c9ddca6f7d00af393472952872906c7&sharer_shareinfo_first=359bb08d5d37a9b66e793950dfa3a27c&version=4.1.6.70203&platform=mac#rd)
“智能觀測進化論”第二期于3月7日召開,來自字節跳動、咪咕視訊、移動云的專家進行了分享,基調聽云 AI 負責人韋遠奎在圓桌環節與各位與會專家展開深入探討,發表聽云觀點。
(詳情鏈接:
https://mp.weixin.qq.com/s?__biz=MzA5NTkwMzkwNQ==&mid=2650446958&idx=1&sn=49070dd853fad0c550b281f18f9667b3&chksm=897ecb4308bf0619b90a4c0d0e71b4f5a20a8f8e08c17ff04067ecd9fa578447bf8d36f27189&mpshare=1&scene=1&srcid=0312atarzdldZmHMKD06CPTd&sharer_shareinfo=25258010df80d8a45053e61a1d06b1d6&sharer_shareinfo_first=834887e9b8d43a4a9c549086b63b662a&version=4.1.6.70203&platform=mac#rd)
02 第三期精彩演講
3月28日,“智能觀測進化論”第三期順利召開,來自中國信通院、基調聽云、阿里云、杭州數列、浪潮通信的可觀測專家進行了分享,基調聽云 AI 負責人韋遠奎發表了《Al Agent 賦能智能運維》主題演講,下面,就讓我們一起來回顧會議精彩內容!
中國信通院云大所云計算部 劉坤 發表了《中國信通院可觀測性標準體系及相關工作介紹》主題演講。介紹了中國信通院在可觀測性領域的標準體系和研究路徑,分析了成功立項的行業標準《云計算系統智能化可觀測性能力成熟度模型》標準內涵,以及2025年中國信通院即將開展的可觀測案例征集等工作的相關規劃。
基調聽云AI負責人 韋遠奎 發表了《Al Agent 賦能智能運維》主題演講。他聚焦大模型與智能運維的深度融合,系統解讀大模型在智能運維場景中的實踐路徑,包括智能助手、異常檢測、告警降噪、根因分析等應用。觀眾將深入了解如何構建大模型驅動的智能運維平臺,掌握自主動態規劃和多智能體協作等關鍵能力,共同探索以大模型技術推動運維智能化升級,助力企業數字化轉型的全面加速。
阿里云可觀測高級產品專家 曹劍 發表了《面向 LLM 應用的端到端可觀測體系探索與實踐》主題演講。阿里云可觀測團隊的產品經理曹劍分享了關于大模型應用端到端的可觀測解決方案,旨在解決AI應用中的性能、可用性、質量和成本問題。主要內容包括全棧監控與全鏈路診斷,以提高推理速度和GPU利用率,并確保模型輸出準確合規。通過Python Agent實現自動化數據采集,支持多種AI框架,提供代碼級剖析能力,幫助快速定位問題。此外,還介紹了如何利用獨立的大模型評估輸入輸出的質量和安全性,以及對token消耗進行多維度分析來控制成本。整體方案覆蓋了從基礎設施到應用層的全面監控和診斷能力,增強了AI服務的穩定性和效率。
杭州數列網絡科技有限責任公司聯合創始人 楊德華 發表了《基于AI Agent的分布式系統性能容量風險發現、原因診斷和優化實踐》主題演講。演講探討了基于AI Agent的分布式系統性能容量風險發現、原因診斷和優化建議的實踐。隨著分布式系統的復雜性和多變性增加,傳統的性能監控和優化方法面臨反饋周期過長、難以精準定位問題等挑戰。為此從業務場景切入,利用AI Agent實時收集和分析系統數據,快速識別風險點,并通過智能算法進行原因診斷,最終給出優化建議,并結合了實際應用場景案例,展示企業在引入AI Agent后,如何顯著縮短問題診斷時間并提升系統性能。
浪潮通信算力運維可觀測平臺產品經理 金鑫 發表了《基于可觀測運維平臺的能力使用與AI輔助根因定位》主題演講。闡述了浪潮在可觀測運維領域的成果,討論如何將傳統的技術運維轉變成業務運維,從業務的視角來看待當前存在系統問題,以及如何基于現有運維指標,實現基于算法和專家規則經驗進行故障根因定位。
03第三期圓桌觀點
【觀點總結】
觀點1:在過去,國內外廠商差距較大,國外廠商在傳統的智能可觀測技術方面積累比較深厚,如專家經驗、知識庫等,但是大模型帶來了一些顛覆性的變革,當基模的能力越來越強,專家知識庫的積累似乎不那么重要了,在新的游戲規則下,國內外都處于探索階段。
觀點2:需要先設計個評價的標準來衡量差距,比如從企業估值或市值方面來看,國內外差距是比較大的,但這個跟國內的商業歷史有關,因此很難比較;從相關上市公司的數量看,國內外差距也比較大。或許我們可以使用“企業在智能可觀測方面一天有效使用的token數”來評價其水平。
觀點3:國內外沒有太大的差距。國內的各類2C業務系統和APP的用戶體量不輸國外,且這些系統沒有出現過太多的問題,這可以說明我們的應用系統建設足夠優秀,我們的運維能力/可觀測能力是不輸國外的。另一方面,對比智能可觀測能力要落到具體的場景和環境上,不同的運維對象所需要的能力不一樣,硬搬一套系統去落實效果不一定好,要考慮運維對象的適配問題。
觀點4:國外在智能化方面體系存在先發優勢,但國內的基模也在快速的發展,在部分方向實現了領先,在智能化可觀測領域,一兩年之后國內外水平會差不多。
【觀點總結】
觀點1:引入運維工具會給運維人員帶來額外的工作量,因此可以考慮多使用自動化、智能化手段簡化用戶學習和操作成本。
觀點2:運維工具對于其創造者是很好落地的,但是創造者所設想的場景和客戶實際的場景可能存在差異,因此在把運維工具推到客戶側的生產系統時,會遇到一系列卡點,要符合客戶側一系列規章制度的同時,還需要向客戶的各個角色證明其價值和收益,因此必須在設計開發階段就好好琢磨用戶實際生產中的落地難點。
觀點3:運維工具對于用戶的上手門檻是一個最難的點。一些運維工具設計比較復雜,有些用戶企業由于技術棧比較封閉,運維人員不能熟練地使用運維工具導致其價值大打折扣。
觀點4:從數據方面來說,在發生故障排查問題時,要想發揮運維工具的價值,就需要全部的服務和組件接入工具,盡量不能存在數據斷點和缺失,一環數據缺失就可能導致運維工具在這次故障排查中作廢,因此要統一數據接入、統一查詢、統一關聯、統一分析。
【觀點總結】
觀點1:可觀測這個生意就像造牛仔褲的生意一樣。任何一個時代都有掘金者,掘金者都需要牛仔褲,都需要相應的工具支持和配套,可觀測APM魔力象限的玩家這么多年幾乎完全更替了一輪,微服務、云原生等每一次變革都帶來了行業新一輪洗牌,推理應用出現之后,我們需要立刻思考怎么做它的觀測,怎么保障它的可用性。
觀點2:可觀測會從傳統的以資源、應用性能為中心的方式向數據安全、可解釋性、端到端全鏈路追蹤的方式轉變。
觀點3:最直觀的是在交互形式上變化,用戶可以直接從對話框輸入問題來進行交互和分析問題。
【觀點總結】
觀點1:從業務角度來說,AI無法完全代替人,但AI的融入是必然,我們需要有AI意識。
觀點2:人要做價值的導向者、創新的推動者、AI的監督者,人需要提高使用AI的能力和批判性思維的能力。
觀點3:與AI合作,如同人類開車一樣,在具體場景中,人要設定好一個目標,并把控AI向著目標前進,同時人要為AI做出的選擇和動作承擔責任。
觀點4:這個問題落到運維領域來說,AI最終會將運維人員武裝成007電影中的Q博士,每個人都會成為超級開發者和運維者。
當下,數字技術的浪潮奔涌不息,行業發展瞬息萬變,作為可觀測性與應用安全領域的領導者,基調聽云憑借敏銳的技術洞察力,積極擁抱前沿科技,將 AI 大模型與可觀測性技術深度融合。未來,基調聽云將充分發揮自身的技術優勢與行業影響力,引領可觀測性與應用安全行業邁向新的高度,為客戶的業務穩定運行提供堅實保障,共創行業發展的美好未來。