WEKA 與 Oracle Cloud Infrastructure 證實長上下文人工智能推論可令吞吐量提升 10 倍

WEKA 與 Oracle Cloud Infrastructure 證實長上下文人工智能推論可令吞吐量提升 10 倍

在 OCI H100 基礎設施上進行的聯合基準測試顯示,在不增加圖形處理器的情況下,並發用戶數目提升 10 倍,Token 吞吐量提高 10 倍,Token 服務量增加 7 倍

加州坎貝爾2026年6月10日 /美通社/ — 人工智能 (AI) 數據與記憶體基礎設施公司 WEKA 今日發佈生產規模的基準測試,結果顯示機構在相同圖形處理器 (GPU) 佔用空間下,可服務更多用戶及 Token,從而提升長上下文人工智能推論的經濟效益。 基準測試表明,於 Oracle Cloud Infrastructure (OCI) 上使用配備 Augmented Memory Grid™ (增強記憶體網格) 的 WEKA NeuralMesh™ 平台,在不增加基礎設施的情況下,相比純動態隨機存取記憶體 (DRAM) 配置,能服務多 10 倍的並發用戶、提供高 10 倍的 Token 吞吐量,並讓每個圖形處理器多產生 7 倍 Token。 上述結果經由一個配備 100,000 Token 上下文窗口的 9 節點 OCI 裸機 H100 集群驗證屬實。

WEKA 與 Oracle Cloud Infrastructure 證實長上下文人工智能推論可令吞吐量提升 10 倍

Oracle Cloud Infrastructure 軟件開發高級總監 Pablo Selem 說:「企業人工智能工作負載正將上下文窗口及圖形處理器使用率推向新極限。 這些基準測試顯示,在 OCI 上配備 Augmented Memory Grid 的 WEKA NeuralMesh 平台如何幫助消除記憶體瓶頸,使客戶無需單純增加更多圖形處理器,也能支援規模更大、要求更高的推論工作負載。」

改變推論經濟效益的三項成果
該成果在裸機 H100 集群(9 個節點、72 個圖形處理器、100,000 個 Token 上下文窗口、數以千計並發用戶)上經過生產規模驗證,OCI 上配備 Augmented Memory Grid 的 NeuralMesh 交出以下成績:

  • 無需增加基礎設施,服務的並發用戶數提升 10 倍。配備 Augmented Memory Grid 的 NeuralMesh 可擴展至超過 5,000 名並發用戶,反觀純動態隨機存取記憶體配置僅能容納約 600 名。 此做法將活躍快取工作集從 8.64 TiB 動態隨機存取記憶體擴大到 287 TiB 可用非揮發性記憶體表達 (NVMe),從而避免快取飽和時出現的性能急劇下降。 此外,每個圖形處理器能服務更多用戶,代表相同投資可發揮更大價值。
  • Token 吞吐量高出 10 倍。 集群中的每個圖形處理器都能輸出更多結果。在 OCI 上,配備 Augmented Memory Grid 的 NeuralMesh 每秒可處理約 200 萬 Token,而純動態隨機存取記憶體基準配置每秒處理不到 200,000 Token。 對於運行實時人工智能功能,包括搜尋、摘要、程式碼輔助及多輪代理的產品團隊,吞吐量直接決定最多能服務多少用戶、功能回應有多快,以及基礎設施能支撐多少收入。
  • Token 服務量激增 7 倍。 大規模運行時,每個 Token 的成本得以降低。在一個涉及 2,400 名用戶的 1 小時測試中,配備 Augmented Memory Grid 的 NeuralMesh 處理了 50 億 Token,而純動態隨機存取記憶體基準配置只處理了 7 億 Token。 對運行代理型工作流程的機構來說,動態隨機存取記憶體飽和會因持續重複運算而耗盡圖形處理器效能,直接影響每個 Token 的成本及投資回報率 (ROI)。

WEKA 行政總裁 Liran Zvibel 表示:「推論瓶頸在於圖形處理器能使用多少有效記憶體。 這些結果證明,人工智能 Token 的經濟效益問題無法單靠硬件解決,而是必須消除記憶體牆,這才是真正限制現有硬件能力的瓶頸。 在 OCI 上運行配備 Augmented Memory Grid 的 NeuralMesh,能以極具成本效益的方式,為客戶呈獻幾何級數增長的 Token 產能。」

運用上下文記憶體基礎設施,改變人工智能經濟效益
隨著推論需求增長,人工智能基礎架構的低效率問題會不斷加劇。 每次鍵值 (KV) 快取被逐出都會帶來代價:消耗圖形處理器週期、增加延遲、影響用戶體驗,以及提高每個所服務 Token 的成本。 對於輸入動輒達 100,000 Token 或以上的長上下文及代理型工作負載而言,這筆代價絕非無關痛癢的誤差。 這直接撼動每個運行生產級人工智能的機構之單位經濟模型。

Augmented Memory Grid 作為 NeuralMesh 的一項功能,從架構層面解決問題,把鍵值快取與本地圖形處理器記憶體分離,並儲存在一個可供整個集群存取的高效能 Token 倉庫中。 任何主機都能在不影響快取命中率的情況下服務任何工作階段,擺脫了僵化工作階段黏性束縛,同時提供比動態隨機存取記憶體更優越的效能,改善負載平衡,且隨著並發數增加而實現流暢的橫向擴展。 最終帶來人工智能代理所需的持久上下文記憶體,並掌握成本槓桿,令長上下文推論得以在經濟可行的前提下實現大規模運作。

生產級實證
OCI 已於 2026 年 5 月 13 日,在其人工智能與數據科學網誌 (AI & Data Science blog) 上刊載了完整的基準測試方法、系統配置及結果。 這些在 9 節點 OCI 裸機 H100 集群上進行的基準測試,超越了前一階段的驗證結果。前一階段證明了鍵值快取容量增加 1,000 倍,而在 128,000 Token 下,達到首個 Token 的時間縮短高達 20 倍。 這最新階段測試了生產環境中推論的全面經濟效益,包括並發密度、持續吞吐量、快取持久性,以及在高負載下需求突增時的服務水平目標 (SLO) 穩定性。

登陸 Oracle Marketplace
配備 Augmented Memory Grid 的 NeuralMesh 現已全面供應給 WEKA 客戶,並已在Oracle Marketplace上架,OCI 為 WEKA 的獨家雲端發佈合作夥伴。 在 OCI 上運行長上下文推論的機構,現可部署一套既經認證亦可即時投產的架構。 如欲了解更多關於 OCI 及 WEKA Augmented Memory Grid 基準測試的資訊,請參閱 OCI 網誌:https://blogs.oracle.com/ai-and-datascience/scaling-long-context-inference-on-oci-with-wekas-augmented-memory-grid

關於 WEKA
WEKA 是專注於人工智能數據與記憶體基礎設施的公司,正在革新代理型人工智能的經濟效益。 NeuralMesh™ 平台融合高效能數據儲存與擴充的圖形處理器記憶體,為企業、人工智能雲端服務商及人工智能建構者提供統一基礎,以應對訓練、推論及代理型工作負載。 透過 Augmented Memory Grid,NeuralMesh 能把圖形處理器記憶體容量擴展 1,000 倍,將達到首個 Token 的時間縮短高達 20 倍,並在相同圖形處理器佔用空間下服務多 10 倍的並發用戶,這些結果已在生產基準測試中得到證實。 WEKA 深受《財富》50 強 (Fortune 50) 中三成企業的信賴,能幫助機構加快人工智能的規模化部署、提升圖形處理器的使用效率,並降低每服務一個 Token 所帶來的成本。 歡迎瀏覽 www.weka.io 以了解更多,亦可於 LinkedInX 上關注我們。

WEKA 及 W 標誌為 WekaIO, Inc. 的註冊商標。本文中出現的其他商業名稱,可能為其各自擁有者的商標。

你可能也想看

凌科藥業合作夥伴Formation Bio完成CNS滲透性TYK2抑制劑BLKR201 (原研發代號LNK01006) I期臨床試驗首例受試者給藥

杭州、上海和波士頓2026年6月10日 /美通社/ -- 凌科藥業(浙江)股份有限公司(以下簡稱「凌科藥業」),一家處於臨床階段、專注於自身免疫與炎症性疾病的創新藥研發公司,今日宣佈其全球合作夥伴Formation Bio在臨床開發方面取得了重大進展。 AI原生製藥公司Formation Bio表示,已在一項評估BLKR201(凌科藥業原研發代號:LNK01006)的Ⅰ期首次人體臨床試驗(BLKR201-101-HV)中完成首例受試者給藥。該研究是一項在健康受試者中進行的單次劑量遞增(SAD)和多次劑量遞增(MAD)試驗,預計將於2027年初獲得數據。 BLKR201 /...

華為發佈教育及醫療夥伴聯盟2.0—-「蒲公英計劃」,構建行業合作共贏新生態

中國深圳2026年6月9日 /美通社/ -- 以「數匯教醫,智啟新程」為主題的2026全球教育醫療合作夥伴中國周成功舉辦,來自40多個國家500餘位教育醫療領域的客戶和合作夥伴參會。會上,華為發佈全球教育及醫療夥伴聯盟2.0——「蒲公英計劃」,旨在更緊密地聯接全球教育醫療行業夥伴,共建高質量、可持續發展的行業生態。 ...

抗精神分裂症新藥呫諾美林曲司氯銨膠囊(凱捷樂®)上市,正式惠及國內患者

中國上海和美國馬薩諸塞州劍橋2026年6月9日 /美通社/ -- 再鼎醫藥有限公司(納斯達克股票代碼:ZLAB;香港聯交所股份代號:9688)今日宣佈,公司首個神經領域產品呫諾美林曲司氯銨膠囊(凱捷樂®)在蘇州發貨,並向全國多個省市的醫院和院外藥房供藥。當天,該藥在首都醫科大學附屬北京安定醫院開出全國首張處方,並於同日惠及全國30餘個城市、近50家醫院的精神分裂症患者。 蘇州工業園區黨工委副書記、管委會主任盧淵等園區領導出席了商業首發儀式。蘇州工業園區黨工委委員、管委會副主任倪乾表示,「再鼎醫藥是園區生物醫藥產業蓬勃發展的重要見證者和參與者,包括呫諾美林曲司氯銨膠囊在內的10個創新產品已在中國獲批上市,展現出強勁的發展韌性和創新實力。我們將一如既往地支持包括再鼎醫藥在內的廣大企業,深耕園區、做大做強,以更優的營商環境、更實的產業政策、更貼心的親商服務,助力企業專注創新、安心發展。」 精神分裂症是一種慢性且常導致殘疾的精神疾病,我國約有800萬成人精神分裂症患者。該病的核心症狀包括陽性症狀(如幻覺和妄想)、陰性症狀(如動機和愉悅感缺失以及社交退縮)和認知症狀(如記憶、注意力和決策方面的缺陷)。 再鼎醫藥運營合夥人王軼喆博士表示,「精神分裂症對患者的影響遠不止直觀症狀,更核心的困境在於社會功能受損。呫諾美林曲司氯銨膠囊填補了臨床治療的空白,讓患者有機會回歸生活、重返社會。這款創新藥的上市也積極響應了國家精神衛生建設的號召,為破解治療困境注入了新動力。」 再鼎醫藥自2015年落戶蘇州工業園區以來,已在這片沃土上深耕十年。蘇州一路見證了再鼎腫瘤、免疫、感染性疾病、神經科學等多個疾病領域的數個產品在中國的上市落地,從這裡走出的產品切實幫助到眾多患者和家庭。 再鼎醫藥全球研發首席運營官閻水忠博士表示,「蘇州是再鼎醫藥全球化佈局中唯一一個集中了生產、研發和商業化的城市。今天首發的呫諾美林曲司氯銨膠囊,是我們扎根蘇州、協同創新的最新見證。我們將繼續依托蘇州園區的產業優勢,加速更多創新藥從實驗室走向生產線、從園區走向全國患者,不斷以實際行動助力園區打造世界一流的生物醫藥產業創新高地。」...

熱門新聞

112年度職業訓練成果展示活動暨就業博覽會   桃園風禾公園登場

記者張辰卿/桃園報導桃園市政府勞動局(21)日於桃園風禾公園舉辦「112年度職業訓練成果展示活動暨就業博覽會」,職訓成果會場展示職業訓練班學員豐碩成果,讓民眾就近瞭解多元職業訓練機會,桃園市長張善政親臨會場表揚職業訓練績優訓練單位。    ▲市長張善政至攤位體驗視障按摩 。( 圖/ 桃園市政府勞動局提供) 張善政表示,提升勞工技能並促進市民就業,一直是桃市府重要施政目標,桃園「有頭鹿」職能訓練場每年辦理失業者職業訓練、照顧服務員訓練班及產訓班次合計50班次以上,提供至少1,600個訓練名額,也結合勞動部職訓資源,並輔導學員習得技能後都能順利進入職場,訓後就業率達8成,搭配每年辦理超過200場徵才活動,112年就業媒合率達86.6%,更榮獲111年勞動部對地方政府勞動行政業務督導考核第1名殊榮。桃市府尤其注重青年職能及就業培力,針對設籍桃市未滿30歲青年持續推動「青年安薪讚 就業大滿貫」方案,透過穩定青年工作、進修、考照之獎勵機制,輔導桃市青年持續提升就業競爭力及穩定就業。為了提供市民朋友們優質的職業訓練環境,並達到更好的訓練效果,特別針對111年承辦失業者及照顧服務員職前訓練之職訓單位進行評鑑考核,並於今112年度職業訓練成果展示進行績優辦訓單位頒獎。  ▲就業博覽會參展單位協助民眾求職 。( 圖/ 桃園市政府勞動局提供) 活動現場展示職訓班豐富訓練成果,包含時尚剪髮體驗、道地美食小吃品嚐、肩頸按摩及指甲彩繪等多元互動體驗;並與勞動部勞動力發展署桃竹苗分署合作展示「創業市集」專區,邀請10家優質新創企業主展出微型創業成果,讓蒞臨現場的民眾體驗獨特創意小物及特色商品,推廣桃園在地文化特色及新創團隊;另現場提供重機具體驗、DIY手作活動一系列趣味闖關及摸彩活動,內容精采豐富。 ▲張善政偕貴賓大合影。( 圖/...

經濟部2023台灣市博會   傳市品牌.好市好食-中秋採買都在這

記者張辰卿/台中報導「經濟部2023台灣市博會-中區場」今9/9日在臺中驛鐵道文化園區熱烈登場,此場次共精選出全臺41家各具特色的傳統市場及夜市攤商以美食帶路,其中設立了中秋主題專區,包括榮獲經濟部五星樂活名攤臺中市逢甲夜市隔水加熱串燒即食「激旨焼き鳥」、新北市五股市場五星樂活名攤高品質肉品專賣「荳牛肉鋪」、臺中市第三市場百年歷史餅店「三廣商行」等中秋相關美食共計8攤,而除了中秋必買的節慶攤位外,現場更有來自全臺北、中、南、東的傳統市場及夜市美食攤商,一次逛足,吃得滿足。 經濟部陳怡鈴主任秘書表示,疫情這三年來市場攤商及廣大消費民眾的健康與安全對經濟部來說責無旁貸,所以在市場及夜市推動包含環境定期清消、食品遮罩與餐具高溫清洗機等輔導補助,就是為了消費者可以買得安心、吃得放心。 ▲ 經濟部陳怡鈴主任秘書(右)出席活動,觀摩現場展售攤位。(圖/經濟部中部辦公室提供) 此外,在疫情過後的現在,陳怡鈴主任秘書提到王美花部長非常重視我們的傳統市場及夜市,許多觀光客一下飛機就直奔傳統市場及夜市,部長要求市場及夜市除了保持乾淨以外,同時經濟部也精進作法,將美學導入我們的市集攤位改造,讓市場及夜市一年比一年進步、一年比一年更賺錢,並且希望除了攤商老闆之外,地方政府與鄉親朋友都能共同努力,不只為了在地,也為了吸引觀光客,讓大家來到傳統市場及夜市遊逛消費後,拋開過去傳統市場湯湯水水、滿地泥濘的舊印象,有更舒服舒適的安全消費環境。 陳怡鈴主任秘書進一步說明提到,此次活動現場除了有傳統市場及夜市展區與政策宣導區外,還有中秋主題PK專區,邀集了從串燒、魚丸、糕餅等中秋必吃,喜愛傳統市場的民眾不要錯過,歡迎帶著一家大小來臺中車站遊逛。 民眾如果想要知道更多「2023台灣市博會-傳市品牌·好市好食」活動資訊,可隨時上「台灣市集gogo購」粉絲團查詢了解!(https://www.facebook.com/NMgo.tw/)。(經濟部中部辦公室廣告)

保經新勢力攀越高峰 業績逆勢成長300%

生活中心/綜合報導 2022年壽險業保費收入2兆3344億元,較前年衰退近2成,創10年新低,成軍4年的呈祥保經業績卻逆勢成長3倍,異軍突起。總裁胡志誠分享治軍祕訣,指呈祥為同仁提供很好的創業平台,更重視專業素養,堅守從業人員規範,進而能提供符合國人需求的優質保險規畫,博得信任。 呈祥保經4周年前夕在高雄萬豪酒店舉辦呈祥盃暨高峰競賽頒獎典禮及春酒晚宴,席開百桌與全台12事業部逾千人同樂,另表揚績優人員,將「舞台」留給共同打拚的事業夥伴,也斥資數百萬獎勵績優者入住日本京都琵琶湖溫泉飯店及環球影城五星飯店,體驗尊榮。 呈祥保經於2019年5月創立,半年內成立7個事業部,首年佣金突破1億,近3年無畏疫情及政經情勢夾擊,營收一步跳升至3億多,團隊逾千人,戰力可觀。 「去年壽險業慘澹,呈祥仍逆勢成長」,總裁胡志誠在年會以攀登聖母峰的心情勉勵夥伴一步一腳印,堅定前行,厚德載物,穩紮穩打。 他說,論資歷,呈祥仍在幼兒園階段,但最大特色是培訓素人且自創各職級教材,堅持複製而不控制,訓練是最高的投資報酬率,「因為舞台是為傑出員工而設,不是經營者」;「品牌是由內而外,領導就要帶頭服務,我若不能感動員工,他們就無法感動客戶」。 為彰顯核心價值及願景,胡志誠提2個5年計畫,6個品牌建立步驟,誓建立優質保經文化。一路走來他懷抱使命用心經營,創造差異化,強調病態及投機絕不是呈祥選項,只有獲得同仁、客戶及保險公司的信任與認同,才能受人敬重。 ▲胡志誠總裁及黃奕綱副董與各事業部領導人一同感謝各大保險公司與會、支持與愛護。(圖/呈祥保經提供) 以專業為首務的呈祥保經吸聚不少青年世代,副董事長黃奕綱即是典範,他24歲由廣告業轉戰壽險業,3年晉升通訊處經理,創下紀錄,2019年與胡志誠共同創設呈祥保經,如今是接班首選,並開啟呈祥傳賢計劃,奠立專業治理、永續經營的模式。 呈祥創始之初僅140人,現擴增至近1,300人,成長10倍,以25歲到30歲青年世代居多。內部不斷精進系統化訓練,導入AI優化作業。黃奕綱說,呈祥搭建一個優質的創業平台,以專業、專注、利他為事業拓展心法,激勵大家從個人卓越邁向組織卓越,精實壯大,實現創業夢想。 ▲邀請創作歌手蕭秉治表演。(圖/呈祥保經提供)  

2023營養師節 35位營養師快閃新竹

新竹振道/記者 萬世璉/新竹報導 2/22號是營養師節,新竹市營養師公會邀集35位營養師在新竹火車站前進行快閃活動,身穿粉紅色上衣的營養師們,以我的餐盤-6口訣編排舞蹈動作,希望以簡單易懂的方式宣導民眾健康飲食。 民眾一般到醫院就診的前後,都需要和營養師配合飲食調整,透過營養師節的快閃,也是讓大家認識「營養師」這角色的重要性。 當天活動以「食健康 食營養 營養師予你身體更佳勇」為主題,利用簡單易懂的口訣快閃新竹市區。

最愛老牌手搖飲店 網友選這家!

生活中心/綜合報導 台灣是手搖飲王國,品牌超過數百家,光飲料店門市就有近三萬家,比便利商店還多,有網友在Dcard發文詢問,最愛的屹立不搖老牌手搖有哪些?網友票選出最喜歡的還是CP值超高、創立三十年的南霸天「茶之魔手」! 網友發文表示,「一堆沒聽過的手搖一家家開,明明手搖店已經夠多了,新開的還是不少,而且價格真的一間比一間高,想到國小時候雞排+珍奶只要五十元就想哭…但話說回來,撇開新開的飲料店,還是有很多老牌飲料店老神在在,想知道各位有沒有偏愛的老牌飲料店咧?」 網友票選出最喜歡的老牌手搖飲店,是創立三十年的南霸天「茶之魔手」。(翻攝自網路) 文章引來近百位網友回覆,其中50嵐、清心、迷客夏都有不少擁護者,但被推薦最多的則是茶之魔手,雖然前陣子抵不過成本上升壓力,取消多年的凍漲政策微調五元,一度讓消費者傳出不滿聲浪,但價格比起其他品牌還是便宜許多,許多北部網友更敲碗寫道「拜託茶魔來北部開店,台北人快窮死了」、「茶之魔手超在,去年還整個凍漲真的服」、「羨慕中南部的人多了茶魔可以選,省下不少飲料費」、「真的要選一家的話,茶魔的茶是喝過最解渴不膩的」、「魔手價格控到現在真的還是非常實惠」。 「茶之魔手」是台灣第二大、擁有五百間門市的手搖飲品牌,在南部飲料市場更擁有廣大鐵粉,在台南的分店密集度更有如超商!而從去年財政部統計資料來看,全國飲料店數創下歷史新高,達二點二萬家店,但品牌的汰換速度也相當快,許多爆紅的手搖飲店可能瞬間就退燒,或是讓加盟主血本無歸,消費者在有眾多選擇之下,手搖品牌的生存難度也同步增加。