全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智慧操作新時代

北京2025年10月6日 /美通社/ — 2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。

近日，中國企業級大模型與資料智慧企業——明略科技推出的專有GUI大模型 Mano在行業公認的Mind2Web和OSWorld兩大基準測試中，均取得了創紀錄的SOTA成績。透過線上強化學習和訓練資料自動採集兩大核心創新，Mano為GUI智慧體領域提供了一套可擴充套件、可持續進化的新正規化。

Mano在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model評測中取得SOTA。

榜單連結：https://os-world.github.io/
技術報告連結：https://www.mininglamp.com/news/6394/

關鍵突破：

1．Mind2Web：Mind2Web覆蓋137個網站、2350+真實任務，旨在考察智慧體能否在複雜多變的DOM結構裡精準找到目標元素，並完成整個操作鏈。Mano展示出「看得準、做得成」的核心優勢。

技術報告顯示，Mano的元素精度 (Ele.Acc）和步驟成功率（Step SR）指標遙遙領先，在準確識別、定位介面元素，以及成功執行多步任務能力上達到新高度。Mano的操作F1 (Op.F1) 指標與此前頂尖模型持平甚至略高，能夠真正將複雜任務轉化為成功的操作序列。

2. OSWorld-Verified：更難的挑戰來自桌面端。OSWorld-Verified涵蓋了369個跨應用任務，覆蓋10類應用，包含瀏覽器，辦公軟體等多個型別，每一個操作都和真實桌面場景無縫對接。

技術報告顯示，在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model 評測中，Mano直接把成功率提升到 41.6±0.7%，超過qwen、GUI-Owl、opencua等模型。

技術創新：

亮點一：首次提出「線上強化學習」

自DeepSeek橫空出世以來，GRPO已經成為強化學習黃金正規化。現有的模型訓練大多侷限在離線強化學習的範疇，深度依賴事先收集好的資料集。但在GUI互動智慧體領域，任何操作都與真實的系統互動環境密切相關。

因此，Mano在GUI互動領域首次提出「線上強化學習」的訓練正規化，並推出訓練資料自動採集的「探索器」，讓智慧體時刻依賴最新資料進行學習，並在「嘗試新的行動以獲取資訊」和「基於已有知識採取最優行動」之間取得平衡。

為了在真實的互動環境中不斷強化以提高適應性和靈活性，明略科技建立了一個模擬環境池，包括瀏覽器環境（BUA）和桌面環境（CUA），讓模型在真實互動中採集更多樣化的環境資料，彌補了離線軌跡分佈稀疏的侷限性，最終在多樣化的Web GUI場景中展現出更強的魯棒性。

同時，採用線上取樣 + 離線過濾的創新方式：先收集軌跡，再過濾噪聲資料，動態調節任務難度分佈，有效避免了因失敗軌跡導致學習效率低下的問題。

消融實驗結果顯示，加入線上強化學習後，模型在OSWorld-Verified資料集的平均分數產生了質的飛躍，相比離線強化學習的模型結果提升了 7.9，達到 41.6。

亮點二：智慧探索，採集真實環境軌跡

儘管大模型能夠理解籠統的指令，但在多步驟操作的目標驅動型任務中，往往無法將大目標分解為具體的執行步驟。因此，研發人員需要為互動任務構建專用的模型和智慧體。在這一過程中，海量的高質量互動軌跡資料不可或缺。過去，這類資料往往需要人工構建或標注，成本高、耗時長。對此，明略科技設計了訓練資料自動採集的方法，從根本上提升了資料收集的效率和準確性，這正是Mano的第二大創新。

明略科技搭建了一個可擴充套件的虛擬環境叢集，用於模擬多種互動場景。針對每個目標應用，大模型自動生成目標清單，並對目標進行優先順序排序，過濾掉使用頻率極低的功能，為後續探索提供明確的上下文指導。

元素提取方面，明略科技為網頁環境定製了Chrome外掛「Mano-C」，全面提取網頁中的互動元素，捕捉其空間坐標與語義屬性。針對桌面環境，技術團隊則採用A11y Tree解析與 OmniParseV2協同過濾的方法，確保覆蓋更多互動元素。

資料標注方面，明略科技利用大模型為每個提取的元素生成語義標籤、功能描述，以及互動類別，形成結構化的語義對齊資料，為後續訓練提供有效監督。

為了提升資料採集的智慧程度，技術團隊設計了基於Prompt的探索模組，用於智慧選擇互動元素，並引入顯式約束，避免路徑迴圈和冗餘分支。在探索過程中，採用深度優先搜尋（DFS）策略，系統會擷取截圖並儲存帶註釋的互動資料。完成探索後，透過軌跡評估機制，篩選出高質量的互動序列。整個過程不斷迴圈，每一步都會檢查是否達到最大探索深度。

Mano的SOTA表現，得益於明略科技多年來在大模型領域的積累。2024年，明略科技的超圖多模態大語言模型（HMLLM）和Video-SME資料集在腦電圖、眼動等非標模態資料處理領域取得顯著突破，榮獲ACM MM 2024最佳論文提名。2025年，明略科技推出企業級商業資料分析可信智慧體DeepMiner，Mano作為DeepMiner的自動化執行引擎，讓智慧體真正學會了「看」與「點」，在複雜的軟體與瀏覽器環境下實現了精細化操作。展望未來，明略科技將進一步最佳化Mano在應用和端側部署能力，加速企業智慧化轉型程序。

⚠️ 重要提醒： 1. 謹防誇大宣傳，避免不實陳述。2. 重視資料安全和隱私保護，確保資料收集、處理和使用符合相關法律法規要求。3. 注意技術倫理，避免不當模仿人類能力。4. 關注廣告法規，避免違反廣告法的相關規定。

未經審計的財務資料顯示：總資產4400萬美元，淨資產2490萬美元新加坡2026年2月10日 /美通社/ — 全球領先的按需用工解決方案及綜合設施管理（IFM）服務提供商YY Group Holding Limited （NASDAQ：YYGH，以下簡稱「YY Group」或「該公司」）今天宣佈，截至2025年6月30日，公司未經審計的總資產約為4400萬美元，摺合每股普通股約1.11美元；淨資產約為2490萬美元，摺合每股普通股約0.63美元。上述資料為公司截至2025年6月30日期間期末結賬流程中形成的初步財務估計結果。在該報告期內，YY Group持續推進其增長戰略，透過戰略性收購進一步拓展綜合設施管理服務組合，並在酒店與設施服務相關的靈活用工市場中擴大營運版圖。上述估計資料尚未經公司獨立註冊會計師事務所審閱或審計，未來可能因常規結賬調整及審閱程式而發生變化。公司披露該等資訊，旨在在經歷一輪戰略性擴張後，為投資者提供關於其財務狀況與資本實力的更高透明度。這些指標體現了公司在全球範圍內拓展綜合服務生態系統的同時，始終致力於保持穩健資產負債表的經營理念。 YY Group Holding Limited行政總裁Mike Fu表示：「披露公司總資產規模及每股淨資產價值，有助於股東更加清晰地瞭解公司的基本面實力。這些資料充分體現了我們在持續擴大業務規模、為股東創造長期價值過程中所建立的穩健財務基礎。」關於YY Group…

相關文章